数学建模论文关于葡萄酒评价的研究本科论文.doc
《数学建模论文关于葡萄酒评价的研究本科论文.doc》由会员分享,可在线阅读,更多相关《数学建模论文关于葡萄酒评价的研究本科论文.doc(35页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、全国大学生数学建模论文关于葡萄酒评价的研究 摘要葡萄酒是由新鲜葡萄或葡萄汁经过酒精发酵而得到的,葡萄酒质量是其外观、香气、口味等的综合表现,葡萄酒的质量是通过评酒员的品评得到的。针对问题一,为判断两组评酒员的评价结果有无显著性差异,首先用Matlab对各组各酒样的总分做正态性检验,再用SPSS 做配对样品t检验,得到两组评酒员的评价结果有显著性差异;其次,用Matlab中的Std(x)函数求得第二组的标准差较小,即第二组结果更可信。针对问题二,某些理化指标对酿酒葡萄的影响不大,故本文采用主成分分析法对其作降维处理,得到各酿酒葡萄的主要理化指标。再用快速聚类分析对主要理化指标分类,最后结合葡萄酒
2、的质量对酿酒葡萄的等级加以评定。针对问题三,在问题二的基础上,用主成分分析法分析葡萄酒的理化指标,得到各葡萄酒的主要理化指标。再用相关分析法对酿酒葡萄和酒样的主要理化指标分析,得到两者间某些指标存在正、负相关关系,说明酿酒葡萄在较大程度上影响了葡萄酒的理化指标,此为模型一。再用多元线性逐步回归分析,得到两者的方程模型,此为模型二。针对问题四,分析影响时用SPSS 对酿酒葡萄的理化指标与葡萄酒质量,葡萄酒的理化指标与葡萄酒的质量进行相关性分析。对论证部分,以葡萄酒质量作为因变量,酿酒葡萄和葡萄酒的主要理化指标作为自变量,利用SPSS 19.0进行多元线性逐步回归分析后,得到方程模型,可通过四个方
3、程模型用酿酒葡萄和葡萄酒的理化指标对葡萄酒的质量予以评价,即得到结论可以用葡萄和葡萄酒的理化指标来评价葡萄酒的质量。关键词:Matlab SPSS 配对样品t检验 主成分分析法 聚类分析 双变量相关分析 多元线性逐步回归分析二、问题重述确定葡萄酒质量时一般是通过聘请一批有资质的评酒员进行品评。每个评酒员在对葡萄酒进行品尝后对其分类指标打分,然后求和得到其总分,从而确定葡萄酒的质量。酿酒葡萄的好坏与所酿葡萄酒的质量有直接的关系,葡萄酒和酿酒葡萄检测的理化指标会在一定程度上反映葡萄酒和葡萄的质量。附件1给出了某一年份一些葡萄酒的评价结果,附件2和附件3分别给出了该年份这些葡萄酒的和酿酒葡萄的成分数
4、据。请尝试建立数学模型讨论下列问题:1. 分析附件1中两组评酒员的评价结果有无显著性差异,哪一组结果更可信?2. 根据酿酒葡萄的理化指标和葡萄酒的质量对这些酿酒葡萄进行分级。3. 分析酿酒葡萄与葡萄酒的理化指标之间的联系。4分析酿酒葡萄和葡萄酒的理化指标对葡萄酒质量的影响,并论证能否用葡萄和葡萄酒的理化指标来评价葡萄酒的质量?三、问题分析葡萄酒质量的评定过程是每个评酒员对葡萄酒进行品尝后对其分类指标进行打分,通过求和得到其总分,这个总分反映了葡萄酒质量的好坏。另外,酿酒葡萄的质量是影响葡萄酒质量的直接因素,利用附件提供的数据,分析二者理化指标之间的联系。1)对问题一,为判断两组评酒员的评价结果
5、有无显著性差异,首先,在excel表格中分别求得第一组、第二组评酒员对每一种酒样品所评总分的平均值,然后用Matlab对所得平均值做正态性检验,判断该两组数据是否符合正态分布,若符合,再利用spss对所得的两组数据做配对样品t检验;其次,在excel中分别求得第一组、第二组十位评酒员对每种酒样品评分的标准差,所得标准差较小的一组即为评分结果更可信的一组。2)对问题二,要对酿酒葡萄进行分级,先找出酿酒葡萄性质的主要理化指标进行降维处理,故本文采用主成分分析法。再用聚类分析进行分类,而酿酒葡萄的好坏又与所酿葡萄酒的质量有直接的关系,所以对酿酒葡萄的分级可以结合葡萄酒的质量加以分析。3)对问题三,首
6、先对葡萄酒做主成分分析,结合第二问中酿酒葡萄的主要理化指标,利用SPSS 19.0对酿酒葡萄和葡萄酒的理化指标做相关性分析,此为模型一。其次,用多元线性逐步回归分析方法分析,建立线性回归方程模型,此为模型二。4)对问题四,第一问用SPSS 19.0分别做酿酒葡萄的理化指标与葡萄酒质量,葡萄酒的理化指标与葡萄酒质量的相关性分析,根据输出数据分析酿酒葡萄和葡萄酒的理化指标对葡萄酒质量的影响。问题四的第二问,是研究多个理化指标与葡萄酒质量是否存在相互依存关系,因此可用多元线性逐步回归分析的方法,以葡萄酒质量作为因变量,以第二问中挑选出的特征向量较大的酿酒葡萄和葡萄酒的理化指标作为自变量,利用SPSS
7、 19.0进行多元线性逐步回归分析。四、模型假设1)附件中的数据真实可靠;2) 假设第i号酿酒葡萄的好坏与第i号葡萄酒的优劣水平一致;3)假设二级指标对酿酒葡萄和葡萄酒质量的影响不大,可以忽略;4)假设在一定时间内葡萄酒的理化指标含量保持不变。五、符号说明与定义符号符号解释表示第i主成分;表示第i种葡萄样品的第j种指标的平均值;表示第i主成分的特征值;表示第i主成分的系数;表示指标变量的值;表示某种酿酒葡萄和葡萄酒的第i个指标;表示葡萄样品标准化后的值六、模型的建立与求解6.1问题一的分析6.1.1两组评价结果的显著性差异分析对同一葡萄酒两组评酒员进行品评,得到成对出现的两组评价结果,即配对样
8、本。故分析两组评价结果的显著性,本文采用配对样品t检验分析法。进行配对t检验的样本必须服从正态分布,首先,对配对样本进行正态分布检验,根据附件一,分别求出第一、第二组各十名评酒员对红、白葡萄酒评分的总和,再求其平均值如下表所示:表一 红、白葡萄酒的总分平均值 组别红酒样品第一组第二组 组别白酒样品第一组第二组162.768.118277.9280.374265.175.8380.474.6378.375.6468.671.2479.476.9573.372.157181.5672.266.3668.475.5771.565.3777.574.2872.366871.472.3981.578.2
9、972.980.41074.268.81074.379.81170.161.61172.371.41253.968.31263.372.41374.668.81365.973.9147372.6147277.11558.765.71572.478.41674.969.9167467.31779.374.51778.880.31859.965.41873.176.71978.672.61972.276.42079.875.82077.876.62177.172.22176.479.22277.271.6227179.42385.677.12375.977.4247871.52473.376.12
10、569.268.22577.179.52673.8722681.374.3277371.52764.8772881.379.6选平均值为评价结果,用Matlab的normplot命令,判定上述四组数据均趋于正态分布,结果如下图所示:(程序见附录程序一至程序四)图一 第一组 红葡萄酒 图二 第二组 红葡萄酒图三 第一组 白葡萄酒 图四 第二组 白葡萄酒 上图表明,此四组数据均服从正态分布,对红葡萄酒而言,要分析两组评酒员对其评分结果是否有显著性差异,可利用SPSS 19.0对这两组数据做配对样本t检验,所得结果为:t=2.497,sig=0.019,置信区间为0.4573 4.7130。可见,s
11、ig0.05,置信区间包括t=2.497,得出两组评酒员对红葡萄酒的评价结果具有显著性差异。对于白葡萄酒而言,方法同上,所得结果为:t=2.838,sig=0.009,置信区间为0.7883 4.9045,包含t=2.838。由于sig的值远小于0.05,得出两组评酒员对白葡萄酒的评价结果也具有显著性差异。6.1.2两组评价结果中较可信结果的选择假设每种葡萄酒的评价标准是一定的,标准差的大小能够反映不同评酒员对每种酒评分的离散程度,该值越小,改组评分越稳定,所得评价结果就越可信。因此,本文采用分别计算第一组、第二组各十名评酒员对27种红葡萄酒样品和28种白葡萄酒样品评分的标准差的方法,通过比较
12、标准差的大小选择可信结果。用Matlab编程作上述计算(见附录程序五),所得结果如下表:表二 红、白葡萄酒评分的标准差 组别红酒样品第一组第二组 组别白酒样品第一组第二组19.63859.048619.06325.087026.30784.0277214.17987.004836.76925.541838.152011.9369410.39446.425646.68666.488557.87473.6953511.24885.126267.72874.5959612.75584.7668710.17907.916976.25836.494486.63418.0691813.54995.5787
13、95.73975.072899.631510.3086105.51366.01481014.58358.3905118.41236.16801113.30879.3714128.92505.01221210.760511.8340136.70323.91011313.06786.8386146.00004.81201410.68753.9847159.25026.43001511.47177.3515164.25444.48331613.34179.0683179.38143.02771712.00746.2013186.87107.08991812.51185.4985196.88327.4
14、267196.81185.1034203.70066.2503208.02507.07422110.77505.95912113.14208.0250227.11494.92612211.77577.3212235.69994.9766236.60723.4059247.05533.27452410.54156.2084258.03886.6131255.820510.3199265.59366.4464268.538110.1440277.05534.52772712.01675.9628288.96975.0376由上表可知,第一组评酒员对红、白葡萄酒评分的标准差分别有74%、79%大于第
15、二组评酒员对相应项的评分,且第一组评酒员虽然在某些酒样品的评分中标准差小于第二组,但此时两组评酒员评分的标准差相差不大,故综上可知,第二组的评分结果更为可信。6.2问题二的求解与分析6.2.1酿酒红葡萄的理化指标的主成分分析根据酿酒葡萄的理化指标和葡萄酒的质量对酿酒葡萄进行分级,由于有些理化指标对酿酒葡萄的影响不大,故本文采用这成分分析法进行降维处理,再运用聚类分析进行分类。假设中假设酿酒葡萄的质量和葡萄酒的质量相对应,结合葡萄酒的质量再分等级。主成分分析法的原理阐述1:主成分分析是利用降维的思想,将多个变量转化为少数几个综合变量(即主成分),其中每个主成分都是原始变量的线性组合,各个主成分之
16、间互不相关,从而这些主成分能够反映原始变量的绝大部分信息,且所含的信息互不重叠。假设用p个变量来描述研究对象,分别用来表示,这P个变量构成的P维随机向量为。对X进行线性变化,考虑原始变量的线性组合:主成分是不相关的线性组合,并且是的线性组合中方差最大者,是与不相关的线性组合中方差最大者,是与都不相关的线性组合中方差最大者。酿酒红葡萄主成分模型的建立过程: 根据附件二中所给的27种酿酒红葡萄的理化指标,计算每种指标的平均值,即得到样本的数据矩阵其中表示第i中葡萄样品的第j种指标的平均值;为了消除各项指标之间的量纲化和数量级上的差别,本文利用SPSS 19.0对指标数据进行标准化,得到标准化矩阵(
17、见附表一);对标准化数据矩阵用SPSS 19.0做主成分分析,求出特征值,主成分贡献率和累积方差贡献率如下表,:表三 主成分分析的方差分解图解释的总方差成份初始特征值提取平方和载入合计方差的 %累积 %合计方差的 %累积 %16.96823.22823.2286.96823.22823.22824.94116.47139.6984.94116.47139.69833.73412.44752.1453.73412.44752.14542.8409.46861.6132.8409.46861.61352.0006.66668.2792.0006.66668.27961.7415.80574.084
18、1.7415.80574.08471.4194.72978.8131.4194.72978.81381.2694.23183.0441.2694.23183.0449.9613.20586.24810.7382.45988.70811.6912.30291.01012.5141.71392.72313.4941.64694.36914.3731.24395.61215.295.98396.59516.254.84697.44117.218.72698.16818.200.66798.83519.112.37399.20820.071.23799.44521.061.20599.65022.04
19、3.14399.79423.032.10899.90224.016.05399.95525.010.03499.98926.003.011100.000275.868E-171.956E-16100.00028-6.241E-17-2.080E-16100.00029-2.849E-16-9.497E-16100.00030-5.294E-16-1.765E-15100.000 根据选取主成分个数的原则,特征值要求大于1且方差累积贡献率达80%-95%的特征值所对应的1,2,m ,其中的m即为确定的主成分个数,所得结果如下表:表四 特征值以及提取主成分的个数6.968 4.9413.7342.
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 数学 建模 论文 关于 葡萄酒 评价 研究 本科
限制150内