酿酒葡萄与葡萄酒理化指标及其质量的分析与评估.doc
《酿酒葡萄与葡萄酒理化指标及其质量的分析与评估.doc》由会员分享,可在线阅读,更多相关《酿酒葡萄与葡萄酒理化指标及其质量的分析与评估.doc(18页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、【精品文档】如有侵权,请联系网站删除,仅供学习与交流酿酒葡萄与葡萄酒理化指标及其质量的分析与评估.精品文档.酿酒葡萄与葡萄酒理化指标及其质量的分析与评估摘要 本文通过运用SPSS首先对两组品酒员对葡萄酒的评价进行了差异显著性分析以及评Cronbach 系数分析对品酒员评价的可信度进行了分析,得到了两组品酒员评价之间存在显著性差异,并且第一组品酒员的评价结果更为可信。接下来我们取第一组评酒员给每个样品酒所给出的总分的平均分表示该样品葡萄酒质量的量化指标进行相关讨论 我们通过对葡萄及葡萄酒的理化指标归一化处理,将它们之间的联系现实的更为明显,紧接着我们利用因子分析、主成分分析将决定葡萄酒质量的因素
2、维度较低,从而达到简化模型的目的,并通过分析将各成分因子重新命名,再将命名后的主成分和评论员对葡萄酒的评价作为依据对酿酒葡萄等级评定,并引入层次分析法对评定体系进行改进构想。最后利用MATLAB求解主成分因子与葡萄酒质量之间的函数关系,并用BP人工神经网络进行验证及讨论。最后我们在每一个问题后面进行了深入的反思与总结,得出了一些具体的改进思路及方法,并得出在原有问题上的修正。关键字 SPSS MATLAB Cronbach 系数分析 主成分分析 层次分析法 BP人工神经网络 模型的改进与修正1. 问题重述随着经济的日益发展,人们生活水平的不断提高,葡萄酒的受众随之增加,品酒行业逐渐专业化。品质
3、是现代葡萄酒生产追求的目标之一,针对酒类的质量检测也成为食品行业工作的重中之重。根据已有数据,运用数学建模的方法,对葡萄酒进行评价是一个重要问题。确定葡萄酒质量时一般是通过聘请一批有资质的评酒员进行品评。每个评酒员在对葡萄酒进行品尝后对其分类指标打分,然后求和得到其总分,从而确定葡萄酒的质量。酿酒葡萄的好坏与所酿葡萄酒的质量有直接的关系,葡萄酒和酿酒葡萄检测的理化指标会在一定程度上反映葡萄酒和葡萄的质量。从上述相关关系出发,参考相关数据,针对酿酒葡萄与葡萄酒的理化指标和葡萄酒的质量这几个变量,进行分析并建立数学模型,讨论关于葡萄酒的评价问题:特别注意指出模型中的优点和不足之处,并做出改进方向。
4、2. 符号说明符号说明符号说明第i个品酒员对第j款酒所给的总分S香气指标K整个品尝的次数第i类芳香物质(1i8)总得分的方差Q其他影响因素所有在第i位品酒师打分的方差k香气指标关于芳香物质函数的常系数Y葡萄酒的单宁M测得葡萄酒评分X1葡萄酒的总酚Z葡萄酒标准分值(真实葡萄酒评分)X2葡萄酒的黄酮醇U外观指标第一组的总平均分V口感指标理化指标向量W整体评价指标代表原来数据群体的因子香气指标占总分的权重两类新的性质因子外观指标占总分的权重口感类物质成分因子口感指标占总分的权重色泽类物质成分因子整体评价指标占总分的权重3. 模型建立与求解3.1. 数据处理3.1.2. 数据预处理 由于试题中给出的附
5、件酒样品未按照顺序排列,我们首先将数据进行了预处理,每组数据均按照样品号和品酒员号顺序排列,加和得到每一剂量酒样品的总评分数,并求得各项明细指标的平均值;其次将多组同类理化指标取平均值,以便分析讨论,进行模型的建立与求解。3.1.3. 数据处理方法数据的预处理和部分图示,采用办公软件Microsoft Excel 2010;数据的归一化处理,采用办公软件Microsoft Excel 2010;数据结果的显著差异分析,采用SPSS 19.0;数据结果的信度分析,采用SPSS 19.0;数据结果的主成分分析,采用SPSS 19.0;数据处理的拟合分析,采用MATLAB2012a3.2. 问题1.
6、1:附件1中两组评酒员评价结果的显著性差异分析要比较两组评论员之间是否具有显著性差异,而每组有10个评论员,27或28个葡萄酒样品,由于附件中的数据都是单项给出的,整体可比性不强,所以我们先用EXCEL将数据进行了初步的整理(求出每个品酒员对各样品的总分,以及各个明细样品的平均值),以第一组对红葡萄酒样品一的评价为例,处理结果如表1所示:表1. 红葡萄酒样品一的评价项目品酒员12345678910平均值葡萄酒样品 1外观分析澄清度544443432433.5色调1088666686666.6香气分析纯正度655545544544.6浓度867767774646.1质量1614121214141
7、21412121212.8口感分析纯正度655545644554.8浓度866766866666.3持久性876767876666.6质量221916191616191916161617.2平衡/整体评价11109109109999109.4总分1008478827579848169757277.93.2.1. 初步分析:针对处理后的数据,我们初步的想法是将每组中各个品酒员对每项样品的总分作为一个样本,因此每个样本里将有270项数据。针对红葡萄酒评价的两组样本,利用SPSS进行一次相互独立样本之间的T检验,探测两个样本是否具有显著性差异。但随后通过查阅统计分析中T检验法的一些特性得到了相反的结
8、论:鉴于本题样本是每十个总分针对一个葡萄酒样本,并不满足独立样本T检验方法的适用范围,每组样本中的数据是有一定关联的,因此我们采用了另外一种检验方法配对样本T检验法。3.2.2. 二次分析 首先,我们对红葡萄酒的评价进行差异性分析(白葡萄酒的处理方法与其一致),将每项葡萄酒样品各项明细评分的平均分作为一个样本(包括总分的平均分),则每个样本里共有1127=297项数据,两组数据之间都是针对相同的样品和指标进行评价,所以两组中每项数据都是一一配对,互相关联的。其次,我们对两组葡萄酒的全部总分数据共27*10*2=540组,进行综合处理并作图1、图2所示,可以得知两组数据在数值上差异较大,初步判断
9、两组数据具有显著性差异,关于信度分析下文将给出分析讨论。 图1 图2 再次,我们以两组红葡萄酒样品1为例,对其数据做了归一化处理,利用雷达图表示,如图3所示。加强了上述关于显著性差异的推论。图3. 红葡萄酒样品归一化雷达图表示因此通过以上对数据和检验方法的分析,我们采用配对T检验法对两组样本进行差异显著性分析。3.2.3. 基本假设:1. 每组评论员对各项酒的评价分数成正态分布。2. 评论员都具有一定的专业品酒技术,对每种酒的各个指标的评价不会有大的偏差(保证评分的关联度)。3.2.4. 模型的建立与求解:将处理后的数据导入到SPSS软件中,针对两组红葡萄酒评价中的各项指标评分的平均值进行配对
10、样本T检验法,设定置信度区间为95,得到结果如下:表2.成对样本统计量均值N标准差均值的标准误对 1红葡萄酒各项平均分113.285629719.397301.12555红葡萄酒各项平均分212.820929718.634121.08126表3.成对样本相关系数N相关系数Sig.对 1红葡萄酒各项平均分1 红葡萄酒各项平均分2297.996.000表2为描述性统计表,给出了红葡萄酒的各项平均分的平均值,标准差以及标准误。表3为样本间的配对性的测验结果,可以看到测出的P值(即sig值)等于00.001,因此在95%的置信水平上差异显著,即两组红葡萄酒的各项平均分的平均值显著相关,验证了我们之前的
11、推论,因此也符合配对样本T检验的前提条件。表4.成对样本检验成对差分TdfSig.(双侧)均值标准差均值的标准误差分的 95% 置信区间下限上限对 1红葡萄酒各项平均分1 红葡萄酒各项平均分2.464681.88444.10935.24949.679884.250296.000表4为最终的配对样本T检验结果报表。其中t表示用公式:所计算出的值,是最终计算出P值的依据。df为自由度,sig(双侧显著性概率)则为我们所需要的P值。可以看到最终结果是P=0.0000.001,因此在95%的置信水平上差异显著,所以两组评论员评分无显著性差异的假设不成立,即两组评论员对红酒的评分具有显著性差异。图四为以
12、上结果的综合图形描绘。图4. 结果的综合图形描绘对于白葡萄酒的组,利用同样的方法进行差异性分析,在SPSS软件里同样也得到如下结果,如表5、表6、表7所示:表5.成对样本统计量均值N标准差均值的标准误对 1白葡萄酒各项平均分113.501930819.645421.11940白葡萄酒各项平均分213.914930820.210871.15162表6.成对样本相关系数N相关系数Sig.对 1白葡萄酒各项平均分1 白葡萄酒各项平均分2308.996.000表7.成对样本检验成对差分TdfSig.(双侧)均值标准差均值的标准误差分的 95% 置信区间下限上限对 1白葡萄酒各项平均分1 白葡萄酒各项平
13、均分2-.412991.93277.11013-.62969-.19628-3.750307.000图5.白葡萄酒成对样本检验 如图5所示,此时P值仍小于0.001,因此两组评论员对白葡萄酒的评价在95%的置信水平上也具有差异显著性,从而可得出结论:无论是针对红葡萄酒还是白葡萄酒,两组评酒员的评价结果都有显著性差异。3.2.5. 问题反思: 对于该问题,我们将每项葡萄酒评分做了平均化处理,再把处理出来的平均分作为样本,这样每个样本中的数据变成了与每个指标得分情况对应的一元数值,然后用配对样本T检验法对其进行差异显著性分析。通过这种方法处理出来的结果具有一定的科学性与准确性。但是由于数据是进行了
14、平均化处理后的数据,因此模型所反映出的情况不具有完整性,对此我们便有了下面这种改进思路:将每组中10名品酒师对27项样品的评价总分作为一个的矩阵(其中第i个品酒员对第j款酒所给的总分)。每个矩阵分别对应该组品酒师的评分具体情况,再用这两组数据构成的矩阵进行多元数据的T检验,如此处理出的结果就应该更具有完整性与可靠性。但由于本组成员所了解的统计学知识还不足以去运用这样多元性的、更为精确的处理手段,因此就将这作为一个以后改进的思路。3.3. 问题1.2:附件1中两组评酒员评价结果的信度分析我们针对两组中每位品酒师对每种酒所给出的总分得出的矩阵对其中的元素逐行进行可信度分析。3.3.1模型讨论首先我
15、们根据品酒师打分为主观作用,我们选择评价评分者信度的Kendall W协同检验模型,通过SPSS对红白葡萄4组数据进行模拟分析,得到的渐进显著性系数p均小于0.05(等于0.00),协同系数均为0.50左右,无法得出明确的结论。经过思考,我们发现Kendall模型对于采用等级评定方式评分的情况是可取的,然而当评分者用其他非等级评定的方式(如百分制)评定时,其信度系数是不合适的,因为其信度系数仅能反映评分者之间的相对一致性,并没有考虑评分者之间存在的评分绝对差别,在这种情况下评分者之间的系统误差也看会被成是随机误差,此时计算出的信度系数不能正确反映评分者信度的高低。所以我们选择内部一致性信度分析
16、。3.3.2. 问题假设为简化模型,排除品酒员主观因素和个人偏好不同而造成的影响,我们做出如下假设:1、每位品酒员鉴定的同一种葡萄酒特质完全相同。 2、对于每一种类葡萄酒被任何一品尝相当于对其质量进行一次客观的测试,每一项指标的评价,相当于一道题目的得分。3、葡萄酒的特质可以从品酒员的品尝时考虑的方面(即客观测试的一系列“题目”)测量出来。3.3.3. 模型的建立及求解对于抽象出来的测试模型,由于每道测试题目表示一个特质指标的评价,所以我们不能采用简单的二分法计分。因而我们选择Cronbach 系数分析。其中式中,K为整个品尝的次数;为总得分的方差;为是所有在第i位品酒师打分的方差。我们先用E
17、XCEL进行数据处理,得到的矩阵,以红葡萄酒为例。 表8. 第一组红葡萄酒 表9. 第二组红葡萄酒如表8、表9所示,不难看出对于红葡萄酒,第一组标准化Cronbachs Alpha较高,即第一组品酒师对红葡萄酒的评价更为可靠。同样地对于白葡萄酒,第一组标准化Cronbachs Alpha比第二组更高,如表10、表11所示。表10. 第一组白葡萄酒 表11. 第二组白葡萄酒即第一组更为可信。再对第一组进行进一步讨论,对于第一组十位品酒师对红白葡萄酒的评价的项已删除的 Cronbachs Alpha 值(详见附录)进行分析,没有任何一位品酒师对于整体的标准化Cronbachs Alpha有明显影响
18、,所以十位品酒师的评价分数也均可信。综上所述,无论对于红葡萄酒还是白葡萄酒,两组品酒师的评价均存在显著差异,其中第一组品酒师的评价结果更可信,并且第一组十位品酒师的评价都属于可信范围。3.4. 问题2:根据酿酒葡萄的理化指标和葡萄酒的质量对酿酒葡萄进行分级3.4.1. 问题分析如果单用葡萄酒为酿酒葡萄打分,则直接在葡萄酒的外观、香气、口感质量权重中赋予权值,所得之和即可作为对酿酒葡萄的评分。而本题却引入了另一类变量,就是葡萄的理化指标。这是一项很庞大杂乱的数据,所以我们想到利用主成分分析法对这些数据进行主要因子分析,找出这些指标的公共因子,求的每一样品在这些因子上的成份得分系数矩阵,给数据降低
19、维度,再以此作为研究酿酒葡萄等级评定的依据。3.4.2. 模型建立(以红葡萄为例)首先对数据进行归一化处理,再用SPSS因子分析对处理后的数据进行因子分析。并选择具有 Kaiser 标准化的正交旋转法进行处理。得到的结果如表12所示:表12.成份矩阵a成份12345678花色苷.852 总酚.851 单宁.759 DPPH自由基.734 葡萄总黄酮.704 果梗比.585 蛋白质.584 L-.578 黄酮醇.562 -.524 百粒质量-.542 出汁率.533 干物质含量 .847 总糖 .792 还原糖 .777 可溶性固形物 .758 氨基酸总量 .559 白藜芦醇 .812 A .7
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 酿酒 葡萄 葡萄酒 理化 指标 及其 质量 分析 评估
限制150内