葡萄酒的评价.pdf
《葡萄酒的评价.pdf》由会员分享,可在线阅读,更多相关《葡萄酒的评价.pdf(33页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、葡萄酒的评价摘要葡萄拥有很高的营养价值,含有多种氨基酸、蛋白质和维生素,而以葡萄为原料的葡萄酒也蕴藏了多种营养物质。目前,葡萄酒的营养价值得到了广泛的认可,可以说葡萄酒是一个良好的滋补品。确定葡萄酒质量时一般是通过聘请一批有资质的评酒员进行品评。每个评酒员在对葡萄酒进行品尝后对其分类指标打分,然后求和得到其总分,从而确定葡萄酒的质量。酿酒葡萄的好坏与所酿葡萄酒的质量有直接的关系,葡萄酒和酿酒葡萄检测的理化指标会在一定程度上反映葡萄酒和葡萄的质量。本文通过对葡萄酒的评价,以及酿酒葡萄和葡萄酒的理化指标之间的关系进行讨论分析。对不同的酿酒葡萄进行了分类,并更深入讨论两者的理化指标是否影响葡萄酒质量
2、。由于该题的数据量较大,我们主要采用 EXCEL 和 SPSS 软件对模型进行求解。针对问题一,首先我们将附件 1 中数据在 Excel 中进行处理;其次,我们在SPSS 中,采用 T 检验,分别分析出两组评酒品红、白葡萄酒的评价结果有无差异性。最后,我们通过 T 检验,在 SPSS 中可其相应的标准差,通过比较标准差来确定哪个组更可靠。针对问题二,对附件二和附件三中的葡萄理化指标进行相关性分析和主成分分析,筛选出影响葡萄酒评分的主要指标(以下简称主要指标);再建立神经网络模型,根据葡萄酒品尝评分进行分层抽样,选取与之对应的红、白酿酒葡萄各6 种,将其主要指标作为输入数据,对应葡萄酒的品尝评分
3、作为输出数据建立具有一个隐含层的 BP 神经网络,对神经网络进行训练,使其准确智能的给出葡萄酒的评分,根据评分结果对酿酒葡萄进行分级。针对问题三,通过聚类分析和典型相关分析来确定酿酒葡萄与葡萄酒的理化指标之间的关系。再对简化后的两组样本进行典型相关分析,得到两种样本指标被对方解释的比例分别达到了 100%和 92.4%,较好的反映了酿酒葡萄与葡萄酒的理化指标之间的关系。针对问题四,我们用层次分析法,通过比较品酒员对葡萄酒的评分与根据酿酒葡萄和葡萄酒的理化指标得到的葡萄酒的质量这两者的吻合度,具体吻合度的大小可用图形和线性相关分析得到的检验指标大小同时判断定量给出。关键词:SPSST 检验聚类分
4、析法相关系数回归分析原理相关分析原理偏相关系数EXCEL判别分析一、问题重述确定葡萄酒质量时一般是通过聘请一批有资质的评酒员进行品评。每个评酒员在对萄酒进行品尝后对其分类指标打分,然后求和得到其总分,从而确定葡萄酒的质量。酿酒葡萄的好坏与所酿葡萄酒的质量有直接的关系,葡萄酒和酿酒葡萄检测的理化指标会在一定程度上反映葡萄酒和葡萄的质量。题目给出的附件一共有三个,分别为某一年份一些葡萄酒的评价结果,该年份这些葡萄酒的和酿酒葡萄的成分数据。需解决的问题为以下四个:1.分析附件 1 中两组评酒员的评价结果有无显著性差异,哪一组结果更可信?2.根据酿酒葡萄的理化指标和葡萄酒的质量对这些酿酒葡萄进行分级。
5、3.分析酿酒葡萄与葡萄酒的理化指标之间的联系。4 分析酿酒葡萄和葡萄酒的理化指标对葡萄酒质量的影响,并论证能否用葡萄和葡萄酒的理化指标来评价葡萄酒的质量?二、问题分析二、问题分析2.1 针对问题一,我们将它分成两个问题去解决1、针对问题一中的两组评酒员的评价结果有无显著性差异,我们在 SPSS中利用 T 检验去判断。在这之前,我们对附录 1 中数据进行处理,利用 excel分别求出两组评酒员分别对红葡萄酒和白葡萄酒的评价结果的平均值。2、针对问题一中选择哪组结果更加可靠,我们利用 SPSS 求出两组葡萄酒评价结果的平均值的标准差,通过对比两组相应葡萄酒评价结果的平均值的标准差,从而确定出第几组
6、的结果更可靠。2.2 针对问题二对附件二和附件三中的葡萄理化指标进行相关性分析和主成分分析,筛选出影响葡萄酒评分的主要指标(以下简称主要指标);再建立神经网络模型,根据葡萄酒品尝评分进行分层抽样,选取与之对应的红、白酿酒葡萄各 6 种,将其主要指标作为输入数据,对应葡萄酒的品尝评分作为输出数据建立具有一个隐含层的 BP 神经网络,对神经网络进行训练,使其准确智能的给出葡萄酒的评分,根据评分结果对酿酒葡萄进行分级。2.3 针对问题三通过聚类分析和典型相关分析来确定酿酒葡萄与葡萄酒的理化指标之间的关系。为了能够在海量数据中找到两个样本之间的内在联系,我们先通过聚类分析对酿酒葡萄的理化指标进行分类如
7、下表所示:(数字代表的含义见正文)糖类酚类持久度酸度酒精度微量元素色度果皮质地1、16、17、18、20、222、11、12、134、8、9、155、6、719、21314、2829、3023、24、26、27再对简化后的两组样本进行典型相关分析,得到两种样本指标被对方解释的比例分别达到了 100%和 92.4%,较好的反映了酿酒葡萄与葡萄酒的理化指标之间的关系。2.4 针对问题四考虑到酿酒葡萄和葡萄酒的理化指标对葡萄酒的影响因素众多,关系复杂,我们用层次分析法,对于论证,基本思路是通过比较品酒员对葡萄酒的评分与根据酿酒葡萄和葡萄酒的理化指标得到的葡萄酒的质量这两者的吻合度,吻合度大,证明能用
8、葡萄和葡萄酒的理化指标评价葡萄酒的质量,吻合度小,则不能,具体吻合度的大小可用图形和线性相关分析得到的检验指标大小同时判断定量给出。三、基本假设1、假设制作葡萄酒的工艺是一样且稳定的;2、假设两组评酒员是随机分配的且每位评酒员的系统误差较小;3、假设题目附件所给数据真实有效;4、假设不考虑多种葡萄可制成一种酒,只考虑一种葡萄制成一种酒;5、假设只考虑红葡萄制成红葡萄酒,白葡萄制成白葡萄酒,忽略去皮红葡萄可酿制白葡萄酒;6、假设酿酒葡萄中存在的而葡萄酒中不存在的理化指标也会影响葡萄酒的质量;7、假设质量高的葡萄酒一定由质量好的酿酒葡萄制成,但是质量好的酿酒葡萄不一定能酿制成质量高的葡萄酒;四、四
9、、符号说明符号说明n自由度iX:表示随机变量;2S:表示样本方差;ix:酿酒葡萄的主成分指标iy:葡萄酒的理化指标iu:酿酒葡萄的典型变量iv:葡萄酒的典型变量i:对应判断矩阵的最大特征值E:准则层判断矩阵ia:对应矩阵的特征向量ib:权重向量F:红葡萄酒判断矩阵G:白葡萄酒判断矩阵R:红葡萄酒的方案层中各因素对准则层中葡萄酒理化指标的比重W:白葡萄酒的方案层中各因素对准则层中葡萄酒理化指标的比重1RR:红葡萄酒样品在葡萄酒质量这一项上占的比重1WW:白葡萄酒样品在葡萄酒质量这一项上占的比重五、模型建立与求解五、模型建立与求解5.1 两组评酒员的评价结果有无显著性差异,选择哪一组更可靠5.1.
10、1 问题分析根据题目要求,我们需要根据两组评酒员对27种红葡萄酒和28种白葡萄酒的10个指标相应的打分情况进行分析,并确定两组评酒员对葡萄酒的评价结果是否有显著性差异,然后判断哪组评酒员的评价结果更可信。我们对两组品尝同一种类酒样品的评酒员的评价结果进行两两配对,分析配对的数据是否满足配对样品t检验的前提条件,由判断可知符合检验要求。接着,我们对数据进行多组配对样品的t检验,从而对两组评酒员评价结果的显著性差异进行检验。对于两组评价的可靠性的评价,我们选择信度分析的方法。运用信度系数法,通过比较两组数据值的大小来判定稳定性。5.1.2 两组评酒员的评价结果有无显著性差异配对样本的 T 检验2.
11、1 配对样本 T 检验的概念若实验设计是将条件、性质相同或相近的两个供试单元配成一对,并设有多个配对,然后对每一个配对的两个供试单元分别随机的基于不同处理,这样的实验叫做配对实验。它的特点是配成对子的两个试验单元的非处理条件尽量一致,不同对子的试验单元之间的非处理条件允许有差异,每一个对子就是试验处理的一个重复。SPSS 配对样本的 T 检验主要解决来自配对样本数据的两个总体均值有否显著差异的问题。所谓配对样本,通常是指对同一观察对象在使用某种新方法的有效性。配对样品 t 检验具有的前提条件为:(1)两样品必须配对;(2)两样品来源的总体应该满足正态性分布。2.2 基本数学原理:成对样本的均值
12、比较 t 检验,假设这两个样本之间的均值差异为零,用于检验的统计量为:t=)1(/)()(1212nnnyxniniiiiiyxyx(式中,n-1 为自由度,n 为数据对数)2.建立检验假设:0:,0:10ddHH(其中d为均值差异)其假设的意义为,当差异为零时,可以认为某种试验方法无效;反之,当差异不为零,可以认为某种试验方法在发生作用或有效。2.3 模型求解:(1)配对样品的t检验要求两对应样品的总体满足正态分布,则总体中的样品应该满足正态性或者近似正态性,样本的正态性检验如下:根据 t 检验的原理,对葡萄酒配对样品进行t检验之前我们要对样品进行正态性检验。配对样品的t检验要求两对应样品的
13、总体满足正态分布,总体中的样品应该满足正态性或者近似正态性。因此,以白葡萄酒的澄清度的28组数据为例分析,利用SPSS软件绘制两样品的直方图和趋势图如图1所示:图一 白葡萄酒澄清度两组数据直方图我们假设两组总体数据都服从正态分布,利用 SPSS 软件进行 K-S 正态性检验的具体结果见附录 1。两组数据的近似相伴概率值 P 分别为 0.629 和0.223,大于我们一般的显著水平 0.05 则接受原来假设,即两组红葡萄酒的澄清度数据符合近似正态分布。同理可用 SPSS 软件对其他指标的正态性进行检验,得到结果符合实际猜想,都服从近似正态分布。(2)问题一中配对样品为红葡萄酒与白葡萄酒两个完全相
14、同的酒样品在两组不同评酒员的检测下得到的两组数据,其中两组中各个指标的数据为各组10个评酒员对该指标打分的平均值。通过先求和后平均的算法作出各个样品的总指标,即平均分,如表 1。并在SPSS 中对两组红葡萄酒质量的平均值运行配对样本的 T 检验(检验水平=0.05)表 1:酒样品的平均分样品红 1红 2白 1白 2样品 162.768.18277.9样品 280.37474.275.8样品 380.474.685.375.6样品 468.671.279.476.9样品 573.372.17181.5样品 672.266.368.475.5样品 771.565.377.574.2样品 872.3
15、6671.472.3样品 981.578.272.980.4样品 1074.268.874.379.8样品 1170.161.672.371.4样品 1253.968.363.372.4样品 1374.668.865.973.9样品 147372.67277.1样品 1558.765.772.478.4样品 1674.969.97467.3样品 1779.374.578.880.3样品 1859.965.473.176.7样品 1978.672.672.276.4样品 2078.675.877.876.6样品 2177.172.276.479.2样品 2277.271.67179.4样品 23
16、85.677.175.977.4样品 247871.573.376.1样品 2569.268.277.179.5样品 2673.87281.374.3样品 277371.564.877样品 2881.379.6将数据导入 spss 运行后,结果如下:成对样本检验成对样本检验tdfSig.(双侧)对 1红 1-红 22.45826.021对 2白 1-白 2-2.18427.038结论分析:本题中,红葡萄酒自由度 n=27-1=26,056.226t2,即知拒绝域为|t|2.056,白葡萄酒自由度 n=28-1=27,052.227t2,即知拒绝域为|t|2.052。由上表可知,两组品酒师对红、
17、白葡萄酒的检验结果|t1|=2.4582.056,|t2|=2.1842.052,因为两个检验值均在拒绝域,所以两组品酒师的评价结果有显著差异。5.1.3 评价结果的可信度分析3.1 基本数学原理:本小问,我们采用信度分析中的信度系数法。Cronbach 信度系数是目前最常用的信度系数,其公式为:其中,K 为酒样品的总数,为第 i 种酒品得分的方差,为全部酒样品总得分的方差。从公式中可以看出,系数评价的是品酒师各酒样得分间的一致性,属于内在一致性系数。这种方法适用于态度、意见式问卷(量表)的信度分析。目前,普遍认为信度系数的值一般在 0 和 1 之间,在此范围内,值越大,评价信度越好。3.2
18、模型求解:对附表 1 中两组品酒师对每种酒样样品的评价结果求加权平均值,得到该酒样品的加权平均分,如表 2。表 2:酒样品的加权平均分样品红 1红 2白 1白 2样品 17.798.37910.2559.785样品 210.2019.3529.179.503样品 310.0749.35510.4279.564样品 48.578.9119.8869.695样品 59.0719.0179.00510.236样品 68.9858.2898.69.492样品 78.8978.2299.699.237样品 89.0038.198.9189.025样品 910.1389.7228.92810.02样品 1
19、09.2048.5469.32210.058样品 118.6627.6039.0978.942样品 126.9848.6227.9879.092样品 139.3958.4978.3819.331样品 149.2049.1189.0149.65样品 157.3098.1889.0779.802样品 169.3488.7989.38.503样品 179.9019.2169.80910.148样品 187.6588.2929.0849.682样品 199.7539.1128.9999.604样品 209.8179.5719.729.582样品 219.6699.0789.659.971样品 229.
20、5299.0178.7259.915样品 2310.7169.5219.4399.599样品 249.7068.9239.2019.591样品 258.5718.4459.4910.02样品 269.1398.8799.9499.299样品 279.1359.0318.2349.554样品 2810.0839.957运用 spss 中测验信度分析模块,对酒样品的最终得分进行信度分析,得到以下结果:第一组第一组可靠性统计量可靠性统计量CronbachsAlpha项数.3272第二组第二组可靠性统计量可靠性统计量CronbachsAlpha项数.5182结果分析:有结果可知,第一组品酒师评价结果的
21、 Cronbachs Alpha 为 0.327 小于第二组品酒师评价结果的 Cronbachs Alpha 的 0.518,所以第二组品酒师的评价结果更加可信。5.1.4 问题 1 的结果分析在本问中,我们通过对两组评酒员的品酒打分情况统计数据按照指标进行配对 t 检验,发现有部分指标存在显著性差异。然后,我们运用可信度分析的方法对每组数据进行可靠性的评价,进而得出了第二组数据更加可靠的结论。5.2.1 酿酒葡萄的主要指标筛选题目要求我们根据酿酒葡萄的理化指标和葡萄酒的质量对酿酒葡萄进行分级。经验告诉我们,葡萄的理化指标越合理、葡萄酒的质量越好该酿酒葡萄的质量也就越好。这就要求我们分析葡萄的
22、具体理化对葡萄的综合得分的贡献,并结合所酿葡萄酒的得分去评价葡萄的等级。在葡萄品质的评价过程中,由于酿酒葡萄的理化指标项目繁多复杂,为简化理化指标对葡萄酒评分的影响,对附件二中理化指标进行相关性分析和主成分分析。首先对附件二中对同一指标多次测量的数据做取平均值处理,借助 SPSS 软件对数据进行相关性分析和主成分分析,筛选出影响葡萄酒评分的主要指标,所得结果如下表所示。表 3 红葡萄指标与酒评分相关性分析表 4 白葡萄指标与酒评分相关性分析表 5红葡萄理化指标的主成分分析结果显著相关指标相关系数蛋白质0.514*DPPH0.407*总酚0.448*葡萄总黄酮0.504*颜色 b*-0.435*
23、颜色 C-0.438*pH0.429*显著相关指标相关系数颜色 b*0.539*颜色 C0.460*可溶性固形物0.419*葡萄总黄酮-0.364*酒石酸0.453*果穗质量-0.406*主成分包含成分名称贡献率(%)第一主成分蛋白质,花色苷,DPPH,总酚,单宁,葡萄总黄酮22.217第二主成分总糖,干物质含量,可溶性固形物,颜色 a*37.981第三主成分白藜芦醇,颜色 b*,颜色 c51.412表 6白葡萄理化指标的主成分分析结果主成分包含成分名称贡献率(%)第一主成分总糖,干物质含量,果穗质量,颜色 b*,颜色 C,氨基酸22.217第二主成分总酚,总黄酮,颜色 H,酒石酸37.981
24、第三主成分固酸比,可滴定酸,颜色 a*51.412通过相关性及主成分分析得到决定葡萄酒评分的酿酒葡萄主要指标如下:红葡萄:蛋白质、单宁、DPPH、干物质含量、花色苷、颜色 b*、颜色 C、总酚、葡萄总黄酮、总糖等十项指标;白葡萄:氨基酸、干物质含量、果穗质量、固形物、酒石酸、颜色 b*、颜色 C、总酚、葡萄总黄酮、总糖等十项指标。5.2.2 BP 神经网络模型的建立与酿酒葡萄的分级由问题知第二组的评分更为准确,因而我们利用第二组的品尝评分对葡萄酒进行排序,并进行分层抽样,选取综合评分高、中、低的红葡萄酒所对应的酿酒葡萄各 2 种,将选取出的 6 种葡萄的 10 项主要理化指标和对应的葡萄酒评分
25、输入神经网络中,进行学习,训练曲线如下:图 1BP 神经网络对红葡萄指标的训练曲线图 2 BP 神经网络对白葡萄指标的训练曲线分别输入所有红、白葡萄的主要指标到神经网络,得到葡萄的评价结果如下图(其中实线为 BP 网络评分,虚线为品酒员评分):图 3BP 神经网络与品酒员对红葡萄的评分对比图图 4BP 神经网络与品酒员对白葡萄的评分对比图根据酿造的葡萄酒的整体评分,假设葡萄分级标准如下:红葡萄:8.5 分以下为二等,8.59.0 分为一等,9.分 0 以上为特等;白葡萄:9.0 分以下为二等,9.09.5 分为一等,9.5 分以上为特等。整理所有葡萄得分分级如下表:表 7 红、白葡萄评分红葡萄
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 葡萄酒 评价
限制150内