2022年葡萄酒的评价 .pdf
《2022年葡萄酒的评价 .pdf》由会员分享,可在线阅读,更多相关《2022年葡萄酒的评价 .pdf(17页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、1 葡萄酒的评价摘 要葡萄酒的评价问题是制酒行业需面对的重要问题,合理的解决评酒员对葡萄酒进行品质鉴定时出现的问题对其至关重要。本文分别建立了方差模型、 主成分分析模型、多元线性回归模型,解决了组间差异性、葡萄的分级、葡萄与酒的指标间的联系和理化指标对酒质量的影响四个问题,为葡萄酒的评价提出了一套科学的葡萄酒评价体系。针对问题一, 先对给定数据进行分析, 剔除评分不完整或出错的数据。然后对剩余数据进行加和取平均处理, 得到各个评酒员对于酒样的总评分与每组平均分。接着,建立单因素方差分析模型,用Matlab 软件处理,求得红白葡萄酒样品的返回值, 得出两组评酒员在红葡萄酒的打分上无显著性差异,在
2、白葡萄酒的打分上有显著差异。最后建立方差分析模型,对每一组评酒员的评分方差用Matlab 软件求和,得出第二组方差较小,结果更可信。针对问题二, 由于给定的葡萄理化指标太多, 我们采用主成分分析法来确定主成分,降低维度。然后用min-max 标准化方法对原始数据进行处理,得到标准总分值。通过计算可以得到红葡萄的综合得分Y1红和红葡萄酒质量指标值Y2红,将二者按 73 的比重计算加权可以得到总分Y。最后按照分数段对葡萄进行分级。针对问题三, 我们以葡萄的理化指标的主因子为因变量,以葡萄酒理化指标的主因子自变量, 建立多元线性回归方程模型。 然后由回归系数表中的系数大小得出酿酒葡萄中的各物质与葡萄
3、酒中的各物质呈线性相关。针对问题四, 我们将问题合理转化为酒的理化指标对酒的得分的影响。为了看二者的关系, 我们对理化分数与葡萄酒的理化指标进行了相关性分析,建立了以酒的理化指标为自变量, 酒的理化得分为因变量的多元线性回归方程。回带理化指标后,将得到的分数除以其比重0.6 ,得到新的总分, 将其与原总分做拟合,二者趋势相同, 但拟合度很低, 说明理化指标对酒质量有影响,但不能只用理化指标来评价葡萄酒的质量本文所用模型先对错误数据进行了剔除,使结果更可信, 并运用了主成分分析法,降低了维度,使模型的求解变得简单。关键字:单因素方差分析;方差分析;min-max 标准化;多元线性回归精选学习资料
4、 - - - - - - - - - 名师归纳总结 - - - - - - -第 1 页,共 17 页2 1.问题重述葡萄酒的质量通过一些有资质的评酒员品评来确定的。每个评酒员要先对样品葡萄酒进行品尝, 再对各类指标打分, 然后求和得总分, 最后确定葡萄酒的质量。葡萄酒的质量与酿酒葡萄的好坏有直接关系,酒和葡萄检测的理化指标在一定程度上反映酒和葡萄的质量。附件 1 给出了某一年份一些葡萄酒的评价结果,附件 2 和附件 3 分别给出了该年份这些葡萄酒的和酿酒葡萄的成分数据。建立数学模型讨论以下问题:1. 分析附件 1 中两组评酒员的评价结果有无显著性差异,哪组结果更可信?2. 根据葡萄的理化指标
5、和酒的质量对葡萄进行分级。3. 分析葡萄与酒的理化指标之间的联系。4分析葡萄和酒的理化指标对酒质量的影响,并论证能否用葡萄和葡萄酒的理化指标来评价葡萄酒的质量. 2.基本假设1.假设呈给评酒员的酒样品没有出错,品酒过程中无突发事件发生;2.假设酿酒工艺和贮存条件等对葡萄酒质量及理化指标无影响;3.假设酿酒葡萄和葡萄酒的理化指标和芳香物质在一定时间内不发生改变;3.通用符号说明序号符号符号的意义1 panova1 命令的返回值2 11,2,327iai()第一组 10 位评委对红酒样品的总评分3 21,2,327iai()第二组 10 位评委对红酒样品的总评分4 11,2,327iSi()第一组
6、每位评酒员的评分方差5 21,2,327iSi()第二组每位评酒员的评分方差6 1Y红红葡萄的综合得分7 2Y红红葡萄酒质量指标值精选学习资料 - - - - - - - - - 名师归纳总结 - - - - - - -第 2 页,共 17 页3 4.问题一的模型建立与求解问题分析由于所给数据存在错误, 我们需要剔除出给定数据中明显错误的数据,以真实地反映出两组评酒员的差异及可信度问题。由于数据量较大, 我们需要通过求各组评酒员对于酒样品的总评对数据进行整合、简化。对于两组评酒员的评价结果有无显著性差异的问题,因为影响因素只有组数,我们拟建立单因素方差分析1模型,打算用 Matlab 软件中的
7、 anova1 命令来处理此均衡数据,得到返回值p,来评价两组评酒员的评分有无显著性差异。对于哪组结果更可信问题, 要通过组内成员的打分在均值周围的波动情况判断,所以我们拟建立方差分析1模型,通过编写 Matlab 程序来解决。通过计算一、二组对红、白葡萄酒样品评分的方差和, 比较得出方差和小的那一组结果更可信。4.2 数据处理首先,附件 1 的第一组红葡萄酒品尝评分表中,4 号评酒员对 20 号酒样品的色调未作评价,所以我们将此20 号酒样品的色调数据剔除出去。附件1 的第一组白葡萄酒品尝评分表中,6 号评酒员对3 号酒样持久性打分超过总分值,9号评酒员对 8 号酒样持久性打分超过总分值,所
8、以剔除数据。然后求出第一组中每个评酒员对每个红葡萄酒样品的评分总和,将每个评酒员的评分总和相加, 再取平均值,这样就得到了评酒员对每个红葡萄酒样品的平均分。同理求得第二组中评酒员对每个红葡萄酒样品的平均分。将红酒样品按序号排列,整理得到一二组红葡萄酒平均分表格,见附录1 表 1。用同样的方法处理白酒样品的评分表,得到一二组白葡萄酒平均分表格,见附录1 表 2。模型的建立与求解4.单因素方差分析模型对于两组评酒员的评价结果有无显著性差异的问题,由于只考虑一个因素A不同组 对红、白葡萄酒质量评价的影响, 可以建立两个单因素方差分析模型分别得出。先看红葡萄酒,单因素A 取两个水平 A1,A2即第一组
9、和第二组,在水平 Ai下总体 xi服从正态分布 N(i, 2),i=1,2, i, 2未知, i可以不同,但假定xi有相同的方差。又设在每个水平 Ai下作了 27 次独立试验即 27 个红葡萄酒样品,试验过程中除 A 外其他影响指标的因素都保持不变。将这些数据列成下表形式。表 1. 单因素分析表A1A2x11 x12 x127 x21 x22 x227xij为第 i 组第 j 次独立试验。精选学习资料 - - - - - - - - - 名师归纳总结 - - - - - - -第 3 页,共 17 页4 判断 A 的两个水平对评分有无显著影响,相当于要作以下假设检验:012112;,HH:不全
10、相等由于xij的取值受 Ai与随机因素ij的影响,所以需要将其分解:,1,2,1,2,., 27ijiijxij 1其中2(0,)ijN,且相互独立。记为红葡萄酒样品得分的总均值,i为水平iA对评分的效应,则:22111,1,2iiiiiiinnnin 2由1 2可将模型表示为2120(0,),i1,2,j1,2,.,nijiijiiijixN原假设为012:0H取=0.01,拒绝0H,称因素 A 的影响非常显著;取=0.01,不拒绝0H,但取0.05,拒绝0H,称因素 A 的影响显著;取0.05,不拒绝0H,称因素 A 无显著影响。此模型我们用Matlab 统计工具箱中的单因素方差分析的an
11、ova1 命令来求解。此题的数据为均衡数据,处理方法为:1(x)panova返回值 p 是一个概率,当p时接受0H。x 为矩阵,第一列为第一组评酒员对每个红葡萄酒样品的平均分,第二列对应为第二组评酒员对这个红葡萄酒样品的平均分。Matlab 程序见附录 1,运行结果见附录 1。由运行结果得返回值p= , 说明说明第一组与第二组评酒员对红葡萄酒的打分无显著差异。接着,我们将两组中的评酒员用单因素方差分析在组内进行比较,用 Matlab软件中的 anova1命令求解,程序同上。由运行结果得出第一组的返回值为006,第二组的返回值为0,说明第一组与第二组中的10 位评酒员的评分间均有显著差异,他们在
12、各项打分上都与平均值相差较大。我们对白葡萄数据用同样方法处理,得到返回值为 0.0226,说明第一组与第二组对白葡萄酒的打分有显著差异。精选学习资料 - - - - - - - - - 名师归纳总结 - - - - - - -第 4 页,共 17 页5 综上,我们由单因素方差分析模型得出:两组在红葡萄酒的评分上无显著差异;两组在白葡萄酒的评分上存在显著差异。方差分析模型为了解决哪组结果更可信的问题,我们建立方差分析模型如下:记第一组 10 位评委对红酒样品的总评分为:a1ii=1,2,327; 每一位评酒员的评分方差为 S1ii=1,2,327 。第二组 10 位评委对红酒样品的评分为: a2
13、ii=1,2,327; 每一位评酒员的评分方差为 S2ii=1,2,327 。再对 S1i和 S2i中的元素分别求和,得到两组品鉴红葡萄酒的方差和。同理得出两组品鉴白葡萄酒的方差和。结果如下:表 2 一、二组对红、白葡萄酒样品评分的方差和表方差和第一组第二组红葡萄酒样品白葡萄酒样品由上表得:第二组对红白葡萄酒的方差和均比较小,说明第二组的结果更可信。5.问题二的模型建立与求解5.1 问题分析酿酒葡萄的分级与酿酒葡萄的理化指标和葡萄酒的质量有关。对于酿酒葡萄的理化指标,由于给定指标很多,我们拟采用主成分分析法1来进行降维处理,通过计算主成分的奉献率,并累计奉献率,去除对分级影响小的指标。接着,对
14、各主成分得分排序。 对于葡萄酒的质量, 由于问题一的结果得到第二组的评分更可信,我们选取第二组的数据。将第二组10 个评酒员的评分加和再取平均值,以平均值标准化后作为葡萄酒质量这一指标的值Y2红。然后可以用min-max 标准化方法对原始数据进行处理,得到标准总分值。通过计算可以得到红葡萄的综合得分Y1红和红葡萄酒质量指标值Y2红,将二者按 73 的比重计算加权可以得到总分Y红。最后按照分数段对葡萄进行分级。5.2 模型的建立主成分分析法模型建立过程如下1:以红葡萄为例, 我们有 27 个样本,每个样本有 30 个变量, 将原始数据写成一个 27 30阶的数据矩阵,精选学习资料 - - - -
15、 - - - - - 名师归纳总结 - - - - - - -第 5 页,共 17 页6 11121302122232712722730.xxxxxxXxxxijx为第 i 个样本第 j 个变量的数据。第一步,将矩阵用min-max 方法标准化。第二步,计算相关系数阵。其公式为:27127272211(xx )(xx )(xx )(xx )kiikjjkijkiikjjkkrxki为ijx为第 i 个样本第 j 个变量的数据。得到这样一个相关系数阵:11121302122233013023030.rrrrrrRrrr式中 riji,j=1,2,30为原始变量的 xi与 xj之间的相关系数。第三
16、步,计算 R 的特征值与特征向量。解特征方程的特征值之后将其按从大到小排序。然后分别求对应特征值的特征向量。第四步计算主成分奉献率bii=1,2,3,10及累计奉献率。12iyyYy为红葡萄的公因子;11130130.iiaaAaa为红葡萄因子得分系数矩阵;1230 xxXx表示每个样品的30 个指标; YAX第五步,得到各主成分的得分。 通过累计方差奉献率加权, 求得每个红葡萄样品的综合得分 Y1红。1122313=bb+b+.+biiyyYyy红精选学习资料 - - - - - - - - - 名师归纳总结 - - - - - - -第 6 页,共 17 页7 yi为主成分。120.70.
17、3YYY红红红5.3 模型的求解数据无量纲化及主成分分析的Matlab 程序见附录 2。由运行结果,我们得到前10 个标准化样本的累计奉献率到达了89% ,所以我们取前 10 个为主成分。表奉献率表主成分1 2 3 4 5 奉献率主成分6 7 8 9 10 奉献率由这十个主成分的奉献率大小, 我们通过累计方差奉献率加权, 求得每个红葡萄样品的综合得分Y1红。然后按照 7:3 的权重求得红葡萄与红葡萄酒样品的综合得分 Y红。红葡萄与红葡萄酒样品的综合得分Y红见附录 2 , 我们将综合得分从大到小排序,等区间划分分数,得到葡萄的四个等级如下:表 4. 红葡萄样品等级分配表等级等级分数段红葡萄样品号
18、1 ,1.30 1,2,3,8 2 0.81,1.119,12,14,16,17,22,23 3 0.51,0.804,5 ,6,7,11 ,15,18 ,19,20,21,24,27 4 0.20,0.5010,13 ,25,26 表 5. 白葡萄样品等级分配表等级等级分数段白葡萄样品号1 0.501,0.75 5,20,21,23 ,24,27,28 2 0.251,0.500 1,2,4,6,7,10,12,14,17,18,22,26 3 0.001,0.250 3,9,11,13,15,25 4 -0.250,0.008,16,19 由表格我们看出: 我们将红白葡萄各分为四个等级。对
19、红葡萄而言, 葡萄的类别呈中间多、两头少的分布,中等质量的葡萄居于多数。对白葡萄而言,前三个等级的葡萄战略大多数,质量差的葡萄较少。6.问题三的模型建立与求解6.1 问题分析为了分析酿酒葡萄与葡萄酒的理化指标之间的联系,我们打算建立线性回归方程,看二者是否相关。因二者理化指标太多, 我们需要利用问题二中得到的红葡萄与红葡萄酒理化精选学习资料 - - - - - - - - - 名师归纳总结 - - - - - - -第 7 页,共 17 页8 指标的主因子来简化方程。 我们拟定方程红葡萄理化指标的主因子为因变量,红葡萄酒理化指标的主因子为自变量。 由回归系数表中的系数大小来得出酿酒葡萄中的各物
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 2022年葡萄酒的评价 2022 葡萄酒 评价
限制150内