葡萄酒的评价大学生数学建模竞赛.doc
【精品文档】如有侵权,请联系网站删除,仅供学习与交流葡萄酒的评价大学生数学建模竞赛.精品文档.2012高教社杯全国大学生数学建模竞赛承 诺 书我们仔细阅读了中国大学生数学建模竞赛的竞赛规则.我们完全明白,在竞赛开始后参赛队员不能以任何方式(包括电话、电子邮件、网上咨询等)与队外的任何人(包括指导教师)研究、讨论与赛题有关的问题。我们知道,抄袭别人的成果是违反竞赛规则的, 如果引用别人的成果或其他公开的资料(包括网上查到的资料),必须按照规定的参考文献的表述方式在正文引用处和参考文献中明确列出。我们郑重承诺,严格遵守竞赛规则,以保证竞赛的公正、公平性。如有违反竞赛规则的行为,我们将受到严肃处理。我们授权全国大学生数学建模竞赛组委会,可将我们的论文以任何形式进行公开展示(包括进行网上公示,在书籍、期刊和其他媒体进行正式或非正式发表等)。我们参赛选择的题号是(从A/B/C/D中选择一项填写): A 我们的参赛报名号为(如果赛区设置报名号的话): 所属学校(请填写完整的全名): 西南科技大学 参赛队员 (打印并签名) :1. 周 立 2. 李 婧 3. 赖永宽 指导教师或指导教师组负责人 (打印并签名): 杨学南、王丽、倪英俊 日期: 2012 年 9 月 10 日赛区评阅编号(由赛区组委会评阅前进行编号):2012高教社杯全国大学生数学建模竞赛编 号 专 用 页赛区评阅编号(由赛区组委会评阅前进行编号):赛区评阅记录(可供赛区评阅时使用):评阅人评分备注全国统一编号(由赛区组委会送交全国前编号):全国评阅编号(由全国组委会评阅前进行编号):葡萄酒的评价摘要酿酒葡萄的好坏与所酿葡萄酒的质量有直接的关系,本文主要探讨酿酒葡萄与葡萄酒质量的联系。问题一:(1)对于两组评酒员的评价结果有无显著性差异,采用基于成对数据的t检验法,从而得出两组评分结果无显著差异。(2)对于两组评分结果哪一个更可信,从两方面考虑,一方面通过求出总方差和的大小来判定其稳定性;另一方面采用克龙巴赫的信度系数,分别求出两组评分的信度系数。综合考虑这两个方面,得出第二组评分较为可信。问题二:(1)为了简化酿酒葡萄的理化指标,采用主成分分析法,得出酿酒葡萄的八个主要成分,这八个主要成分涵盖的信息量超过了理化指标总信息量的85%。(2)为了划分酿酒葡萄的等级,将酿酒葡萄的主成分与葡萄酒的评分采用多元线性回归模型进行拟合,由于拟合出的评分与实际评分之间仍存在一定误差,所以取拟合值和实际值的平均值作为酿酒葡萄的最终评分,最后再根据评分来划分葡萄等级。问题三:对于酿酒葡萄和葡萄酒的理化指标之间的关系,采用BP神经网络模型,对酿酒葡萄的主要成分作为输入层,相对应的葡萄酒的理化指标作为输出层,进行多达上万次训练拟合,得出的训练值与实际值非常吻合,其相对误差在0.06%以下。问题四:(1)对于探讨酿酒葡萄和葡萄酒的理化指标对葡萄酒质量的影响,首先我们假设葡萄酒的质量与酿酒葡萄和葡萄酒的理化指标、酿酒葡萄和葡萄酒的芳香物质这四个方面的因素有关,采用BP神经网络模型,最后得出相对误差小于0.5%。接下来取消酿酒葡萄和葡萄酒的芳香物质对葡萄酒质量的影响,其他条件不变,最后得出酿酒葡萄和葡萄酒的理化指标对葡萄酒质量的影响很大。(2)对于论证能否用葡萄和葡萄酒的理化指标来评价葡萄酒的质量,定义了酿酒葡萄和葡萄酒的理化指标对葡萄酒质量的影响程度,最后得出,其最小影响程度大于89%,即芳香物质对葡萄酒的质量影响较小,所以可以利用酿酒葡萄和葡萄酒的理化指标来评价葡萄酒的质量。关键词:t检验 信度系数 主成分分析 BP神经网络 GA优化BP神经网络一、问题重述如何评判葡萄酒质量的好坏一般是通过聘请一批资深的评酒员,每个评酒员在对葡萄酒进行品尝后对其分类指标打分,然后求和得到其总分,从而确定葡萄酒的质量。酿酒葡萄的好坏与所酿葡萄酒的质量有直接的关系,葡萄酒和酿酒葡萄检测的理化指标会在一定程度上反映葡萄酒和葡萄的质量。附件中给出了两组评酒员对所抽到葡萄酒样品在进行品尝后的得分情况以及各酿酒葡萄和葡萄酒的理化指标,我们需要解决的问题有以下四个:问题一:分析两组评酒员的评价结果有无显著性差异,哪一组给结果更可信。问题二:根据酿酒葡萄的理化指标和葡萄酒的质量对这些酿酒葡萄进行分级。问题三:分析酿酒葡萄与葡萄酒的理化指标之间的联系。问题四:分析酿酒葡萄和葡萄酒的理化指标对葡萄酒质量的影响,并论证能否用葡萄和葡萄酒的理化指标来评价葡萄酒的质量。二、问题分析针对问题一:(1)对于两组评酒员的评酒结果有无显著差异,我们可以先求出每组葡萄酒的整体评价平均分,通过作图来初步观察两组的差异性,再进一步采用基于成对数据的t检验法来判断两组评分有无显著差异。(2)对于两组评分哪一组更可信,从两个方面来考虑,一方面从每组成员评分之间的稳定性来考虑,这就需要计算出每组针对每种样品酒整体评分的方差,从而确定哪一组更稳定;另一方面,我们采用克龙巴赫系数来评定其可信度,分别算出每组评分的信度系数,通过比较得出哪一组评分较为可信。针对问题二:酿酒葡萄的等级划分与酿酒葡萄的理化指标和葡萄酒样品质量相关,本文综合考虑以下两个方面:(1)对于酿酒葡萄,将其理化指标中的二级指标归纳到一级指标中,这样理化指标就剩29个,但指标还是太多,计算起来非常麻烦,所以先用主成分分析法求出相对较少,但包含了理化指标85%以上信息量的主成分。(2)将得出的酿酒葡萄的主成分与葡萄酒样品的评分进行线性回归分析,得出酿酒葡萄主成分的评价分数表达式。 针对问题三:对于分析酿酒葡萄与葡萄酒的理化指标之间的联系,采用BP神经网络,将问题二中酿酒葡萄的理化指标分析出的主成分作为输入,把葡萄酒的理化指标作为输出,从而建立起两者之间的关系。针对问题四:我们可先假设葡萄酒质量不仅与酿酒葡萄和葡萄酒的理化指标有关,而且与附件三所给出的酿酒葡萄与葡萄酒的芳香物质有关,采用BP神经网络模型,将这四个方面因素作为输入层,葡萄酒质量作为输出层,得出训练值与实际值的分布图,并分析其之间的误差。接下来保留上述模型中各方面因素的评价系数,而将酿酒葡萄和葡萄酒的芳香物质对葡萄酒质量的影响看做零,把酿酒葡萄和葡萄酒的理化指标作为输入层,输出层不变,得出训练值与实际值的分布,再分析两者之间的误差。得出酿酒葡萄和葡萄酒的理化指标对葡萄酒质量的影响分数;最后定义一个酿酒葡萄和葡萄酒的理化指标对葡萄酒质量的影响程度的表达式,来确定这两方面因素对葡萄酒质量的影响率,从而可以判定能否用酿酒葡萄和葡萄酒的理化指标来评价葡萄酒的质量。三、模型假设及符号说明3.1模型假设1假设葡萄酒质量评分分布服从正态分布;2假设葡萄酒酿制时人为因数基本相同;3. 假设样本数据的抽取是随机的,样本分布与主体分布相同;4. 假设本题所给数据都是真实可靠的;3.2 符号说明n 总样品数(红葡萄酒n=27;白葡萄酒n=28)I 葡萄酒样品数(红葡萄酒i=1,227;白葡萄酒i=1,2,328)Di 两组评分员针对第i种样品葡萄酒打分的均值之差 D1,D2Di的均值 两组评分员针对所有样品酒打分的均值差的标准差 表示检测葡萄酒样品总方差 表示第i种葡萄酒的样品方差 主成分分析法求到的第i主成分 采用线性回归模型中的评价分数 线性回归中的系数T 酿酒葡萄和葡萄酒理化指标对葡萄酒质量的影响率 考虑综合四个方面因素时BP训练得出的质量评分。 考虑四个因素时所得评价系数不变,即在的系数基础上只考虑前两个方面时得出的质量评分。四、 模型建立与求解4.1问题一的模型建立及求解4.1.1两组评价结果差异性判断首先求出第一组和第二组针对每个样品酒整体打分的平均值,然后用Matable画出两组数据的具体分布情况,如下图:图一:第一、二组对所抽样的红葡萄酒的整体评价平均分图二:第一、二组对所抽样的白葡萄酒的整体评价的平均分结论:从图一和图二我们很难客观的判断两组评分之间的差异性。进一步我们再采用t检验1来判定两组数据之间有无显著差异:(1)针对第一、二组红葡萄酒样品评分t检验,作如下假设:针对红葡萄酒n=27, 即知拒绝域为 (1)通过计算得到: ;,该t值不在拒绝域,所以两组对红葡萄酒的打分其结果无显差异。(2)第一、二组针对白葡萄酒样品评分的t检验,作如下假设:针对白葡萄酒n=28;即知拒绝域为(2)可以计算得到: ;,所以t值在拒绝域,所以对白酒的打分结果无显著差异。综上所述,我们得出的结论是:两组评酒员的评价结果无显著差异。4.1.2第一、二组可信度评价首先分别对两组评酒员之间评分的稳定性来衡量其可信度,求出第一组和第二组评酒员针对每个样品整体评分的方差,用Matlab画出两组数据针对红、白葡萄酒评分的方差分布图。如下图:图三:第一、二组分别对所抽样的红葡萄酒的整体评价的方差图四:第一、二组分别对所抽样的白葡萄酒的整体评价的方差从上图可观察出第二组评分的方差较小,即第二组评酒员评分的波动性较小,所以,从稳定性来考虑,可判断第二组评酒员的评分相对较稳定。 接下来采用信度系数法来计算两组评分可信度,克龙巴赫的系数2计算公式如下 : (3)红葡萄酒:n=27,i=1,2,327白葡萄酒:n=28,i=1,2,328 经计算得出: 第一组红酒=0.8822 ;第一组白酒=0.9701 ; 第二组红酒=0.9238 ;第二组白酒=0.9614 ;综上所述:通过考虑两组评分的稳定性和信度系数,我们认为第二组数据更为可信。4.2问题二的模型建立及求解4.2.1针对酿酒葡萄理化指标的主成分分析 首先针对酿酒葡萄的理化指标(X1,X2,XP)将其简化合并为29个,接下来采用主成分分析3重新组合一组较少的互不相关的综合指标Fm,其具体计算步骤如下:(1)计算协方差矩阵:=(sij)p´p,其中 i,j=1,2,29 (4) (2)接下来求出该矩阵的特征值及相应的特征向量 (见附录)。则第i个主成分Fi为: (5)主成分的方差(信息)贡献率为: (6)(3)选择主成分:当前m个主成分的累计贡献率到达85%以上时,就认为这m个主成分大体可以反映该信息,G(m)的表达式表述为: (7) 将附件2中数据代入以上模型中(具体程序见附录),分别得出酿酒葡萄的主成分分析图如下:图五:红葡萄酒所用的酿酒葡萄的主成分分布图从上图中选取m=8,即选取F1到F8为主要成分,其信息量可以达到总理化指标85.38%>85%。具体主成分分布见表1:红酒主成分F1F2F3F4F5F6F7F8信息贡献率24.5617.7413.098.5887.105.764.913.64表1:酿红葡萄酒所用的酿酒葡萄的主成分分布图六:白葡萄酒所用的酿酒葡萄的主成分分布图从上图中选取m=8,即选取F1到F8为主要成分,其信息量可以达到总理化指标的95.28%>85%,具体主成分分布见表2:白酒主成分名称F1F2F3F4F5F6F7F8白酒主成分所比重%67.9510.364.884.153.463.002.221.96表2:酿白葡萄酒所用酿酒葡萄的主成分分布4.2.2针对酿酒葡萄主成分与葡萄酒得分之间的多元线性回归模型酿酒葡萄在一定程度上影响了葡萄酒的质量,本文将酿酒葡萄的主成分和较为可信的第二组评酒员评分联系起来,采用多元线性回归模型,把主成分分析得到的主成分看做线性回归因子来模拟葡萄酒样品的分数。最后得出酿酒葡萄的初步得分情况。酿酒葡萄的评价分数表达式为: (8)(1)针对酿酒葡萄的线性回归分析以及等级评判用Matlab软件求解得出酿制红葡萄酒所用葡萄的评价分数表达式以及红葡萄酒的得分与酿酒葡萄之间的线性回归分析图如下:酿酒葡萄的评分表达式可表示为: (9)图七:线性回归拟合值与实际值(红葡萄酒的评分)的比较图八:线性回归拟合值与实际值之间的误差分布 从图七和图八中可以看出多元线性回归的结果和实际值之间的差值相对不太大,为了进一步减小误差,我们采用取两者均值的方式作为酿酒葡萄的整体评价得分(见附录)。综合红葡萄酒所用的酿酒葡萄的整体评价打分情况,得出其分数区间为65.575,82.33。将此区间4等分,得出四个区间65.575,69.764、(69.764,73.952、(73.952,78.141、(78.141,82.33。由此得出葡萄的四个等级,如下表: 分数区间65.575,69.764(69.764,73.952(73.952,78.141(78.141, 82.33酿酒葡萄等级差中良优表3:等级划分标准(红)酿酒葡萄等级的划分结果如下表:酿酒葡萄样品序号123456789最后得分68.0475.3477.1370.5571.8267.8665.5768.8782.33等级差良良中中差差差优酿酒葡萄样品序号101112131415161718最后得分71.4166.9267.6673.2473.3366.2170.974.766.5等级中差差中中差中良差酿酒葡萄样品序号192021222324252627最后得分72.52575.474.7171.4980.8369.5672.2970.7372.555等级中良良中优差中中中表4:(红)酿酒葡萄的等级划分表(2)针对白葡萄酒的酿酒葡萄的线性回归分析以及等级评判用Matlab软件求解得出酿制红葡萄酒所用葡萄的评价分数表达式以及红葡萄酒的得分与酿酒葡萄之间的线性回归分析图九、十: (10)图九:线性回归拟合值与实际值(白葡萄酒的评分)的比较图十:线性回归拟合值与实际值之间的误差分布 从图九和图十中可以看出多元线性回归的结果和实际值之间的的差值相对不大,为进一步减小误差,我们采用取两者均值的方式作为酿酒葡萄的整体评价得分(见附录)。综合白葡萄酒所用酿酒葡萄的整体得分情况,得出其分数区间为69.545,80.805。(同红葡萄酒的酿酒葡萄处理方法)由此得出葡萄的四个等级,如下表:分数区间69.545,72.36(72.36,75.175(75.175,77.99(77.99,80.805葡萄等级差中良优表5:划分等级标准(白)酿酒葡萄等级的划分结果如下表:酿酒葡萄样品序号12345678最后得分77.6675.9876.9176.86580.80576.8774.8172.275等级良良良良优良中差酿酒葡萄样品序号910111213141516最后得分77.94577.86573.23574.58575.1976.70576.8469.545等级良良中中良良良差酿酒葡萄样品序号1718192021222324最后得分79.5276.09576.0377.96578.8578.6577.11576.11等级优良良良优优良良酿酒葡萄样品序号25262728最后得分77.7974.4178.3278.1等级良中优优表6:(白)酿酒葡萄的等级划分表4.3 问题三的模型建立及求解(BP神经网络算法)本文针对问题三采用BP神经网络算法,将酿酒葡萄的主成分作为输入,葡萄酒的理化指标作为输出建立BP算法,可以得出酿酒葡萄与葡萄酒的理化指标之间的联系。4.3.1红葡萄酒的BP神经网络模型4首先将问题二中利用主成分分析法得出的8个主成分作为输入,将附件二中给出的红葡萄酒的9个理化指标作为输出,建立四层BP算法。本BP算法输入层为8个节点,输出层为9个节点,内部含有两个隐含层,隐含层的节点数都是12个。(程序见附录,本算法学习效率是0.05,经过100000次运算整体误差达到0.0543%)首先针对单宁进行BP运算,得到BP训练值和葡萄酒的理化指标的实际值,比较结果如图十一、十二:(注示:节点处为“”的曲线代表实际值,节点处为“”的曲线代表BP训练值)图十一: BP训练值与红葡萄酒中的单宁实际值的对比图十二:BP训练值与单宁的实际值的相对误差分布接下来我们把所有的指标都进行考虑,得出酿酒葡萄主成分的BP运算值和葡萄酒中所有理化指标的实际值,比较结果如下图:(注示:节点处为“”曲线代表实际值,节点处为“”的曲线代表BP训练值)图十三:BP训练值和所有理化指标实际值的对比图十四:BP训练值和所有理化指标实际值的相对误差分布结论:从上图我们可以看出,运用BP神经网络算法得到的训练值与实际值非常吻合,经过100000次的运算,其误差只有0.0543%。4.3.2白葡萄酒的BP神经网络模型本文在此首先将酿酒白葡萄利用主成分分析法中得出的8个主成分作为输入,将附件二中给出的白葡萄酒的8个理化指标作为输出,建立四层BP算法。本BP算法输入层为8个节点,输出层为8个节点,内部含有两个隐含层,隐含层的节点数都是12个。(程序见附录,本算法学习效率是0.05,经过27817次运算整体误差达到0.01%)本文首先针对单宁进行BP运算,得到BP训练值和葡萄酒的理化指标的实际值,比较结果如下图:(注示:节点处为“”曲线代表实际值,节点处为“”的曲线代表BP训练值)图十五: BP训练值与白葡萄酒中的单宁实际值的对比图十六:BP训练值与单宁的实际值的相对误差分布接下来我们把所有的指标都进行考虑,得出酿酒葡萄主成分的BP运算值和葡萄酒中所有理化指标的实际值,比较结果如下图:(注示:节点处为“”曲线代表实际值,节点处为“”的曲线代表BP训练值)图十七:BP训练值和所有理化指标实际值的对比图十八:BP训练值和所有理化指标实际值的相对误差分布结论:从上图我们可以看出,运用BP神经网络算法得到的训练值与实际值非常吻合,经过27817次运算,其整体误差只有0.01%。综合红葡萄酒和白葡萄酒的BP神经网络算法,我们可以看出该模型得出的结果与实际值非常接近,两者之间误差很小,尤其是对于白葡萄酒,BP训练值与实际值在经过27817次运算整体误差就已经小到0.01%。所以该模型对于解决此问题起到了非常好的效果。4.4问题四的模型建立及求解4.4.1 BP神经网络模型建立首先假设葡萄酒的质量与酿酒葡萄的理化指标、葡萄酒的理化指标、酿酒葡萄的芳香物质及葡萄酒的芳香物质四个因素有关,采用BP神经网络算法,将酿酒葡萄经主成分分析后得到的8个主成分、葡萄酒的理化指标(在此只考虑一级指标,红葡萄酒理化指标有9个,白葡萄酒有8)、酿酒葡萄所含芳香物质的总量、葡萄酒所含芳香物质总量作为输入层,将第二组评酒员针对葡萄酒的评分作为输出层,来分析BP训练值与实际值之间的差异。输入层中红葡萄有19个节点,白葡萄有18个节点;本网络共有四层,两个隐含层都是8个节点。训练精度是0.01%,学习速度0.05,运算次数375。以红酒为例得出如下一系列图形,白酒情况见附录。图十九:综合考虑四方面因素的BP训练评分与实际评分的对比(红)图二十:综合考虑四方面因素的BP训练评分的相对误差分布(红)从上图得出,考虑四方面因素的BP训练分数与实际值吻合效果非常好,其误差最大不超过0.5%。接下来我们令上述得出各因素评价系数不变,采用BP神经网络模型,将酿酒葡萄的主成分和葡萄酒的理化指标作为输入层,将酿酒葡萄的芳香物质和葡萄酒的芳香物质对葡萄酒评分质量的影响用零来代替,将葡萄酒的评分质量作为输出层。输入层中红葡萄有19个节点,白葡萄有18个节点;本网络共有四层,两个隐含层都是8个节点。训练精度是0.01%,学习速度0.05,运算次数375。以红酒为例得出如下一系列图形,白酒情况见附录。图二十一:酿酒葡萄和葡萄酒理化指标BP训练得到评分与实际评分对比图二十二: 酿酒葡萄和葡萄酒理化指标BP训练得到评分与实际评分的误差分布从上图看出,在保留系数不变的情况下,只考虑酿酒葡萄和葡萄酒的理化指标这两个因素,经BP训练得出的分数与实际值吻合效果较好,两者相对误差率在14%之内。4.4.2酿酒葡萄和葡萄酒的理化指标对葡萄酒质量的影响程度的计算为了求出酿酒葡萄和葡萄酒的理化指标对葡萄酒质量的影响程度,我们定义其影响程度用下列式子来表示: (11)是指对于的偏离程度,偏离程度越大则影响程度越低。用Matlab软件作图得出酿酒葡萄与葡萄酒的理化指标对葡萄酒的影响率如下图:图二十三:(红)酿酒葡萄和葡萄酒理化指标对葡萄酒质量的影响程度从图中分析得出:酿酒葡萄和葡萄酒的理化指标对葡萄酒质量的影响程度较大,最小时其影响程度达到89%。综上所述,我们可以得出葡萄酒和酿酒葡萄的理化指标对葡萄酒的质量也起到了决定性的作用,而酿酒葡萄和葡萄酒的芳香物质对葡萄酒的质量有少许的影响,所以可以利用酿酒葡萄和葡萄酒的理化指标来评价葡萄酒的质量。五、模型检验及改进5.1 BP模型的检验本文在此以第四问中的白酒为例:图二十四:综合考虑四方面因素的BP训练评分与实际评分的对比(白)图二十五:综合考虑四方面因素的BP训练评分的相对误差分布(白)从白酒的实际打分值和BP训练值的比较图以及BP训练值的相对误差可以明显得出白酒的实际打分值与BP训练值是十分的接近。说明本文的BP模型是十分精确可靠的。5.2 BP模型的改进因为BP神经网络容易出现陷入局部极小值的情况,为了求得一个比较理想的全局值,本文在此引入遗传算法对BP神经网络进行优化。在代码的实现方面本文主要分为三个方面,1.、GA训练BP权值的主函数,2、适应值函数,3、编解码函数。遗传优化BP模型的结果如下:图二十六:遗传优化BP模型的训练值与实际值的比较图图二十七:遗传优化BP模型的训练值与实际值的相对误差通过分析上面两幅图形,可以看出遗传优化BP模型的训练结果与实际值是十分的接近的,而且在达到相同精度的情况下,遗传优化BP模型所需要的时间远小于BP神经网络的时间。本文第四问中红葡萄的BP神经网络用了5s,而达到相同精度下遗传优化BP模型耗时趋近于0s。显然,经过改进后的BP神经网络模型具有很强的优势。六、模型评价优点:1. 本模型运用BP神经网络,方法新颖,准确度极高;2. 本模型能很好的分析数据之间的关系;3. 本模型操作简单,实用性高;4. 本模型具有很好的可移植性,能广泛运用于其它方面;缺点:1. 本模型考虑参数时可能出现了遗漏情况;2. 本模型采用BP神经算法,对于相同数据的不同时候计算会有一点差异;七、参考文献1盛骤 谢式千 潘承毅,概率论与数理统计,出版地:高等教育出版社,2008.6。2关守义,克龙巴赫A系数研究述评,心理科学,卷期号:32(3),685-687页,2009。3吴海建,主成分分析的基本思想及应用实例,河南省情与统计,30-31页,2003.4。4卓进武,Matlab在数学建模中的应用,出版地:北京航空航天大学出版社,2011.4。八、附录9.1问题一的代码及数据: 9.1.1 问题一的代码:(1)用matlab软件求解红葡萄酒的整体评价平均分gr_rw1=62.7 80.3 80.4 68.6 73.3 72.2 71.5 72.3 81.5 74.5 70.1 53.9 74.6 73 58.7 74.9 79.3 60.1 78.6 79.2 77.1 77.2 85.6 78 69.2 73.8 73;gr_rw2=68.1 74 74.6 71.2 72.1 66.3 65.3 66 78.2 68.8 61.6 68.3 68.8 72.6 65.7 69.9 74.5 65.4 72.6 75.8 72.2 71.6 77.1 71.5 68.2 72 71.5;figure('Color',1 1 1);title('红葡萄酒整体评价');hold on;grid on;plot(gr_rw1,'r+');plot(gr_rw2,'b*');xlabel('红葡萄酒标号');ylabel('整体评价平均分');legend('第一组','第二组');(2)用Matlab软件求解红葡萄酒的整体评价方差er_rw1=92.90 39.79 45.82 108.04 62.01 59.73 103.61 44.01 32.94 30.40 89.79 79.66 44.93 36.00 85.57 18.10 88.01 47.21 47.38 26.04 116.10 50.62 32.49 74.89 64.62 31.29 49.78;er_rw2=81.88 16.22 30.71 41.29 13.66 21.12 62.68 65.11 25.73 36.18 38.04 25.12 15.29 23.16 41.34 20.10 9.17 50.27 55.16 39.07 35.51 24.27 24.77 10.72 43.73 41.34 41.34 ;figure('Color',1 1 1);title('红葡萄酒整体评价方差','fontsize',18);hold on;grid on;plot(er_rw1,'r+');plot(er_rw2,'b*');xlabel('红葡萄酒标号','fontsize',14);ylabel('整体评价方差','fontsize',14);legend('第一组','第二组','fontsize',14);9.1.2 t检验的数据:第一、二组平均分差值:序号样品1样品2样品3样品4样品5样品6样品7样品8样品9差值Di5.46.35.82.61.25.96.26.33.3序号样品10样品11样品12样品13样品14样品15样品16样品17样品18差值Di5.78.514.45.80.4754.85.3序号样品19样品20样品21样品22样品23样品24样品25样品26样品27差值Di63.44.95.68.56.511.81.5表:第一、二组对所抽样的红葡萄酒的整体评价平均分之差序号样品1样品2样品3样品4样品5样品6样品7样品8样品9样品10差值Di4.11.69.72.510.57.13.30.97.55.5序号样品11样品12样品13样品14样品15样品16样品17样品18样品19样品20差值Di0.99.185.166.31.53.64.21.2序号样品21样品22样品23样品24样品25样品26样品27样品28差值Di2.88.41.52.82.4712.21.7表:第一、二组对所抽样的白葡萄酒的整体评价平均分之差9.2问题二的代码9.2.1用Matlab求解主成分分析clear;clc;load dataset;std1=corrcoef(dataset);vec,val=eig(std1);newval=diag(val);eigenvalue=newval;per=100*eigenvalue/sum(eigenvalue); %求出成分载荷矩阵per=per'cumsum(per); %列出各主成分的累积贡献率 figure('Color',1 1 1);hold on;pareto(per); %将贡献率绘成直方图title('酿制红葡萄酒用的葡萄主成分分析','fontsize',18);xlabel('序号','fontsize',14);ylabel('分数','fontsize',14);legend('分数直方图','前N项分数和');92.2多元线性回归代码clear;clc;load grape;grape_r=62.7 80.3 80.4 68.6 73.3 72.2 71.5 72.3 81.5 74.2 70.1 53.9 74.6 73.0 58.7 74.9 79.3 60.1 78.6 79.2 77.1 77.2 85.6 78.0 69.2 73.8 73.0;%进行多元线性回归算法grade=ones(length(grape_r),1),. grape(:,1),grape(:,2),grape(:,3),grape(:,4),grape(:,5),grape(:,6),grape(:,7),grape(:,8); b,bint,r,rint,stats=regress(grape_r',grade);%将得到的系数b代入yy=0;n m=size(b);for ii=1:n; yy=yy+b(ii).*grade(:,ii)'end;resoult=yy;figure('Color',1 1 1);hold on;grid on;title('红酒多元线性回归分析','fontsize',18);plot(yy,'*');plot(grape_r,'o');xlabel('样品序号','fontsize',14);ylabel('葡萄酒总分数','fontsize',14);legend('多元线性回归结果','实际值','fontsize',14);figure('Color',1 1 1);hold on;grid on;title('红酒多元线性回归相对误差','fontsize',18);plot(yy-grape_r)./grape_r,'*');xlabel('样品序号','fontsize',14);ylabel('相对误差','fontsize',14);9.3问题三的代码:9.3.1 用Matlab求解BP神经网络算法clear;clc;load p.mat;load t.mat;% load ptest.mat;p=p'ptest=p;t=t'pn,minp,maxp,tn,mint,maxt=premnmx(p,t); %将数据归一化 NodeNum1 =12; % 隐层第一层节点数 % NodeNum2=8; % 隐层第二层节点数 % ,NodeNum2TypeNum =12; % 输出维数 TF1 = 'tansig'TF2 = 'tansig' TF3 = 'tansig'TF3 = 'purelin'a=minmax(pn);net=newff(minmax(pn),NodeNum1 TypeNum 9,TF1 TF2 TF3,'traingdx');%网络创建traingdm net.trainParam.show=1000; net.trainParam.epochs=100000; %训练次数设置 net.trainParam.goal=1e-4; %训练所要达到的精度net.trainParam.lr=0.05; %学习速率 net=train(net,pn,tn); p2n=tramnmx(ptest,minp,ma