全国大学生数学建模竞赛题葡萄酒评价答案.docx
《全国大学生数学建模竞赛题葡萄酒评价答案.docx》由会员分享,可在线阅读,更多相关《全国大学生数学建模竞赛题葡萄酒评价答案.docx(25页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、数学试验计算机科学及技术成员:xxx学号:xxxxxxxxxx葡萄酒的评价摘要本文主要探讨的是如何对葡萄酒进展评价的问题。通过对评酒员的评分及酿酒葡萄的理化指标和葡萄酒的理化指标等原始数据进展统计、分析和处理,我们得出了一个较为合理地评价葡萄酒质量优劣的模型。在问题一中,我们采纳T检验法,首先进展正态分布拟合检验,推断出它们听从正态分布。之后,我们通过T检验法推断出了两组评酒员的评价结果具有显著性差异。而对于如何推断哪一组评酒员的评价结果更可信,由于评酒员评分的客观性,我们通过计算评酒员评分均值的置信区间,利用置信区间的长短来推断评分的可信程度。置信区间越窄,说明其越可信。利用Matlab软件
2、求出了第二组评酒员的评分均值的置信区间更窄,所以第二组评酒员的评价结果更可信。在问题二中,我们采纳主成分分析法,把给定的一组相关变量通过线性变换转成另一组不相关的变量,这些新的变量再根据方差依次递减的依次排列。在数学变换中保持变量的总方差不变,使第一变量具有最大的方差。第二变量的方差次大,并且和第一变量不相关。由于变量较多,虽然每个变量都供应了肯定的信息,但其重要性有所不同。依次类推,最终我们将酿酒葡萄分为了四个等级:优质、次优、中等、下等。在问题三中,我们通过多项式曲线拟合的方法,构造一个以葡萄酒的理化指标为自变量,酿酒葡萄的理化指标为因变量的函数,并利用Matlab软件进展曲线拟合,最终得
3、出酿酒葡萄及葡萄酒的理化指标之间的关系为呈线性正相关。在问题四中,我们用无交互作用的双因素试验的方差分析方法,通过对观测、比较、分析试验数据的结果,鉴别出了两个因素在程度发生改变时对试验结果产生显著性影响的大小程度。最终,我们认为能用酿酒葡萄和葡萄酒的理化指标来评价葡萄酒的质量,且酿酒葡萄的理化指标对葡萄酒质量影响相对葡萄酒的理化指标更显著。关键词:T检验法,Matlab,正态分布,主成分分析法,多项式曲线拟合,方差分析一 问题的重述确定葡萄酒质量时一般是通过聘请一批有资质的评酒员进展品评。每个评酒员在对葡萄酒进展品味后对其分类指标打分,然后求和得到其总分,从而确定葡萄酒的质量。酿酒葡萄的好坏
4、及所酿葡萄酒的质量有干脆的关系,葡萄酒和酿酒葡萄检测的理化指标会在肯定程度上反映葡萄酒和葡萄的质量。附件1给出了某一年份一些葡萄酒的评价结果,附件2和附件3分别给出了该年份这些葡萄酒的和酿酒葡萄的成分数据。请尝试建立数学模型探讨以下问题:1. 分析附件1中两组评酒员的评价结果有无显著性差异,哪一组结果更可信?2. 根据酿酒葡萄的理化指标和葡萄酒的质量对这些酿酒葡萄进展分级。3. 分析酿酒葡萄及葡萄酒的理化指标之间的联络。4分析酿酒葡萄和葡萄酒的理化指标对葡萄酒质量的影响,并论证能否用葡萄和葡萄酒的理化指标来评价葡萄酒的质量?附件1:葡萄酒品味评分表含4个表格附件2:葡萄和葡萄酒的理化指标含2个
5、表格附件3:葡萄和葡萄酒的芳香物质含4个表格二 根本假设及符号说明2.1 根本假设1评酒员的评分是客观公正的,不受任何外界因素影响。2用来检验的葡萄都是刚采摘的簇新葡萄,葡萄酒也没有遭遇任何污染。3在检测酿酒葡萄和葡萄酒的理化指标的过程中,忽视由于人为操作不当带来的误差。4由于不是每组数据都对葡萄酒的质量产生很大影响,所以在处理数据过程中,忽视那些影响不是很明显的理化指标。2.2 符号说明 第组评酒员对各品种红葡萄酒的评分均值的期望 第组评酒员对各品种红葡萄酒的评分均值的方差 问题一的假设 第个主成分 第个评酒员对第种酒的评分三 问题的分析针对问题一,如何推断两组评酒员的评价结果有无显著性差异
6、,我们采纳T检验法进展推断。但采纳T检验法的前提是其必需听从正态分布,方差未知且相等。所以我们先对那些数据进展正态分布检验,推断其是否听从正态分布。验证听从正态分布后,我们利用T检验法推断两组评酒员评价结果的显著性差异。对于如何推断哪一组评酒员的评价结果更可信,由于评酒员评分的客观性,我们通过计算评酒员评分均值的置信区间,利用置信区间的长短来推断评分的可信程度。置信区间越窄,说明其越可信。针对问题二中如何根据酿酒葡萄的理化指标和葡萄酒的质量对酿酒葡萄进展分级,我们采纳主成分分析法。因为在实际问题的探讨中,往往会涉及众多有关的变量。但是,变量太多不但会增加计算的困难性,而且也会给合理地分析问题和
7、说明问题带来困难。一般说来,虽然每个变量都供应了肯定的信息,但其重要性有所不同,而在许多状况下,变量间有肯定的相关性,从而使得这些变量所供应的信息在肯定程度上有所重叠。因此人们盼望对这些变量加以“改造,用为数极少的互补相关的新变量来反映原变量所供应的绝大部分信息,通过对新变量的分析到达解决问题的目的。解决这个问题的过程中,我们用Matlab软件实现主成分分析,我们对那些理化指标进展重新整理,求出各个理化指标的之间的相关系数、特征值及特征向量和奉献率等。针对问题三中如何分析酿酒葡萄及葡萄酒的理化指标之间的联络,我们想到了用多项式曲线拟合的方法,根据两者理化指标实测样本,用统计分析的方法,找出一种
8、适当的函数关系从而到达处理酿酒葡萄及葡萄酒之间相关关系的目的。实际的操作过程中,我们首先构造一个关于酿酒葡萄及葡萄酒的理化指标的函数,以葡萄酒的理化指标为自变量,酿酒葡萄的理化指标为因变量,利用Matlab软件进展曲线拟合,得出酿酒葡萄及葡萄酒的理化指标之间的关系。针对问题四中如何分析酿酒葡萄和葡萄酒的理化指标对葡萄酒质量的影响,以及能否用酿酒葡萄和葡萄酒的理化指标来评价葡萄酒的质量,我们采纳无交互作用的双因素试验的方差分析方法。用方差分析,可以将影响葡萄酒的主要因素和次要因素区分开来,还可以分别算出酿酒葡萄的理化指标和葡萄酒的理化指标及葡萄酒质量之间的误差,假如误差在可承受范围之内,即说明可
9、以用酿酒葡萄和葡萄酒的理化指标来评价葡萄酒质量。四 模型的建立及求解4.1 问题一的模型建立及求解 T检验法的模型建立及求解T检验是用T分布理论来推论差异发生的概率,从而比较两个均值的差异是否显著。由于检验红葡萄酒及白葡萄酒的方法和模型一样,这里我们只给出检验红葡萄酒的模型。1. 正态分布的检验由于运用T检验法的前提是两个总体分布都听从正态分布,我们先利用Excel软件计算出:第一组评酒员对各品种红葡萄酒的评分均值为:62.7,80.3,80.4,68.6,73.3,73.2,71.5,72.3,81.5,74.2,70.1,53.9,74.6,73,58.7,74.9,79.3,59.9,7
10、8.6,78.6,77.1,77.2,85.6,78,69.2,73.8,73第二组评酒员对各品种红葡萄酒的评分均值为:,74,66,75.8,72, 然后我们利用Matlab软件里的正态分布拟合函数进展曲线拟合,得出其正态分布的拟合曲线图为图一:图一、正态分布拟合曲线图 从图中我们知道其曲线近似为一条直线,因此我们认为评酒员对红葡萄酒以及白葡萄酒的评分均值都听从正态分布。2. T检验法模型的建立及求解设,分别为第一组、第二组评酒员对各品种红葡萄酒的评分均值,且,其中均未知。(1) 作出统计假设。(2) 选取统计量(3) 对于给定的显著性程度,我们利用Matlab软件进展计算求解。结果如下表所
11、示: 葡萄酒的品种H值P值差异显著程度第一组红葡萄酒0差异不显著第二组红葡萄酒第一组白葡萄酒1差异特别显著第二组白葡萄酒 H=0,表示承受原假设;H=1,表示承受背择假设。由上表可知:红葡萄酒之间不存在显著性差异,白葡萄酒之间存在显著性差异。4.1.2 可信度的断定由于样本的置信区间及其可信度是呈负相关的,即置信区间越小,其可信度越大。我们利用Matlab软件求解得出第一组、第二组红葡萄酒和白葡萄酒的置信区间,见下表:葡萄酒的置信区间红葡萄酒的置信区间白葡萄酒的置信区间第一组70.3377,75.773472.3342,76.1872第二组69.6890,71.960775.3788,77.6
12、855明显第二组的置信区间长度小于第一组,所以第二组评酒员的评价结果可信度更高。4.2 问题二的模型建立及求解主成分分析法是一种数学变换的方法, 它把给定的一组相关变量通过线性变换转成另一组不相关的变量,这些新的变量根据方差依次递减的依次排列。在数学变换中保持变量的总方差不变,使第一变量具有最大的方差,称为第一主成分,第二变量的方差次大,并且和第一变量不相关,称为第二主成分。依次类推,I个变量就有I个主成分。1.计算相关系数矩阵 1在1式中,为原变量的及之间的相关系数,其计算公式为 2因为R是实对称矩阵即,所以只需计算上三角元素或下三角元素即可。2.计算特征值及特征向量首先解特征方程,通常用雅
13、可比法求出特征值,并使其按大小依次排列,即。然后分别求出对应于特征值的特征向量。这里要求=1,即,其中表示向量的第个重量。3.计算主成分奉献率及累计奉献率奉献率:第个主成分方差在全部方差中所占的比重称为奉献率。这个值越大,说明第个主成分综合信息的实力越强。主成分的奉献率为 3累积奉献率:前个主成分共有多大的综合实力,用这个主成分的方差和在全部方差中所占的比重来描绘,说明取前个主成分根本包含了全部测量指标所具有信息的百分率。累计奉献率为 4一般取累计奉献率达的特征值所对应的第一、第二,第个主成分。4.计算主成分载荷主成分载荷是反映主成分及元变量之间的互相关联程度。其计算公式为 5于是Matlab
14、软件求解,分别得出红葡萄及白葡萄所分的主成分、特征值、奉献率以及累计奉献率,结果见下表一及表二:表一 红葡萄主成分的特征值、奉献率及累计奉献率主成分特征值奉献率/%累计奉献率/%93.83%93.83%03.35%97.18%2.38%99.56%0.27%99.83%0.09%99.92%0.04%99.96%0.03%99.99%0.01%100%由上表可看出,主成分所占的累计奉献率已高达93.83%大于85%,故只需求出第一主成分即可。,再用公式计算各变量,在主成分上的载荷为:,第一主成分及都呈现正相关性。因此我们认为:载荷即果穗质量及主成分有极强的正相关。所以,我们根据的含量程度为葡萄
15、进展排名:排名如下样品编号果穗质量/g红葡萄样品26红葡萄样品24红葡萄样品5红葡萄样品17红葡萄样品20红葡萄样品25红葡萄样品27红葡萄样品23红葡萄样品10红葡萄样品8红葡萄样品14红葡萄样品6红葡萄样品18红葡萄样品12红葡萄样品9红葡萄样品1红葡萄样品11红葡萄样品19红葡萄样品13红葡萄样品15红葡萄样品21红葡萄样品4红葡萄样品16红葡萄样品22红葡萄样品3红葡萄样品2红葡萄样品7因此根据以果穗质量的含量程度为重要指标,我们得出红葡萄品质级别如下表:红葡萄等级排名红萄萄品质级别果穗质量/g优质红葡萄以上次优红葡萄中等红葡萄下等红葡萄同理,我们也可以得到白葡萄所分的主成分、特征值、
16、奉献率以及累计奉献率,结果见下表: 表二 白葡萄主成分的特征值、奉献率及累计奉献率主成分特征值奉献率/%累计奉献率/%94.99%94.99%2.30%97.29%1.89%99.18%0.6%99.78%0.18%99.96%0.03%99.99%0.01%100%由上表可看出,主成分所占的累计奉献率已高达94.99%大于85%,故只需求出第一主成分即可。,再用公式计算各变量在主成分上的载荷为:,第一主成分及都呈现正相关性。因此我们认为:载荷即单宁含量及主成分有极强的正相关。所以,我们根据的含量程度为葡萄进展排名结果如下白葡萄单宁(mmol/kg)葡萄样品248.506 葡萄样品106.78
17、1 葡萄样品226.463 葡萄样品276.251 葡萄样品185.783 葡萄样品265.517 葡萄样品74.729 葡萄样品284.583 葡萄样品64.502 葡萄样品94.434 葡萄样品233.389 葡萄样品113.312 葡萄样品123.212 葡萄样品43.148 葡萄样品203.141 葡萄样品32.990 葡萄样品12.947 葡萄样品252.757 葡萄样品152.751 葡萄样品52.626 葡萄样品142.388 葡萄样品172.247 葡萄样品22.239 葡萄样品162.228 葡萄样品192.217 葡萄样品132.129 葡萄样品211.952 葡萄样品81
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 全国大学生 数学 建模 竞赛题 葡萄酒 评价 答案
限制150内