全国数学建模竞赛论文.docx
全国数学建模竞赛论文(数学建模)课程论文葡萄酒的评价院系:数学与计算机科学学院专业:数学与应用数学班级:2020级数学与应用数学(1)班组员:杨楠马玲张霞日期:2021年4月29日葡萄酒的评价确定葡萄酒质量时一般是通过聘请一批有资质的评酒员进行品评。每个评酒员在对葡萄酒进行品尝后对其分类指标打分,然后求和得到其总分,进而确定葡萄酒的质量。酿酒葡萄的好坏与所酿葡萄酒的质量有直接的关系,葡萄酒和酿酒葡萄检测的理化指标会在一定程度上反映葡萄酒和葡萄的质量。附件1给出了某一年份一些葡萄酒的评价结果,附件2和附件3分别给出了该年份这些葡萄酒的和酿酒葡萄的成分数据。请尝试建立数学模型讨论下列问题:1.分析附件1中两组评酒员的评价结果有无显著性差异,哪一组结果更可信?2.根据酿酒葡萄的理化指标和葡萄酒的质量对这些酿酒葡萄进行分级。3.分析酿酒葡萄与葡萄酒的理化指标之间的联络。4分析酿酒葡萄和葡萄酒的理化指标对葡萄酒质量的影响,并论证能否用葡萄和葡萄酒的理化指标来评价葡萄酒的质量?附件1:葡萄酒品尝评分表含4个表格附件2:葡萄和葡萄酒的理化指标含2个表格附件3:葡萄和葡萄酒的芳香物质含4个表格葡萄酒的评价摘要:本文通过运用统计学的方法对数据进行一系列的整理和分析,建立了对葡萄酒评价的分析模型。问题一的求解经过中,首先将数据做标准化的处理,利用excle绘图工具,方差分析方法和采用spss软件对两组评酒员的评价结果做出了合理的分析。在方差分析经过中,对sig和的值0.05做比拟,将统计量F的值进行互相比拟,最终得出结论为第二组的的结果更可信。问题二运用主成分分析(PCA)法对27个红葡萄酒的指标用软件spss经主成分分析后得到27个主成分,累计奉献率为80.96%具有统计学上的意义。再根据分级的标准,将酿酒的葡萄分出不同的级别。问题三利用软件spss做相关性分析,从结果的表中能够分析出酿酒葡萄与葡萄酒的理化指标具有显著相关性。问题四我们用类似问题三的方法进行相关分析,所以我们得出葡萄酒的理化指标对葡萄酒质量有明显的影响,葡萄对葡萄酒质量有显著影响。关键字:统计方法方差分析模型主成分模型指标一问题重述一般讲来确定葡萄酒质量时通常是通过聘请一批有资质的评酒员进行评价。每个评酒员在对葡萄酒进行品尝后对其分类指标打分,然后求和得到其总分,进而确定葡萄酒的质量。酿酒葡萄的好坏与所酿葡萄酒的质量有直接的关系,葡萄酒和酿酒葡萄检测的理化指标会在一定程度上反映葡萄酒和葡萄的质量。附件1给出了某一年份一些葡萄酒的评价结果,附件2和附件3分别给出了该年这些葡萄酒的和酿酒葡萄的成分数据。根据题意,本文解决的问题如下1.分析附件1中两组评酒员的评价结果有无显著性差异,哪一组结果更可信?2.根据酿酒葡萄的理化指标和葡萄酒的质量对这些酿酒葡萄进行分级。3.分析酿酒葡萄与葡萄酒的理化指标之间的联络。4分析酿酒葡萄和葡萄酒的理化指标对葡萄酒质量的影响,并论证能否用葡萄和葡萄酒的理化指标来评价葡萄酒的质量?二问题假设1.忽略土壤,地域,等环境因素对葡萄,葡萄酒的质量的影响。2.葡萄酒质量只与感官指标,理化指标有关,忽略不计卫生指标等对酒的质量的影响,在附件中给出的附件表中,只反响了这两种指标,所以只考虑这两种因素的影响。3.在检测葡萄酒和酿酒葡萄所含指标的经过中,不存在较大的误差,以保证数据一定的完好性。4.评酒的先后对打分的情况没有影响,评酒员不带有感情主观上的判定。5.酿酒的方式及酿酒经过对葡萄酒的质量无影响。三符号讲明1.1X为评价指标2.X为平均数3.ijX是从正态分布的总体中抽取的样本数4.Xj是在A因素影响的均值5.SSA称为因素A的效应平方和6.SSB称为因素B的效应平方和四问题分析葡萄酒的质量是由多个指标来进行测量评估的,为了使得建立的模型能够客观、准确的对葡萄酒品质做出全面的评价,要求:首先学能够消除指标之间可能存在的相关性,以避免数据的重叠冗余,其次必须能够确定不同的指标对葡萄酒品质质影响的权重。葡萄酒质量的评价是人们为了反映葡萄酒的客观性而人为采取的一些方法,主要包括感官指标,理化指标,下面对4个问题逐一做出分析:问题1问两组结果有无差异,同时要指明哪组结果更可信,要看有无差异,就要统一数据,将各自的方差,统计量进行分析,进而绘制出图像,做出比照。问题2利用问题一的结果,将可信的一组的数据整理,利用统计分析方法,将葡萄酒进行分级,进而对酿酒的葡萄进行分级。问题3要分析酿酒葡萄和葡萄酒的理化指标之间的联络,运用相关分析,将相关系数等统计出来,利用问题1.2的结果,建构出合理的模型,进而得到它们之间的联络。问题4酿酒葡萄和葡萄酒的理化指标对酒的质量有明显的影响,要论证这个结论,需分析很多方面的因素和采用多种方法分析,以到达完善的目的。五模型建立和求解1.针对问题1建立方差分析模型对试验A、B两个因素进行考察,二者试验地位平等。A因素有a个不同水平A1,A2,Aa;B因素有b个不同水平B1,B2,Bb。A、B之间无交互作用,对水平的每种组合(Ai,Bj)进行一次独立的测验,共得ab个试验结果Xij(i=1,2,a,j=1,2,b),试验结结果数据如表一所示:其中:111,2,.,ajijijbaXX=;111,2,.,(1)biijjiabXX=设ijx是服从正态分布ijx,服从正态分布ijx2,()ijijxNu的总体中抽取的样本,假定,A,B不存在交互效应,假定ijx=iju+ij(2)ijN(0,2)(i=1,2,a;j=1,2b),其中iju表示ijAB条件下理论期望值,ij表示随机误差,且互相独立。由(1)得11.1.1.11(1,2.)1(1,2.),abijijaijjiaijiiiiijabjbajabuu=-=-令称i为因素Ai的第i个水平的效应,j为因素j的第j个水平的效应,分别表示因素A、B的各个水平的影响的程度。显然有关系式将ij进行分解:称为iA和jB的交互效应。而对二因素无重复试验方差分析,假设任意iA和jB不存在交互效应,即全部ij=0。这样ij分解式可写为iijj=+ijiij112=i=1,20,0(5)(0,)2j=1,2abijijijNX=+=,.,b且互相独立综上所述,可得二因素无重复试验方差的数学模型其中,.,b)均为未知数下面为显著性检验对于二因素无交互方差数学模型(1.5)的检验主要是检验两个因素AB与的影响能否显著。要判定因素A的影响能否显著等价于检验假设:0112:0aH=要判定因素B的影响能否显著等价于检验假设0212:0aH=检验上述假设的基本原理是将总离差平方和分解为各个因素导致的离差平方和及随机误差导致的离差平方和,详细方法如下,设定iijjjijijij=-+-+令其中SSA称为因素A的效应平方和,表示因素A的水平变化引起的影响;SSB称为因素B的效应平方和,表示因素B的水平变化引起的影响SSB称为误差平方和,表示试验的随机误差影响。总离差分解后的公式为上式表明总离差的平方和分解为二因素的影响组间和随机误差影响组内的离差平方和。在(8)成立时,利用关于正态分布平方和分解的Cochran定理。可证实H01与H02分别成立时的SSA,SSB,SSE及MSS的分布规律。Cochran定理:X1,X2,Xn为n个互相独立的服从标准正态分布的随机变量,Qi(i=1,2,k)是某些X1,X2,Xn线性组合的平方和,在(8)成立时,利用关于正态分布平方和分解的Cochran定理。可证H01与H02分别成立时的的分布规律。Cochran定理:X1,X2,Xn为n个互相独立的服从标准正态分布的随机变量,Qi(i=1,2,k)是某些X1,X2,Xn线性组合的平方和,其自由度分别为SSAdi(i=1,2,k)。假如1Q+2Q+kQ2x(n),且1d+2d+kd=n则iQ2Xi=1,2,k,并且1Q,2Q,kQ互相独立。在8成立的条件ia,利用Cochran分解定理,可证实在仅有01H成立时,有2ESS2(1)(1)xab-2SSa2x(a-1)10且它们互相独立,进而有统计量AF=ssAssAMM1(1)(1)AaBabSSSS-1,(1)(1)Faab-10所以对给定的显著水平,查F分布表得临界1,(1)(1)Faab-,当AF>F,拒绝01H,因素A影响显著;反之,接受01H,因素A影响显著。11.1.1.1.111(1,2.)1(1,2.)()2()2abijijbijijajijiaAiiaBjiXabiabjbabXbXXXXXXSSXSSX=-=-1111212p1p2121222p2pp1p122ppaaaaaa.aaappFXXXFXXXFXXX=+?=+?=+?知足下面条件:1.每个主成分系数平方和为1即:),2,1(122221miaaapiii=+2.主成分之前互不相关即:0),cov(=iiFF主成分方差依次递减,即)()()(21pFVarFVarFVar第一主成分第二主成分公因子方差总糖g/L0.868-0.2230.803153复原糖g/L0.63-0.5420.690664VC含量mg/L)-0.5320.2710.356465总酚(mmol/kg)0.480.7880.851344单宁(mmol/kg)0.2940.8630.831205可溶性固形物g/l0.849-0.0660.725157固酸比0.3630.2830.211858方差奉献2.6027541.8670924.469846特征值2.6.27541.8670924.469846主成分方差与方差奉献图总酚mmol4单宁mmol5VC含量3固酸比7总糖gL1可溶性固6复原糖gL2不同葡萄品种的指标聚类图树形图指标低级葡萄优级葡萄特级葡萄总糖g/100ml171918201921总酚g/l0.30.50.50.70.50.8可溶性固形物g/ml0.20.30.30.60.50.7vc含量mg/l1.21.41.41.51.21.8最后得出酿酒葡萄的分级标准如上图所示。3.针对问题3建立的相关分析模型我们对酿酒葡萄与葡萄酒的理化指标之间的联络用spss软件进行相关分析。相关性分析是考察两个变量之间线性关系的一种统计分析方法。相关系数的一般表达式:判定相关关系密切程度的标准为:r0.3弱相关0.3r0.5低度相关0.5r0.8显著相关0.8r1高度相关r=1完全相关r=0不相关抽取葡萄样品和葡萄酒样品,将它们中单宁的指标进行相关分析,用spss软件分析结果r=2xyxy=