基于数理分析的葡萄及葡萄酒评价体系数学建模a题--学士学位论文.doc
《基于数理分析的葡萄及葡萄酒评价体系数学建模a题--学士学位论文.doc》由会员分享,可在线阅读,更多相关《基于数理分析的葡萄及葡萄酒评价体系数学建模a题--学士学位论文.doc(40页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、 高教社杯全国大学生数学建模竞赛承 诺 书我们仔细阅读了中国大学生数学建模竞赛的竞赛规则.我们完全明白,在竞赛开始后参赛队员不能以任何方式(包括电话、电子邮件、网上咨询等)与队外的任何人(包括指导教师)研究、讨论与赛题有关的问题。我们知道,抄袭别人的成果是违反竞赛规则的, 如果引用别人的成果或其他公开的资料(包括网上查到的资料),必须按照规定的参考文献的表述方式在正文引用处和参考文献中明确列出。我们郑重承诺,严格遵守竞赛规则,以保证竞赛的公正、公平性。如有违反竞赛规则的行为,我们将受到严肃处理。我们授权全国大学生数学建模竞赛组委会,可将我们的论文以任何形式进行公开展示(包括进行网上公示,在书籍
2、、期刊和其他媒体进行正式或非正式发表等)。我们参赛选择的题号是(从A/B/C/D中选择一项填写): A 我们的参赛报名号为(如果赛区设置报名号的话): 所属学校(请填写完整的全名): 重庆大学 参赛队员 (打印并签名) :1. 2. 3. 指导教师或指导教师组负责人 (打印并签名): 日期: 2012 年 9 月 10 日赛区评阅编号(由赛区组委会评阅前进行编号):学生数学建模竞赛编 号 专 用 页赛区评阅编号(由赛区组委会评阅前进行编号):赛区评阅记录(可供赛区评阅时使用):评阅人评分备注全国统一编号(由赛区组委会送交全国前编号):全国评阅编号(由全国组委会评阅前进行编号): 基于数理分析的
3、葡萄及葡萄酒评价体系摘要葡萄酒的质量评价是研究葡萄酒的一个重要领域,目前葡萄酒的质量主要由评酒师感官评定。但感官评定存在人为因素,业界一直在尝试用葡萄的理化指标或者葡萄酒的理化指标定量评价葡萄酒的质量。本题要求我们根据葡萄以及葡萄酒的相关数据建模,并研究基于理化指标的葡萄酒评价体系的建立。对于问题一,我们首先用配对样品t检验方法研究两组评酒员评价差异的显著性,将红葡萄酒与白葡萄酒进行分类处理,用SPSS软件对两组评酒员的评分的各个指标以及总评分进行了配对样本t检验。得到的部分结果显示:红葡萄酒外观色调、香气质量的评价存在显著性差异,其他单指标的评价不存在显著差异,白葡萄、红葡萄以及整体的评价存
4、在显著性差异。接着我们建立了数据可信度评价模型比较两组数据的可信性,将数据的可信度评价转化成对两组评酒员评分的稳定性评价。首先我们对单个评酒员评分与该组所有评酒员评分的均值的偏差进行了分析,偏差不稳定的点就成为噪声点,表明此次评分不稳定。然后我们用两组评酒员评分的偏差的方差衡量评酒员的稳定性。得到第2组的方差明显小于第1组的,从而得出了第2组评价数据的可信度更高的结论。对于问题二,我们根据酿酒葡萄的理化指标和葡萄酒质量对葡萄进行了分级。一方面,我们对酿酒葡萄的一级理化指标的数据进行标准化,基于主成分分析法对其进行了因子分析,并且得到了27种葡萄理化指标的综合得分及其排序(见正文表5)。另一方面
5、,我们又对附录给出的各单指标百分制评分的权重进行评价,并用信息熵法重新确定了权重,用新的权重计算出27种葡萄酒质量的综合得分并排序(见正文表6)。最后我们对两个排名次序用基于模糊数学评价方法将葡萄的等级划分为1-5级(见正文表8)。对于问题三,首先我们将众多的葡萄理化指标用主成分分析法综合成6个主因子,并将葡萄等级也列为主因子之一。对葡萄的6个主因子,以及葡萄酒的10个指标用SPSS软件进行偏相关分析,得到酒黄酮与葡萄的等级正相关性较强等结论。之后对相关性较强的主因子和指标作多元线性回归。得到了葡萄酒10个单指标与主因子之间的多元回归方程,该回归方程定量表示两者之间的联系。对于问题四,我们首先
6、将葡萄酒的理化指标标准化处理,对葡萄酒的质量与葡萄的6个主因子和葡萄酒的10个单指标作偏相关分析,并求出多元线性回归方程。该方程就表示了葡萄和葡萄酒理化指标对葡萄酒质量的影响。之后,我们通过通径分析方法中的逐步回归分析得到葡萄与葡萄酒的理化指标只确定了葡萄酒质量信息的47%。从而得出了不能用葡萄和葡萄酒的理化指标评价葡萄酒的质量的结论。接着我们还采用通径分析中的间接通径系数分析求出各自变量之间通过传递作用对应变量的影响,得到单宁与总酚传递性影响较强等结论。 最后,我们对模型的改进方向以及优缺点进行了讨论。关键词:配对样本t检验 数据可信度评价 主成分分析 模糊数学评价 综合评分 信息熵 偏相关
7、分析 多元线性回归1问题重述确定葡萄酒质量时一般是通过聘请一批有资质的评酒员进行品评。每个评酒员在对葡萄酒进行品尝后对其分类指标打分,然后求和得到其总分,从而确定葡萄酒的质量。酿酒葡萄的好坏与所酿葡萄酒的质量有直接的关系,葡萄酒和酿酒葡萄检测的理化指标会在一定程度上反映葡萄酒和葡萄的质量。附件中给出了某一年份一些葡萄酒的评价结果,并分别给出了该年份这些葡萄酒的和酿酒葡萄的成分数据。我们需要建立数学模型并且讨论下列问题:1. 分析附件1中两组评酒员的评价结果有无显著性差异,并确定哪一组的评价结果更可信。2. 根据酿酒葡萄的理化指标和葡萄酒的质量对这些酿酒葡萄进行分级。3. 分析酿酒葡萄与葡萄酒的
8、理化指标之间的联系。4分析酿酒葡萄和葡萄酒的理化指标对葡萄酒质量的影响,并论证能否用葡萄和葡萄酒的理化指标来评价葡萄酒的质量。2模型的假设与符号的约定2.1模型的假设与说明(1)评酒员的打分是按照加分制(不采用扣分制);(2)假设20名评酒员的评价尺度在同一区间(数据合理,不需要标准化);(3)每位评酒员的系统误差较小,在本问题中可以忽略不计;(4)假设附件中给出的葡萄和葡萄酒理化指标都准确可靠。2.2符号的约定与说明符号符号的意义原假设显著性概率第1组评酒员对第号品种葡萄酒评分的平均值,第2组评酒员对第号品种葡萄酒评分的平均值,第一组评酒员对指标评分的偏差的方差,第二组评酒员对指标评分的偏差
9、的方差,第1组10位评酒员对号酒样品第项指标评分的平均分第1组第号评酒员对号酒样品第项指标评分与平均值的偏差第1组第号评酒员对其项指标评分与平均值的偏差的平均值第2组第个评酒员的总体指标偏差的方差重新确立的第项指标的权重第2组10个评酒员的总体指标偏差的方差评酒员指标的平均评分,葡萄的第项指标,葡萄的第项因子,葡萄酒的第项理化指标,3问题一的分析与求解3.1问题一的分析题目要求我们根据两组评酒员对27种红葡萄酒和28种白葡萄酒的10个指标相应的打分情况进行分析,并确定两组评酒员对葡萄酒的评价结果是否有显著性差异,然后判断哪组评酒员的评价结果更可信。初步分析可知:由于评酒员对颜色、气味等感官指标
10、的衡量尺度不同,因此两组评酒员评价结果是否具有显著性差异应该与评价指标的类型有关,不同的评价指标的显著性差异可能会不同。同时,由于红葡萄酒和白葡萄酒的外观、口味等指标差异性较大,处理时需要将白葡萄酒和红葡萄酒的评价结果的显著性差异分开讨论。基于以上分析,我们可以分别两组品尝同一种类酒样品的评酒员的评价结果进行两两配对,分析配对的数据是否满足配对样品t检验的前提条件,而且根据常识可知评酒员对同一种酒的同一指标的评价在实际中是符合t检验的条件的。接着我们就可以对数据进行多组配对样品的t检验,从而对两组评酒员评价结果的显著性差异进行检验。由于对同一酒样品的评价数据只有两组,我们只能通过评价结果的稳定
11、性来判定结果的可靠性。而每组结果的可靠性又最终决定于每个评酒员的稳定性,因此将问题转化为对评酒员稳定性的评价。3.2配对样品的t检验简介统计知识指出:配对样本是指对同一样本进行两次测试所获得的两组数据,或对两个完全相同的样本在不同条件下进行测试所得的两组数据。在本问中我们可以把配对样品理解为有27组两个完全相同的酒样品在两组不同评酒员的检测下得到的两组数据,两组中各个指标的数据为每组评酒员对该指标打分的平均值。配对样品的t检验可检测配对双方的结果是否具有显著性差异,因此就可以检验出配对的双方(第一组与第二组)对葡萄酒的评价结果是否有差异性。 配对样品t检验具有的前提条件为:(1)两样品必须配对
12、(2)两样品来源的总体应该满足正态性分布。配对样品t检验基本原理是:求出每对的差值如果两种处理实际上没有差异,则差值的总体均数应当为0,从该总体中抽出的样本其均数也应当在0附近波动;反之,如果两种处理有差异,差值的总体均数就应当远离0,其样本均数也应当远离0。这样,通过检验该差值总体均数是否为0,就可以得知两种处理有无差异。该检验相应的假设为: ,两种处理没有差别,两种处理存在差别。3.3葡萄酒配对样品的t检验问题一中配对样品为27组两个完全相同的酒样品在两组不同评酒员的检测下得到的两组数据,其中两组中各个指标的数据为各组10个评酒员对该指标打分的平均值。该问题中的10个指标分别为:外观澄清度
13、、外观色调、香气纯正度、香气浓度、香气质量、口感纯正度、口感浓度、口感持久性、口感质量、平衡/总体评价。根据t检验的原理,对葡萄酒配对样品进行t检验之前我们要对样品进行正态性检验。首先我们根据附件一并处理表格中的数据,得到配对样品的两组数据,绘制红葡萄酒配对样品表格部分数据如表1: 表1 红葡萄酒配对样品数据表 澄清度(1组均值) 澄清度(2组均值)平衡/整体评价(1组均值)平衡/整体评价(2组均值)红12.33.17.78.4红22.93.19.69.1红263.63.78.98.8红273.73.798.8 白葡萄酒配对样品表格部分数据如表2:表2 白葡萄酒配对样品数据表澄清度(1组均值)
14、 澄清度(2组均值)平衡/整体评价(1组均值)平衡/整体评价(2组均值)白12.33.17.78.4白22.93.19.69.1白263.63.78.98.8白273.73.798.8从上表中我们能看出,将白葡萄酒和红葡萄酒中的每个指标分别进行样品的配对后,每一个指标的配对结果有27对,每一对的双方分别是1组和2组的评酒员对该指标的评分的平均值。3.3.1样本总体的K-S正态性检验 配对样品的t检验要求两对应样品的总体满足正态分布,则总体中的样品应该满足正态性或者近似正态性,样本的正态性检验如下: 以红葡萄酒的澄清度的27组数据为例分析:利用SPSS软件绘制两样品的直方图和趋势图如图1所示:
15、图1 红葡萄酒澄清度两组数据直方图 我们假设两组总体数据都服从正态分布,利用SPSS软件进行K-S正态性检验的具体结果见附录2.3。两组数据的近似相伴概率值P分别为0.239和0.329,大于我们一般的显著水平0.05则接受原来假设,即两组红葡萄酒的澄清度数据符合近似正态分布。 同理可用SPSS软件对其他指标的正态性进行检验,得到结果符合实际猜想,都服从近似正态分布。3.3.2葡萄酒配对样品t检验步骤两种葡萄酒的处理过程类似,这里我们以对红葡萄酒评价结果的差异的显著性分析为例。Step1: 我们以第一组对葡萄酒的评价结果总体服从正态分布,以第二组对葡萄酒的评价结果总体服从正态分布。我们已分别从
16、两总体中获得了抽样样本和,并分别进行两样品相互配对。(具体数据见附录2.1)Step2:;引进一个新的随机变量,对应的样本为,将配对样本的t检验转化为单样本t检验。Step3: 建立零假设,构造t统计量;Step4:利用SPSS进行配对样品t检验分析,并对结果做出推断。3.4显著性差异结果分析3.4.1红葡萄酒各指标差异显著性分析由SPSS软件对红葡萄酒各指标的配对样品t检验后,得到各指标的显著性概率分布表。(结果如表3所示) 表3 红葡萄酒酒各指标显著性概率P指标外观澄清度外观色调香气纯正度香气浓度香气质量P0.6140.0020.1510.1000.010指标口感纯正度口感浓度口感持久性口
17、感质量平衡整体P0.4370.1580.2510.0550.674 由统计学知识,如果显著性概率P显著水平 ,则不能拒绝零假设,即认为两总体样本的均值不存在显著差异。则根据表3可得:两组评酒员对红葡萄酒各项指标的评价中除外观色调、香气质量存在显著性差异以外,其他8项指标都无显著性差异。3.4.2白葡萄酒各指标差异显著性分析代入白葡萄酒的评价数据,重复以上步骤,得到白葡萄酒各指标的显著性概率分布表。(结果如表4所示) 表4 白葡萄酒各指标显著性概率P分布表 指标外观澄清度外观色调香气纯正度香气浓度香气质量P0.2990.0890.9370.2380.714指标口感纯正度口感浓度口感持久性口感质量
18、平衡/整体P0.0000.0050.8630.0000.001分析表4可得:两组评酒员对白葡萄酒各项指标的评价中只有口感纯正度、口感浓度、口感质量、平衡/整体评价存在显著性差异,其他6项指标都无显著性差异。3.4.3葡萄酒总体差异显著性分析(1)红葡萄酒总体差异显著性分析 该问题的附件中已经给出了10项指标的权重,因此将10项指标利用加权合并成总体评价。对于红葡萄酒两组评价结果构造两组配对t检验。得到显著性概率P=0.030。即红葡萄酒整体评价结果有显著性差异。(2)白葡萄酒总体差异显著性分析同理对于白葡萄酒两组评价结果构造两组配对t检验。得到显著性概率P=0.02。即白葡萄酒整体评价结果有显
19、著性差异。(3)葡萄酒总体差异显著性分析对于白葡萄酒和红葡萄酒总体评价结果配对t检验。得到显著性概率P=0.002。即两组对整葡萄酒的评价有显著性差异。3.5评分数据可信度评价3.5.1数据可信度评价分析前面我们已经对两组评酒员评价结果的差异显著性进行了分析,部分但指标存在显著性差异,但两组评酒员对葡萄酒总体评价并无显著性差异。也即我们不能通过显著性差异指标明显地看出哪一组评酒员的数据可信。因此比较两组评酒员所评数据的可信度要建立更贴切的数据可信度指标。3.5.2数据可信度评价指标建立由于整体评价数据无显著性差异,我们可以认为20名评酒员的水平在一个区间内。因此评酒员的评价结果的稳定性将决定该
20、评酒员评价的数据的可信度。若某一评酒员的评价数据不稳定,则其所评数据可信度较低,其所在组别的数据评价可信度也将相应降低。因此,我们将数据的可信度比较转化为两组评酒员评论水平的稳定性比较。查阅相关资料获知,评酒员的评价尺度是有一定的系统误差的。如不同评酒员对色调的敏感度或许是不同的,如果某一评酒员评价的色调稍高于标准色调,但他每次评价的色调都稍高,而且一直很稳定。虽然与均值间始终存在误差,由于其稳定性,这样的评酒员的评价数据仍然是可信的。 所以,我们建立的数据可信度评价指标为评酒员评价的稳定性。评酒员的评价数据越稳定,数据越可信。3.5.3数据可信度评价模型的建立与求解我们已分析将数据可信度的评
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 基于 数理 分析 葡萄 葡萄酒 评价 体系 数学 建模 学士学位 论文
限制150内