对葡萄品质和葡萄酒质量的研究_建模竞赛论文(16页).doc
《对葡萄品质和葡萄酒质量的研究_建模竞赛论文(16页).doc》由会员分享,可在线阅读,更多相关《对葡萄品质和葡萄酒质量的研究_建模竞赛论文(16页).doc(19页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、-对葡萄品质和葡萄酒质量的研究_建模竞赛论文-第 2 页高教社杯全国大学生数学建模竞赛承 诺 书我们仔细阅读了中国大学生数学建模竞赛的竞赛规则.我们完全明白,在竞赛开始后参赛队员不能以任何方式(包括电话、电子邮件、网上咨询等)与队外的任何人(包括指导教师)研究、讨论与赛题有关的问题。我们知道,抄袭别人的成果是违反竞赛规则的, 如果引用别人的成果或其他公开的资料(包括网上查到的资料),必须按照规定的参考文献的表述方式在正文引用处和参考文献中明确列出。我们郑重承诺,严格遵守竞赛规则,以保证竞赛的公正、公平性。如有违反竞赛规则的行为,我们将受到严肃处理。我们授权全国大学生数学建模竞赛组委会,可将我们
2、的论文以任何形式进行公开展示(包括进行网上公示,在书籍、期刊和其他媒体进行正式或非正式发表等)。我们参赛选择的题号是(从A/B/C/D中选择一项填写): A 我们的参赛报名号为(如果赛区设置报名号的话): 所属学校(请填写完整的全名): 云南省保山市隆阳区保山学院 参赛队员 (打印并签名) :1. 2. 3. 指导教师或指导教师组负责人 (打印并签名): 日期: 2012 年 09 月 7 日赛区评阅编号(由赛区组委会评阅前进行编号):高教社杯全国大学生数学建模竞赛编 号 专 用 页赛区评阅编号(由赛区组委会评阅前进行编号):赛区评阅记录(可供赛区评阅时使用):评阅人评分备注全国统一编号(由赛
3、区组委会送交全国前编号):全国评阅编号(由全国组委会评阅前进行编号):基于多元回归分析的葡萄酒评价模型摘要酿酒葡萄的好坏与所酿葡萄酒的质量有直接的关系,葡萄酒和酿酒葡萄检测的理化指标会在一定程度上反应葡萄酒和葡萄的质量本文基于酿酒葡萄和葡萄酒的理化指标及芳香物质的一系列统计数据,建立了酿酒葡萄与葡萄酒的概率模型、质量优化模型和回归模型。针对问题一,通过对两组品酒队员的品酒质量的离散性的对比,利用图表辅助分析,最终确定第二组的品酒质量波动程度较小,可信度较高。针对问题二,在问题一的基础上进一步得出葡萄酒的质量,将得到的数据与酿酒葡萄的理化指标数据进行综合分析,利用系统聚类对数据进行处理,从而预测
4、葡萄可分为四个级别。其中,红葡萄中3、6、21各自成一级,剩余的被聚到同一级之中;在白葡萄中3、24、28各自成一级,剩余的被聚到同一级之中。针对问题三,我们选取酿酒葡萄与葡萄酒的理化指标之间的共同点,利用MATLAB对问题所提供的葡萄和葡萄酒的理化指标表中的数据进行拟合,得出二者成正相关关系。针对问题四,综合葡萄酒的质量,酿酒葡萄与葡萄酒的理化指标及葡萄和葡萄酒的芳香物质的数据,建立回归模型,分析得出能用葡萄和葡萄酒的理化指标来评价葡萄酒的质量。关键词:葡萄酒质量 方差 聚类分析 拟合 多元线性回归一、问题重述确定葡萄酒质量时一般是通过聘请一批有资质的评酒员进行品评。每个评酒员在对葡萄酒进行
5、品尝后对其分类指标打分,然后求和得到其总分,从而确定葡萄酒的质量。酿酒葡萄的好坏与所酿葡萄酒的质量有直接的关系,葡萄酒和酿酒葡萄检测的理化指标会在一定程度上反映葡萄酒和葡萄的质量。附件1给出了某一年份一些葡萄酒的评价结果,附件2和附件3分别给出了该年份这些葡萄酒的和酿酒葡萄的成分数据。请尝试建立数学模型讨论下列问题:1. 分析附件1中两组评酒员的评价结果有无显著性差异,哪一组结果更可信?2. 根据酿酒葡萄的理化指标和葡萄酒的质量对这些酿酒葡萄进行分级。3. 分析酿酒葡萄与葡萄酒的理化指标之间的联系。4分析酿酒葡萄和葡萄酒的理化指标对葡萄酒质量的影响,并论证能否用葡萄和葡萄酒的理化指标来评价葡萄
6、酒的质量?二、问题的分析针对问题一,由于每个品酒员在品酒的时候,由于各种各样的原因,对葡萄酒的评分或多或少的存在一定的差异性。这一差异性,能够通过离散程度和波动程度很好的反应出来。在两组品酒员之中,综合各组品酒员对葡萄酒的评分的离散性和波动程度,其中离散性小以及波动程度小的一组对葡萄酒的质量的评估更为可信。针对问题二,题目要求结合葡萄酒的质量以及酿酒葡萄的理化指标综合对酿酒葡萄进行分级。首先,采用通过品酒对葡萄酒质量进行评估结果可信度高的品酒小组的评分数据,求出各种葡萄酒的平均得分,即可大致知道葡萄酒的质量。再结合葡萄的各项理化指标进行聚类,便可以得到酿酒葡萄的分级情况。针对问题三,想要知道酿
7、酒葡萄与葡萄酒的理化指标之间的联系,若能够利用它们之间的联系,建立起函数关系,该问题便可以迎刃而解。针对问题四,问题考虑酿酒葡萄的理化指标、葡萄酒的理化指标,以及葡萄酒质量之间的关系。并且提出,通过酿酒葡萄和葡萄酒的理化指标是否可以判断出葡萄酒的品质,这便要求我们利用现有数据,在酿酒葡萄和葡萄酒的理化指标和葡萄酒的品质之间建立函数关系架造桥梁,使抽象的问题转化为较为直观的问题,这有利于我们在不通过品酒师对葡萄酒进行评分的情况下,得出一个对葡萄酒的品质较为合理的评价。三、模型假设与符号说明3.1 模型假设1)假设品酒员不受到主观情绪环境等影响,能够客观公正的评酒;2)评定方法具有可靠性稳定性;3
8、)酒的品质长期不变;4)葡萄品质在一个可接受的变动范围之内;5)酿酒葡萄与酒样品一一对应。3.2 符号说明 1)、:第、个事物;2)、:酒样品的各项评分;3):酒样品的综合得分;4):酒样品评分区间;5):距离;6):酿酒葡萄理化指标;7):葡萄酒理化指标;8):与之间的函数关系;9):中的待定系数;10):酿酒葡萄芳香物质;11):酒样品芳香物质;12):酒样品的质量;13):回归模型待定系数;14):相关系数;15):值;16):与对应的概率.四、模型的建立与求解4.1.1 通过品酒判定葡萄酒品质的可信度的模型的建立首先,根据根据各个品酒员对样品酒,给出的评分、,具体情况如下:表1:品酒员
9、对样品酒品分数据酒样品品酒员分数外观分析 15澄清度 5色调 10香气分析 30纯正度 6浓度 8质量 16口感分析 44纯正度 6浓度 8持久性 8质量 22平衡/整体评价 11然后,根据表1中的数据,进行如下计算:1)求均值:、;2)求方差和:、;3)根据一级指标,将方差和进行求和: 、外观分析得分 = ;、香气分析得分 = ;、口感分析得分 = ;、平衡/整体评价得分 = ;4)将所有一级指标方差和进行求和:通过对上述数据中的2)、3)、4)项的数据进行对比,就可以得出两组品酒员,哪一组的评分标准波动程度较小,从而得出该组的结果比较可信。4.1.2 通过品酒判定葡萄酒品质的可信度的模型的
10、求解利用MATLAB进行程序编写(程序:WT1.m),可以得到以下结果:表2:方差波动程度综合分析红葡萄酒综合分析第一组5670.59 第二组3211.26 外观分析香气分析口感分析平衡/整体评价第一组1016.30 1725.85 3696.22 220.37 第二组721.33 976.37 1918.30 105.19 澄清度色调纯正度浓度质量纯正度浓度持久度质量平衡/整体评价第一组258.67 757.63 281.26 456.44 988.15 222.67 462.37 198.96 1824.07 220.37 第二组46.96 674.37 157.11 309.33 509
11、.93 98.67 290.37 119.33 900.00 105.19 白葡萄酒综合分析第一组4912.68 第二组2968.96 外观分析香气分析口感分析平衡/整体评价第一组1015.75 1301.43 3133.04 187.86 第二组422.14 957.57 1989.32 124.18 澄清度色调纯正度浓度质量纯正度浓度持久度质量平衡/整体评价第一组237.21 778.54 234.39 341.64 725.39 202.71 339.18 271.79 1593.96 187.86 第二组61.00 361.14 124.46 308.86 524.25 99.46 2
12、26.61 108.50 1030.50 124.18 从上表可以看出,第二组的品酒员在各项指标上的离散程度即波动程度都要小于第一组的,因此,第二组品酒员判定出的葡萄酒的质量更加可信。根据以下饼状图,能够更加直观的描述他们之间的关系。图1:红葡萄酒评分波动程度大小关系图图2:白葡萄酒评分波动程度大小关系图4.2.1 酿酒葡萄分级模型的建立由上一问中,我们知道了第二组品酒员对葡萄酒质量的判定结果更加具有可信度,因此采用第二组品酒员对葡萄酒的判定数据。对于每一种葡萄酒,每一个品酒员对其进行打分,将该种葡萄酒所得的分数为:不难计算出其平均得分:根据平均得分,我们很容易将其进行分级:再将平均得分结合葡
13、萄的理化指标进行系统聚类,便可得到酿酒葡萄分级情况。系统聚类的基本思想是,距离相近的样品(或变量)先聚成类,距离相远的后聚成类,过程一直进行下去,每个样品(或变量)总能聚到合适的类中。4.2.2 酿酒葡萄分级模型的求解通过MATLAB编写程序(程序:WT2.m),很容易就得到葡萄酒的平均得分:表3:葡萄酒的平均得分葡萄酒样品编号1234567891011121314红葡萄酒68.17474.671.272.166.365.36678.268.861.668.368.872.6白葡萄酒77.975.875.676.981.575.574.272.380.479.871.472.473.977.1
14、葡萄酒样品编号1516171819202122232425262728红葡萄酒65.769.974.565.472.675.872.271.677.171.568.27271.5白葡萄酒78.467.380.376.776.476.679.279.477.476.179.574.37779.6葡萄酒分级情况为:1) 红葡萄酒:2)白葡萄酒:然后将酿酒葡萄理化指标与葡萄酒质量进行组合(数据见:红葡萄分级数据.sav,白葡萄分级数据.sav, fujian2_putaolihua_fenji_zhengli.xls),采用最短距离法进行聚类,方法如下:1)定义样品之间距离,计算样品变量的两两距离,
15、得到一距离阵记为,开始每个样品自成一类,显然这时;2)找出距离最小元素,设为,将对应变量合并成一个新类;3)继续计算新类与其他类的距离;4)重复2)、3)两步,直到所有元素并成一类为止。利用SPSS软件进行聚类,很容易得到以下数据:图3:最短距离聚类结果(左为红葡萄,右为白葡萄)由图可知:在红葡萄中3、6、21各自成一级,剩余的被聚到同一级之中;在白葡萄中3、24、28各自成一级,剩余的被聚到同一级之中。4.3.1 酿酒葡萄与葡萄酒的理化指标之间的联系模型的建立通过观察附件2我们发现,酿酒葡萄理化指标的子指标与葡萄酒理化指标中所包含的子指标,并不是一一对应的关系,而我们所要进行的工作是建立酿酒
16、葡萄与葡萄酒的理化指标之间的联系模型,因此不妨丢弃不相干指标,提取出酿酒葡萄和葡萄酒都共同含有的理化指标进行分析,并将进行过多次观测的同一指标采取求平均值的处理方法降低计算量(数据处理见:fujian2_putaolihua.xls, fujian2_jiulihua.xls)。因为选取了酿酒葡萄和葡萄酒之间相同的理化指标,因此,挑选出来进行观察的理化指标是一一对应的关系。而在酿酒葡萄酿成葡萄酒的这一过程之中,可能伴随着一定的变化规律,即某项理化指标的含量发生了规律性的变化。假设挑选出来的酿酒葡萄的理化指标为集合为,葡萄酒的理化指标为集合为,我们便可以通过对应关系,画出坐标集合(,)的散点图,
17、观察其散点图的变化趋势,建立如下函数关系: 若存在,则中很可能包含一个,甚至多个令转化为的未知的转换系数,为求出与之间的联系,我们可以考虑用曲线拟合的方法,将求出来,便可以知道他们之间存在着什么样的关系;若不存在,则需要寻求另一种方法,求它们之间的联系。4.3.2 酿酒葡萄与葡萄酒的理化指标之间的联系模型的求解通过MATLAB编写程序(程序:WT3.m),绘制出(,)总体的散点图如下:图4:(,)的散点图发现,总体的散点图规律较为明显,近似为指数函数图象,因此考虑建立指数函数关系如下:运用WT3.m中的程序进行拟合,可以求得:1)红葡萄和红葡萄酒理化指标参数2)白葡萄和白葡萄酒理化指标参数拟合
18、效果如下图所示:图5:红葡萄与红葡萄酒理化指标关系预测作图图6:白葡萄与白葡萄酒理化指标关系预测作图由上述两幅图片看出,拟合效果较为显著,这也证实了与之间存在着近似等价于指数函数的函数关系。接下来,将利用SPSS软件对原理化指标与预测理化指标之间的显著性关系进行评价:表4:红葡萄与红葡萄酒预测理化指标相关性相关性预测花色苷预测单宁预测总酚预测白藜芦醇预测顺式白藜芦醇苷预测顺式白藜芦醇原花色苷Pearson 相关性.434*,*.661*.438*,*-.363*-.176.125原单宁Pearson 相关性-.050*,*-.155*-.168*,*-.455*,*-.364*.059*原总酚
19、Pearson 相关性.618*,*.744*.876*-.294*,*-.055.524*原反式白藜芦醇苷Pearson 相关性.293.418*.591*-.231*.035.785*原顺式白藜芦醇苷Pearson 相关性.126-.011-.028-.164-.081.219原反式白藜芦醇Pearson 相关性-.096-.278-.179-.083-.068-.026原顺式白藜芦醇Pearson 相关性.016*.296*.414*,*-.237*,*-.132.123*. 在 .01 水平(双侧)上显著相关。*. 在 .005 水平(双侧)上显著相关。表5:白葡萄与白葡萄酒预测理化指
20、标相关性相关性预测单宁预测总酚预测白藜芦醇预测顺式白藜芦醇苷预测顺式白藜芦醇原单宁Pearson 相关性.182*,*-.165*,*.422*.212*-.083*原总酚Pearson 相关性.594*.541*-.136*.051-.199*原顺式白藜芦醇苷Pearson 相关性.112-.011-.225-.188.050原顺式白藜芦醇Pearson 相关性-.084-.268*.112*-.016-.143*. 在 .01 水平(双侧)上显著相关。*. 在 0.05 水平(双侧)上显著相关。通过上述两表,可以看出,部分预测理化指标和原理化指标的相关性较为显著,这也可以间接的说明,拟合效
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 葡萄 品质 葡萄酒 质量 研究 建模 竞赛 论文 16
限制150内