本科毕业设计--葡萄酒的评价数学建模竞赛论文.doc
《本科毕业设计--葡萄酒的评价数学建模竞赛论文.doc》由会员分享,可在线阅读,更多相关《本科毕业设计--葡萄酒的评价数学建模竞赛论文.doc(34页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、2012高教社杯全国大学生数学建模竞赛承 诺 书我们仔细阅读了中国大学生数学建模竞赛的竞赛规则.我们完全明白,在竞赛开始后参赛队员不能以任何方式(包括电话、电子邮件、网上咨询等)与队外的任何人(包括指导教师)研究、讨论与赛题有关的问题。我们知道,抄袭别人的成果是违反竞赛规则的, 如果引用别人的成果或其他公开的资料(包括网上查到的资料),必须按照规定的参考文献的表述方式在正文引用处和参考文献中明确列出。我们郑重承诺,严格遵守竞赛规则,以保证竞赛的公正、公平性。如有违反竞赛规则的行为,我们将受到严肃处理。我们授权全国大学生数学建模竞赛组委会,可将我们的论文以任何形式进行公开展示(包括进行网上公示,
2、在书籍、期刊和其他媒体进行正式或非正式发表等)。我们参赛选择的题号是(从A/B/C/D中选择一项填写): A 我们的参赛报名号为(如果赛区设置报名号的话): 所属学校(请填写完整的全名): 西南科技大学 参赛队员 (打印并签名) :1. 周 立 2. 李 婧 3. 赖永宽 指导教师或指导教师组负责人 (打印并签名): 杨学南、王丽、倪英俊 日期: 2012 年 9 月 10 日赛区评阅编号(由赛区组委会评阅前进行编号):2012高教社杯全国大学生数学建模竞赛编 号 专 用 页赛区评阅编号(由赛区组委会评阅前进行编号):赛区评阅记录(可供赛区评阅时使用):评阅人评分备注全国统一编号(由赛区组委会
3、送交全国前编号):全国评阅编号(由全国组委会评阅前进行编号):葡萄酒的评价摘要酿酒葡萄的好坏与所酿葡萄酒的质量有直接的关系,本文主要探讨酿酒葡萄与葡萄酒质量的联系。问题一:(1)对于两组评酒员的评价结果有无显著性差异,采用基于成对数据的t检验法,从而得出两组评分结果无显著差异。(2)对于两组评分结果哪一个更可信,从两方面考虑,一方面通过求出总方差和的大小来判定其稳定性;另一方面采用克龙巴赫的信度系数,分别求出两组评分的信度系数。综合考虑这两个方面,得出第二组评分较为可信。问题二:(1)为了简化酿酒葡萄的理化指标,采用主成分分析法,得出酿酒葡萄的八个主要成分,这八个主要成分涵盖的信息量超过了理化
4、指标总信息量的85%。(2)为了划分酿酒葡萄的等级,将酿酒葡萄的主成分与葡萄酒的评分采用多元线性回归模型进行拟合,由于拟合出的评分与实际评分之间仍存在一定误差,所以取拟合值和实际值的平均值作为酿酒葡萄的最终评分,最后再根据评分来划分葡萄等级。问题三:对于酿酒葡萄和葡萄酒的理化指标之间的关系,采用BP神经网络模型,对酿酒葡萄的主要成分作为输入层,相对应的葡萄酒的理化指标作为输出层,进行多达上万次训练拟合,得出的训练值与实际值非常吻合,其相对误差在0.06%以下。问题四:(1)对于探讨酿酒葡萄和葡萄酒的理化指标对葡萄酒质量的影响,首先我们假设葡萄酒的质量与酿酒葡萄和葡萄酒的理化指标、酿酒葡萄和葡萄
5、酒的芳香物质这四个方面的因素有关,采用BP神经网络模型,最后得出相对误差小于0.5%。接下来取消酿酒葡萄和葡萄酒的芳香物质对葡萄酒质量的影响,其他条件不变,最后得出酿酒葡萄和葡萄酒的理化指标对葡萄酒质量的影响很大。(2)对于论证能否用葡萄和葡萄酒的理化指标来评价葡萄酒的质量,定义了酿酒葡萄和葡萄酒的理化指标对葡萄酒质量的影响程度,最后得出,其最小影响程度大于89%,即芳香物质对葡萄酒的质量影响较小,所以可以利用酿酒葡萄和葡萄酒的理化指标来评价葡萄酒的质量。关键词:t检验 信度系数 主成分分析 BP神经网络 GA优化BP神经网络一、问题重述如何评判葡萄酒质量的好坏一般是通过聘请一批资深的评酒员,
6、每个评酒员在对葡萄酒进行品尝后对其分类指标打分,然后求和得到其总分,从而确定葡萄酒的质量。酿酒葡萄的好坏与所酿葡萄酒的质量有直接的关系,葡萄酒和酿酒葡萄检测的理化指标会在一定程度上反映葡萄酒和葡萄的质量。附件中给出了两组评酒员对所抽到葡萄酒样品在进行品尝后的得分情况以及各酿酒葡萄和葡萄酒的理化指标,我们需要解决的问题有以下四个:问题一:分析两组评酒员的评价结果有无显著性差异,哪一组给结果更可信。问题二:根据酿酒葡萄的理化指标和葡萄酒的质量对这些酿酒葡萄进行分级。问题三:分析酿酒葡萄与葡萄酒的理化指标之间的联系。问题四:分析酿酒葡萄和葡萄酒的理化指标对葡萄酒质量的影响,并论证能否用葡萄和葡萄酒的
7、理化指标来评价葡萄酒的质量。二、问题分析针对问题一:(1)对于两组评酒员的评酒结果有无显著差异,我们可以先求出每组葡萄酒的整体评价平均分,通过作图来初步观察两组的差异性,再进一步采用基于成对数据的t检验法来判断两组评分有无显著差异。(2)对于两组评分哪一组更可信,从两个方面来考虑,一方面从每组成员评分之间的稳定性来考虑,这就需要计算出每组针对每种样品酒整体评分的方差,从而确定哪一组更稳定;另一方面,我们采用克龙巴赫系数来评定其可信度,分别算出每组评分的信度系数,通过比较得出哪一组评分较为可信。针对问题二:酿酒葡萄的等级划分与酿酒葡萄的理化指标和葡萄酒样品质量相关,本文综合考虑以下两个方面:(1
8、)对于酿酒葡萄,将其理化指标中的二级指标归纳到一级指标中,这样理化指标就剩29个,但指标还是太多,计算起来非常麻烦,所以先用主成分分析法求出相对较少,但包含了理化指标85%以上信息量的主成分。(2)将得出的酿酒葡萄的主成分与葡萄酒样品的评分进行线性回归分析,得出酿酒葡萄主成分的评价分数表达式。 针对问题三:对于分析酿酒葡萄与葡萄酒的理化指标之间的联系,采用BP神经网络,将问题二中酿酒葡萄的理化指标分析出的主成分作为输入,把葡萄酒的理化指标作为输出,从而建立起两者之间的关系。针对问题四:我们可先假设葡萄酒质量不仅与酿酒葡萄和葡萄酒的理化指标有关,而且与附件三所给出的酿酒葡萄与葡萄酒的芳香物质有关
9、,采用BP神经网络模型,将这四个方面因素作为输入层,葡萄酒质量作为输出层,得出训练值与实际值的分布图,并分析其之间的误差。接下来保留上述模型中各方面因素的评价系数,而将酿酒葡萄和葡萄酒的芳香物质对葡萄酒质量的影响看做零,把酿酒葡萄和葡萄酒的理化指标作为输入层,输出层不变,得出训练值与实际值的分布,再分析两者之间的误差。得出酿酒葡萄和葡萄酒的理化指标对葡萄酒质量的影响分数;最后定义一个酿酒葡萄和葡萄酒的理化指标对葡萄酒质量的影响程度的表达式,来确定这两方面因素对葡萄酒质量的影响率,从而可以判定能否用酿酒葡萄和葡萄酒的理化指标来评价葡萄酒的质量。 三、模型假设及符号说明3.1模型假设1假设葡萄酒质
10、量评分分布服从正态分布;2假设葡萄酒酿制时人为因数基本相同;3. 假设样本数据的抽取是随机的,样本分布与主体分布相同;4. 假设本题所给数据都是真实可靠的;3.2 符号说明n 总样品数(红葡萄酒n=27;白葡萄酒n=28)I 葡萄酒样品数(红葡萄酒i=1,227;白葡萄酒i=1,2,328)Di 两组评分员针对第i种样品葡萄酒打分的均值之差 D1,D2Di的均值 两组评分员针对所有样品酒打分的均值差的标准差 表示检测葡萄酒样品总方差 表示第i种葡萄酒的样品方差 主成分分析法求到的第i主成分 采用线性回归模型中的评价分数 线性回归中的系数T 酿酒葡萄和葡萄酒理化指标对葡萄酒质量的影响率 考虑综合
11、四个方面因素时BP训练得出的质量评分。 考虑四个因素时所得评价系数不变,即在的系数基础上只考虑前两个方面时得出的质量评分。四、 模型建立与求解4.1问题一的模型建立及求解4.1.1两组评价结果差异性判断首先求出第一组和第二组针对每个样品酒整体打分的平均值,然后用Matable画出两组数据的具体分布情况,如下图:图一:第一、二组对所抽样的红葡萄酒的整体评价平均分图二:第一、二组对所抽样的白葡萄酒的整体评价的平均分结论:从图一和图二我们很难客观的判断两组评分之间的差异性。进一步我们再采用t检验1来判定两组数据之间有无显著差异:(1)针对第一、二组红葡萄酒样品评分t检验,作如下假设:针对红葡萄酒n=
12、27, 即知拒绝域为 (1)通过计算得到: ;,该t值不在拒绝域,所以两组对红葡萄酒的打分其结果无显差异。(2)第一、二组针对白葡萄酒样品评分的t检验,作如下假设:针对白葡萄酒n=28;即知拒绝域为(2)可以计算得到: ;,所以t值在拒绝域,所以对白酒的打分结果无显著差异。综上所述,我们得出的结论是:两组评酒员的评价结果无显著差异。4.1.2第一、二组可信度评价首先分别对两组评酒员之间评分的稳定性来衡量其可信度,求出第一组和第二组评酒员针对每个样品整体评分的方差,用Matlab画出两组数据针对红、白葡萄酒评分的方差分布图。如下图:图三:第一、二组分别对所抽样的红葡萄酒的整体评价的方差图四:第一
13、、二组分别对所抽样的白葡萄酒的整体评价的方差从上图可观察出第二组评分的方差较小,即第二组评酒员评分的波动性较小,所以,从稳定性来考虑,可判断第二组评酒员的评分相对较稳定。 接下来采用信度系数法来计算两组评分可信度,克龙巴赫的系数2计算公式如下 : (3)红葡萄酒:n=27,i=1,2,327白葡萄酒:n=28,i=1,2,328 经计算得出: 第一组红酒=0.8822 ;第一组白酒=0.9701 ; 第二组红酒=0.9238 ;第二组白酒=0.9614 ;综上所述:通过考虑两组评分的稳定性和信度系数,我们认为第二组数据更为可信。4.2问题二的模型建立及求解4.2.1针对酿酒葡萄理化指标的主成分
14、分析 首先针对酿酒葡萄的理化指标(X1,X2,XP)将其简化合并为29个,接下来采用主成分分析3重新组合一组较少的互不相关的综合指标Fm,其具体计算步骤如下:(1)计算协方差矩阵:=(sij)pp,其中 i,j=1,2,29 (4) (2)接下来求出该矩阵的特征值及相应的特征向量 (见附录)。则第i个主成分Fi为: (5)主成分的方差(信息)贡献率为: (6)(3)选择主成分:当前m个主成分的累计贡献率到达85%以上时,就认为这m个主成分大体可以反映该信息,G(m)的表达式表述为: (7) 将附件2中数据代入以上模型中(具体程序见附录),分别得出酿酒葡萄的主成分分析图如下:图五:红葡萄酒所用的
15、酿酒葡萄的主成分分布图从上图中选取m=8,即选取F1到F8为主要成分,其信息量可以达到总理化指标85.38%85%。具体主成分分布见表1:红酒主成分F1F2F3F4F5F6F7F8信息贡献率24.5617.7413.098.5887.105.764.913.64表1:酿红葡萄酒所用的酿酒葡萄的主成分分布图六:白葡萄酒所用的酿酒葡萄的主成分分布图从上图中选取m=8,即选取F1到F8为主要成分,其信息量可以达到总理化指标的95.28%85%,具体主成分分布见表2:白酒主成分名称F1F2F3F4F5F6F7F8白酒主成分所比重%67.9510.364.884.153.463.002.221.96表2
16、:酿白葡萄酒所用酿酒葡萄的主成分分布4.2.2针对酿酒葡萄主成分与葡萄酒得分之间的多元线性回归模型酿酒葡萄在一定程度上影响了葡萄酒的质量,本文将酿酒葡萄的主成分和较为可信的第二组评酒员评分联系起来,采用多元线性回归模型,把主成分分析得到的主成分看做线性回归因子来模拟葡萄酒样品的分数。最后得出酿酒葡萄的初步得分情况。酿酒葡萄的评价分数表达式为: (8)(1)针对酿酒葡萄的线性回归分析以及等级评判用Matlab软件求解得出酿制红葡萄酒所用葡萄的评价分数表达式以及红葡萄酒的得分与酿酒葡萄之间的线性回归分析图如下:酿酒葡萄的评分表达式可表示为: (9)图七:线性回归拟合值与实际值(红葡萄酒的评分)的比
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 本科 毕业设计 葡萄酒 评价 数学 建模 竞赛 论文
限制150内