数学建模 葡萄酒评价(22页).doc
《数学建模 葡萄酒评价(22页).doc》由会员分享,可在线阅读,更多相关《数学建模 葡萄酒评价(22页).doc(21页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、-A题:葡萄酒的评价 摘要本文主要进行了葡萄酒感官评价的可信度比较、酿酒葡萄评价分级、酿酒葡萄与葡萄酒的理化指标之间的联系、评价结果统计分析等方面的研究。通过方差分析、层次分析等方法建立模型,解决了葡萄酒的评价问题。问题一:利用方差分析法对评酒员评价数据进行分析,并用画出图表(见正文),直观地观察出两组评价数据范围接近,第二组评价数据波动不大,评价数据更可信。问题二:要求根据酿酒葡萄的理化指标和葡萄酒的质量,对这些酿酒葡萄进行分级,我们认为影响酿酒葡萄品质的因素较多,酿酒葡萄各理化指标之间的关系又是极其复杂的,对其的评价是一个多指标、多属性的问题。采用系统工程学的层次分析法()来确定影响葡萄品
2、质的各因素的权重,应用综合评判法,对酿酒葡萄进行了评价和分级。各等级下葡萄样品数如下表:等级葡萄种类优良中合格红葡萄54108白葡萄8892问题三:利用逐步回归法得到酿酒葡萄与葡萄酒的理化指标之间的关系,并用神经网络进行比较验证。问题四:通过聚类分析与神经网络相结合,分析酿酒葡萄与葡萄酒的理化指标和葡萄酒质量间的联系。通过理化指标得到葡萄酒质量评价分数,并与第二组评酒员评价出的葡萄酒质量评价分数对比分析,可知现阶段还不能用酿酒葡萄与葡萄酒的理化指标来评价酒的质量。本文的建模过程中,对于每个问题都充分考虑了影响因素,一定程度上体现了模型的可靠性,具有较强的适用性和普遍性。关键词:方差分析 逐步回
3、归分析 神经网络 聚类分析 数据处理系统一、问题重述通过聘请一些有资质的评酒员品尝葡萄酒,根据他们反馈意见来确定葡萄酒的质量。酿酒葡萄的好坏与所酿葡萄酒的质量有直接的关系,葡萄酒和酿酒葡萄检测的理化指标会在一定程度上反映葡萄酒和葡萄的质量。已知某一年份一些葡萄酒的评价结果,及该年份这些葡萄酒的和酿酒葡萄的成分数据。根据上述条件建立数学模型解决以下问题:1. 分析两组评酒员的评价结果有无显著性差异,哪一组结果更可信。2. 根据酿酒葡萄的理化指标和葡萄酒的质量对这些酿酒葡萄进行分级。3. 分析酿酒葡萄与葡萄酒的理化指标之间的联系。4分析酿酒葡萄和葡萄酒的理化指标对葡萄酒质量的影响,并论证能否用葡萄
4、和葡萄酒的理化指标来评价葡萄酒的质量。二、问题分析问题一:观察附表1中评酒员的评价结果数据,分析得出它们之间的差异。根据评酒员对各组葡萄酒的评价结果数据,寻求结果数据更加稳定的一组,作为目标,利用求方差的数学模型,对各个数量指标进行分析比较,得出更有可信度组。问题二:根据不同理化指标对于酿酒葡萄影响各不相同,用层次分析法构造比较矩阵。计算得到各个因素所对应的权重,定一个分数指标,根据分数对葡萄进行分级。问题三:题中葡萄与葡萄酒指标数分别为60、17,考虑因变量太多,用逐步回归分析法建立求解模型,结合神经网络模型进行对比验证。将多次测试值取平均数,获得可信数据。问题四:考虑参数过多,为剔除微小影
5、响因素,通过聚类分析法对影响指标进行归类,寻找主要因素,用神经网络建立模型,获得理化参数对葡萄酒的影响关系。对理化指标仿真得到新的质量指标分数,与第二组评酒员评价数据比较分析,作为论证依据。三、模型假设及符号说明3.1模型假设(1) 假设评酒员给出的评价数据不存在个人因素。(2) 假设一级指标只与一级指标相互影响,二级指标只与二级指标相互影响。(3) 假设葡萄分级时忽略二级指标对结果的影响。3.2符号说明: 表示第个处理观测值总体平均数。 :表示试验误差。 :表示处理对试验结果产生的影响。: 表示 总和。: 表示误差平方和。 表示处理间平方。 表示总变异的总平方和。:表示权重系数集。:表示隶属
6、度向量。:表示评价等级。表示红葡萄的第个一级指标。:表示白葡萄的第个一级指标。:表示红葡萄酒的第个一级指标。:表示白葡萄酒的第个一级指标。:表示红葡萄的第个二级指标。:表示白葡萄的第个二级指标。:表示红葡萄酒的第个二级指标。:表示白葡萄酒的第个二级指标。四、 模型的建立4.1问题一:通过建立方差分析模型对两组评酒员对葡萄酒的评分结果进行差异分析。4.1.1 数学模型反应全部观测值总变异的总平方和是个观测值与总平均数的离均差平方和,记为:用反映重复n次的处理间变异,称为处理间平方和记为为各处理内离均差平方和之和,反映了各处理内的变异即误差,称为处理内平方和或误差平方和,记为 4.1.2自由度的分
7、解处理内自由度为观测值的总个数减处理内自由度记为由于:因此: 各项平方和除以各自的自由度便得到总均方、处理间均方和处理内均方,分别记为 4.1.3 F检验通过与的比较来推断是否为零是否相等 即在的条件下,服从自由度与的分布。若实际计算的即,不能否定: 。若即,否定:。接受:若,即,否定:。接受: 差异小的一组评酒员的评价可信。4.2问题二4.2.1建立层析结构模型建立层次模型之前,应对酿酒葡萄进行分析。通过分析出影响目标相关因素,将评估酿酒葡萄的等级作为目标层的元素。对葡萄进行评级时可以从酿酒葡萄的理化指标和葡萄酒的质量二个方面分别考虑,将葡萄的理化指标、葡萄酒质量作为第二层的元素。从中提取相
8、关的类作为第三层的元素,例如从葡萄酒质量中的外观分析、香气分析、口感分析等,和葡萄理化指标中的各指标的含量。严格对应葡萄与两个评价因素的映射,将第三层的某些类细化为族。确定的层次模型示例如图4-2所示。酿酒葡萄等级葡萄酒质量葡萄理化指标外观分析口感分析VC含量花色苷香气分析氨基酸总量蛋白质 4.2.2构造判断矩阵判断矩阵表示针对上一层次某因素而言,本层次与之有关的各因素之间的相对重要性。其形式如下:表示对A层而言,B层中因素对的相对重要程度,通常取1、3、5、7、9及其他们的倒数,2、4、6、8表示第个因素相对于第个因素的影响介于上述两个相邻等级之间。判断矩阵B具有如下特征:、,其中。判断矩阵
9、中的是根据经验经过反复研究验证后确定。用层次分析法应保持判断矩阵的一致性,矩阵中的满足上述三条关系式时,说明判断矩阵具有完全的一致性。4.2.3层次单排序和一致性检测层次单排序是根据判断矩阵计算对于上一层某因素而言本层次与之有联系的因素的重要性次序的权重(的排序)。在矩阵运算中表现为求最大特征值对应的特征向量。采用方根法计算准则层的因素相对于目标层的层次单排序。各因素的权重向量为其中对进行归一化处理,得到,其中计算矩阵的最大特征根其中表示向量的第个元素。计算一致性指标:R.= ,其中RI为平均随机一致性指标,其变化情况如表4-2所示,当CR0.1,认为判断矩阵的一致性是可以接受的,否则应对判断
10、矩阵作适当调整。4.2.4层次总排序为了得到层次结构中每一层次的所有因素相对于总目标的层次总排序,需要将计算出来的层次单排序再次进行适当计算。假设层次结构模型是由目标层(A)、准则层(B)和指标层(C)所组成,准则层有m个因素,指标层有n个因素。已知B层对A层的层次单排序为: C层对B层的准则Bj的层次单排序为:则C层各指标对A层的层次总排序的方法为: C层各指标对目标层的层次总排序为:4.2.5确定评语集评语集是对各个安全因素可能做出的总的评价结果的集合。根据实际评估需要进行设计。把评语集定义为以下几个等级:=优,良,中等,合格。4.2.6确定因素集及其分层结构设F是各种等级因素的集合,把F
11、中的葡萄等级按照某一准则分类,一般将相近或相似的等级因素分为一组,设F中的等级因素有m组,即每个又有:,n为组成的子因素的个数。依次对各个子因素继续划分下层。4.2.7确定权重系数集权重系数集是根据各子因素对上一层父因素的重要程度,对每个子因素分配的权重系数的集合。每个映射一个函数值,组成的集合即为权重系数集,其中满足归一性和非负性条件,即:同理,可以得到下一层的权重系数:。权重系数集受主观因素影响较大,特别是当某一因素出现所有的专家都一致认为其中一个因素是重要的,而其它因素为0时,则在评估过程重会夸大该因素而忽略其它因素。前面步骤通过AHP法可以弱化该影响。4.2.8确定酿酒葡萄最终等级通过
12、层次分析法得到酿酒葡萄的分数并进行分级。4.3问题三分析酿酒葡萄与葡萄酒的理化指标之间的联系。由于给出的数据过多,我们采用逐步回归法进行求解。根据题目建立模型:对回归模型进行标准化得到得出:标准化的回归模型的矩阵: 标准化前后的关系得到标准化后的矩阵:采用逆紧凑变换法来对给出的多种指标进行分析。由经高斯消元法变换为,既可求出解。在逐步回归分析中,每引进一个变量或者剔除一个变量,都要对R进行一次求解求逆紧奏变换法变换。对给出的因素进行分析,引入方差贡献最大者。回归平方和越大,回归方程的效果就越好。得到葡萄与葡萄酒的理化指标之间个各个关系式。 采用 bp神经网络对给出的葡萄与葡萄酒的理化指标进行建
13、模。节点输出模型:隐节点输出模型: 输出节点输出模型: 其中,为非线形作用函数;为神经单元阈值。作用函数模型:作用函数是反映下层输入对上层节点刺激脉冲强度的函数又称刺激函数,这里取为(0,1)内连续取值Sigmoid函数:由于激励函数Sigmoid在接近0,1时,收敛速度慢,将训练样本、测试样本以及网络预测的输入样本值置于0.1-0.9区间,具体做法如下:误差计算模型:误差计算模型是反映神经网络期望输出与计算输出之间误差大小的函数: 为节点的期望输出值; 为节点计算输出值。自学习模型:引入动量因子提高网络的记忆能力以便使网络学习提速和降低陷入局部极小值的机会。动量项越多,只要网络学习的时间足够
14、长,网络总有机会慢慢爬出局部极小值。神经网络的学习过程,即连接下层节点和上层节点之间的权重矩阵的设定和误差修正过程。BP网络有师学习方式-需要设定期望值和无师学习方式-只需输入模式之分。自学习模型为 为学习因子;为输出节点的计算误差;为输出节点的计算输出;为动量因子。通过采用葡萄与葡萄酒的理化指标进行训练。得到葡萄的理化指标与葡萄酒的理化指标的关系。4.4问题四:采用聚类分析葡萄酒理化指标的参数与葡萄酒的质量分数进行分类,利用神经网络建立数学模型寻找酿酒葡萄与葡萄酒的理化指标与葡萄酒质量的影响关系。聚类分析指将物理或抽象对象的集合分组成为由类似的对象组成的多个类的分析过程。它是一种重要的人类行
15、为。聚类分析的目标就是在相似的基础上收集数据来分类。采用欧式距离来衡量同类样本的类似性与不同类的差异性。欧式距离中第个样品与第个样品之间的距离为:显然,愈小表示两个愈相似,反之则疏远。计算相关系数:采用类内距离和准则。表达式为:对葡萄与葡萄酒的理化指标与葡萄酒质量分数进行标准化后进行聚类分。方法是:根据样品冰柱图选择主要相关指标。建立bp神经网络模型,对葡萄酒质量影响的分析。通过学习筛选后的数据来进行分析。得到一定的关系。我们用学习后的网路来对葡萄与葡萄酒的理化指标进行仿真分析得到一个新的红葡萄酒与白葡萄酒的质量分数。通过分析第二组评酒员与新得到的分数进行对比。并对新的分数进行分析。来确定葡萄
16、与葡萄酒的理化指标能否进行葡萄酒的质量判断。五、 模型的求解与分析5.1问题一:根据上述模型,利用求解,结果如下:方差分析结果:表格 1 第一组红葡萄酒差异源SSdfMSFP-valueF crit行92.69626.0003.5656.5341.714E-161.543列28.2259.0003.1365.7483.273E-071.920误差127.674234.0000.545总计248.596269表格 2 第一组白葡萄酒差异源SSdfMSFP-valueF crit行44.44227.0001.6462.7891.627E-051.531列113.7859.00012.64221.4
17、211.630E-261.918误差143.414243.0000.590总计301.642279.000表格 3 第一组红葡萄酒差异源SSdfMSFP-valueF crit行26.62926.0001.0243.0503.749E-061.543列19.6449.0002.1826.5012.932E-081.920误差78.555234.0000.335总计124.829269.000 表格 4. 第二组白葡萄酒差异源SSdfMSFP-valueF crit行22.69627.0000.8402.0120.0031.531列37.8179.0004.20110.0613.948E-131
18、.918误差101.482243.0000.417总计161.996279.000作出直观图表:图表 2 第一组白葡萄酒图表 1 第一组红葡萄酒 图表 3 第二组红葡萄酒图表 4 第二组白葡萄酒 据直观图知,第一、二两组的评分范围接近,但第一组与第二组评酒员的评分对比,第一组波动较大。对比上述图表,第二组较第一组整体评分更稳定,因此第二组评价数据更可信。5.2问题二:查阅资料的到因素之间的重要关系,建立比较矩阵。矩阵如下:风味 加工营养根据比较矩阵可以得到特征值: 。归一化后的特征向量: 把归一化后的特征向量作为权值,对数据逐层加权求总分,得到葡萄等级分数。葡萄等级分类如下:葡萄分级表葡萄种类
19、分级葡萄样品号红葡萄优1 2 3 9 23良14 17 21 24中等5 6 8 10 12 13 16 19 20 22合格4 7 11 15 18 25 26 27白葡萄优3 10 21 23 24 25 27 28 良4 5 6 9 12 17 18 20中等1 2 8 11 13 14 15 19 26合格7 165.3问题三:用软件对模型进行逐步回归分析,得到酿酒葡萄与葡萄酒的理化指标之间的联系,得出以下结论:红葡萄酒花色苷与葡萄的花色苷鲜重、出汁率的关系为:,红葡萄酒单宁与葡萄总黄酮、可溶性固形物的关系为红葡萄酒的总酚、酒总黄酮以及白藜芦醇分别与酿酒葡萄的一级理化指标间的关系如下:
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 数学建模 葡萄酒评价22页 数学 建模 葡萄酒 评价 22
限制150内