感官分析统计方法学课件.ppt
感官分析统计方法学感官分析统计方法学第1页,此课件共69页哦 统统计计学学是是感感官官研研究究的的一一个个重重要要组组成成部部分分,要要成成为为一一名名专业感官研究人员,必须具备比较全面的统计学知识。专业感官研究人员,必须具备比较全面的统计学知识。l感官评价中误差产生的根源:感官评价中误差产生的根源:l不同的人,生理构造有差异不同的人,生理构造有差异l环境因素的影响环境因素的影响l人人们们在在语语言言表表达达上上有有所所差差别别,使使用用标标度度的的方方式式也不同也不同第2页,此课件共69页哦结果分析中图的好处结果分析中图的好处l在统计学中把利用统计图形表现统计资料的在统计学中把利用统计图形表现统计资料的方法叫做统计图示法。其特点是:形象具体、方法叫做统计图示法。其特点是:形象具体、简明生动、通俗易懂、一目了然。简明生动、通俗易懂、一目了然。第3页,此课件共69页哦l“条形图条形图”的特点是对各个时期或时点的数据的特点是对各个时期或时点的数据有直接对比的作用,对其数值大小,一目了然。有直接对比的作用,对其数值大小,一目了然。第4页,此课件共69页哦l“折线图折线图”的特点是对时期数列的数据的运动的特点是对时期数列的数据的运动轨迹以及发展趋势有较强的指示作用。轨迹以及发展趋势有较强的指示作用。第5页,此课件共69页哦l“扇形图扇形图”的特点是对数据中的各个分组的大的特点是对数据中的各个分组的大小和结构有明显的比较作用。小和结构有明显的比较作用。第6页,此课件共69页哦第7页,此课件共69页哦图的误用图的误用面积?面积?第8页,此课件共69页哦l美国国家食品药品管理局(美国国家食品药品管理局(FDA)要求新)要求新药的研发试验中,必须有统计学家来指导药的研发试验中,必须有统计学家来指导研究的设计、数据的分析、报告的呈递等。研究的设计、数据的分析、报告的呈递等。第9页,此课件共69页哦统计学在感官分析中的应用统计学在感官分析中的应用l描述:结果的简单描述(数据的收集、加工处描述:结果的简单描述(数据的收集、加工处理、显示方法、分布特征的概括等)理、显示方法、分布特征的概括等)l推论:为实验处理提供根据推论:为实验处理提供根据l衡量:估计变量间的相关程度(研究如何根据衡量:估计变量间的相关程度(研究如何根据样本信息来推断总体的特征)样本信息来推断总体的特征)第10页,此课件共69页哦研究的过程研究的过程实际问题实际问题收集数据收集数据(取得数据)(取得数据)分析数据分析数据(研究数据)(研究数据)数据整理数据整理(处理数据)(处理数据)解释数据解释数据(结果说明)(结果说明)分析方法分析方法第11页,此课件共69页哦1定性分析定性分析2定量分析定量分析(统计分析)(统计分析)描述统计描述统计推论统计推论统计复杂统计分析复杂统计分析计算机统计分析计算机统计分析平均数平均数标准差标准差Z检验检验t检验检验X2检验检验F检验检验方差分析、回归分析、聚类分析、判别方差分析、回归分析、聚类分析、判别函数分析、主成分分析、因素分析、路函数分析、主成分分析、因素分析、路径分析、结构方程模型径分析、结构方程模型第12页,此课件共69页哦产品质量产品质量分析分析结果结果分析分析结果结果分析分析结果结果分析分析结果结果分析分析结果结果单变量分析单变量分析色香味形色香味形多元回归多元回归因子分析因子分析主成分分析主成分分析相关分析相关分析第13页,此课件共69页哦l图表描述图表描述 条形图、柱形图、折线图、雷达图、条形图、柱形图、折线图、雷达图、箱线图等。箱线图等。第14页,此课件共69页哦l数据描述数据描述 集中程度:平均数集中程度:平均数 变异程度:标准差变异程度:标准差 分布的对称、陡峭程度;偏斜度、峭度分布的对称、陡峭程度;偏斜度、峭度第15页,此课件共69页哦l推论推论 剔除极端值剔除极端值/缺失值缺失值 选择显著性水平选择显著性水平l统计试验统计试验第16页,此课件共69页哦l通过检验样本平均数、标准差、方差、相关系数与相应的总体通过检验样本平均数、标准差、方差、相关系数与相应的总体参数或样本统计量之间是否存在差异,进而检验样本与总体或参数或样本统计量之间是否存在差异,进而检验样本与总体或样本与样本之间是否存在显著差异,并得出结论和对结论进行样本与样本之间是否存在显著差异,并得出结论和对结论进行推论。推论。统计检验统计检验二项分布二项分布计算成功的概率(对比试验、三点试验)计算成功的概率(对比试验、三点试验)t检验检验检验两个处理平均数差异是否显著检验两个处理平均数差异是否显著x2检验检验由质量形状得来的次数资料的显著性(喜欢、尚可、不喜欢)由质量形状得来的次数资料的显著性(喜欢、尚可、不喜欢)方差分析方差分析检验多个处理平均数间差异是否显著(单因子、双因子检验多个处理平均数间差异是否显著(单因子、双因子)第17页,此课件共69页哦常用统计数据的计算常用统计数据的计算1、数值的计算、数值的计算(1)平均值:是对数据分布的中心中心趋势)平均值:是对数据分布的中心中心趋势的估计,公式为:的估计,公式为:第18页,此课件共69页哦(2)样本标准差:是对平均值的波动幅度或覆)样本标准差:是对平均值的波动幅度或覆盖范围的估计,公式为:盖范围的估计,公式为:第19页,此课件共69页哦(3)中值:在所有数据中排序处于中间位置的)中值:在所有数据中排序处于中间位置的数值。数值。(4)标准误差:)标准误差:SE=S/(n)1/2 S为样本的标准差为样本的标准差第20页,此课件共69页哦2、置信区间、置信区间 置信区间是某参数真实值的可能变化范围,可用来判断置信区间是某参数真实值的可能变化范围,可用来判断数值是否精确数值是否精确第21页,此课件共69页哦试验敏感参数试验敏感参数l,也叫,也叫-风险,是统计学上的名词,他的风险,是统计学上的名词,他的定义是错误的估计两者之间的差别存在的定义是错误的估计两者之间的差别存在的可能性,也叫第可能性,也叫第类错误。类错误。l,也叫,也叫-风险,他的定义是错误估计两风险,他的定义是错误估计两者之间的差异不存在的可能性,也叫第者之间的差异不存在的可能性,也叫第类错误。类错误。lPd,是指能够分辨出差异的人数比例。,是指能够分辨出差异的人数比例。第22页,此课件共69页哦在统计学上在统计学上l值在值在10%5%(0.10.05),表明存在的差),表明存在的差异程度是中等。异程度是中等。l值在值在5%1%(0.050.01),表明存在的差),表明存在的差异程度是显著。异程度是显著。l值在值在1%0.1%(0.010.001),表明存在的),表明存在的差异程度是非常显著。差异程度是非常显著。l值低于值低于0.1%(0.001),表明存在的差异),表明存在的差异程度是特别显著。程度是特别显著。第23页,此课件共69页哦l值的范围在表明差异不存在的程度上,同值的范围在表明差异不存在的程度上,同值有着同有着同样的的规定。定。lPd 值的范围意义如下:值的范围意义如下:lPd 值值25%表示比例比较小,即能够分辨出差表示比例比较小,即能够分辨出差异的人的比例比较小。异的人的比例比较小。l25%Pd 值值35%表示能够分辨出差异的人的表示能够分辨出差异的人的比例中等。比例中等。lPd 值值35%表示能够分辨出差异的人的比例较表示能够分辨出差异的人的比例较大。大。第24页,此课件共69页哦假设检验假设检验l统计假设检验也称为显著性检验,即指样本统计量和假统计假设检验也称为显著性检验,即指样本统计量和假设的总体参数之间的显著性差异。设的总体参数之间的显著性差异。l假设检验时提出的假设称为原假设或无效假设,就是假假设检验时提出的假设称为原假设或无效假设,就是假定样本统计量与总体参数的差异都是由随机因素引起,定样本统计量与总体参数的差异都是由随机因素引起,不存在条件变动因素。不存在条件变动因素。第25页,此课件共69页哦假设检验的基本思路假设检验的基本思路l首先,对总体参数值提出假设(原假设);首先,对总体参数值提出假设(原假设);l然后,利用样本数据提供的信息来验证所提出的假设然后,利用样本数据提供的信息来验证所提出的假设是否成立(统计推断)。是否成立(统计推断)。l如果样本数据提供的信息不能证明上述假设成立,如果样本数据提供的信息不能证明上述假设成立,则证明该假设为错误;则证明该假设为错误;l如果样本数据提供的信息不能证明上述假设不成立,如果样本数据提供的信息不能证明上述假设不成立,则证明该假设成立。则证明该假设成立。第26页,此课件共69页哦假设检验的基本步骤假设检验的基本步骤l提出原假设(或称提出原假设(或称“零假设零假设”,H0););l选择检验统计量;选择检验统计量;l根据样本数据计算检验统计量观测值的发生概率根据样本数据计算检验统计量观测值的发生概率(相伴概率,(相伴概率,p););l根据给定的小概率事件界定标准(显著性水平,根据给定的小概率事件界定标准(显著性水平,如如0.05,0.01)做出统计推断。)做出统计推断。第27页,此课件共69页哦为什么要设计并计算检验统计量?为什么要设计并计算检验统计量?l在假设检验中,样本值(或更极端的取值)发生的概率在假设检验中,样本值(或更极端的取值)发生的概率不能直接通过样本数据计算,而是通过计算检验统计量不能直接通过样本数据计算,而是通过计算检验统计量观测值的发生概率而间接得到的。观测值的发生概率而间接得到的。l所设计的检验统计量一般服从或近似服从某种已知所设计的检验统计量一般服从或近似服从某种已知的理论分布(如的理论分布(如t-分布、分布、F-分布、卡方分布),易于估分布、卡方分布),易于估算其取值概率。算其取值概率。l对于不同的假设检验和不同的总体,会有不同的选择检对于不同的假设检验和不同的总体,会有不同的选择检验统计量的理论和方法。验统计量的理论和方法。第28页,此课件共69页哦计算检验统计量观测值的发生概率计算检验统计量观测值的发生概率 l在假定原假设成立的前提下,利用样本数据计算检验在假定原假设成立的前提下,利用样本数据计算检验统计量观测值发生的概率(即统计量观测值发生的概率(即p值,又称值,又称“相伴概率相伴概率”指该检验统计量在某个特定的极端区域在原假设成指该检验统计量在某个特定的极端区域在原假设成立时的概率)。该概率值间接地给出了在原假设成立的条立时的概率)。该概率值间接地给出了在原假设成立的条件下样本值(或更极端值)发生的概率。件下样本值(或更极端值)发生的概率。第29页,此课件共69页哦进行统计推断进行统计推断 l依据预先确定的依据预先确定的“显著性水平显著性水平”(即(即值),如值),如0.01或或0.05,决定是否拒绝原假设。,决定是否拒绝原假设。l如果如果p值小于值小于值,即认为原假设成立时检验统计量观值,即认为原假设成立时检验统计量观测值的发生是小概率事件,则拒绝原假设。否则,就测值的发生是小概率事件,则拒绝原假设。否则,就接受原假设。接受原假设。第30页,此课件共69页哦显著性水平显著性水平l在假设检验中,显著性水平(在假设检验中,显著性水平(Significant level,用,用表示)的表示)的确定是假设检验中至关重要的问题。确定是假设检验中至关重要的问题。l显著性水平是在原假设成立时检验统计量的制落在某个极端区显著性水平是在原假设成立时检验统计量的制落在某个极端区域的概率值。因此,如果取域的概率值。因此,如果取=0.05,如果计算出的,如果计算出的p值小于值小于,则可认为原假设是一个不可能发生的小概率事件。当然,则可认为原假设是一个不可能发生的小概率事件。当然,如果真的发生了,则犯错误的可能性为如果真的发生了,则犯错误的可能性为5%。l显然,显著性水平反映了拒绝某一原假设时所犯错误的可能性,显然,显著性水平反映了拒绝某一原假设时所犯错误的可能性,或者说,或者说,是指拒绝了事实上正确的原假设的概率。是指拒绝了事实上正确的原假设的概率。第31页,此课件共69页哦的取值的取值l一般在进行假设检验前由研究者根据实际的需要确定。一般在进行假设检验前由研究者根据实际的需要确定。l常用的取值是常用的取值是0.05或或0.01。对于前者,相当于在原假。对于前者,相当于在原假设事实上正确的情况下,研究者接受这一假设的可能设事实上正确的情况下,研究者接受这一假设的可能性为性为95%;对于后者,则研究者接受事实上正确的原;对于后者,则研究者接受事实上正确的原假设的可能性为假设的可能性为99%。l显然,降低显然,降低值可以减少拒绝原假设的可能性。因此,值可以减少拒绝原假设的可能性。因此,在报告统计分析结果时,必须给出在报告统计分析结果时,必须给出值。值。第32页,此课件共69页哦l在进行假设检验时,各种统计软件均会给出检验统计量观测值在进行假设检验时,各种统计软件均会给出检验统计量观测值以及原假设成立时该检验统计量取值的相伴概率(即检验统计以及原假设成立时该检验统计量取值的相伴概率(即检验统计量某特定取值及更极端可能值出现的概率,用量某特定取值及更极端可能值出现的概率,用p表示)。表示)。lp值是否小于事先确定的值是否小于事先确定的值,是接受或拒绝原假设的依据。值,是接受或拒绝原假设的依据。l如果如果p值小于事先已确定的值小于事先已确定的值,就意味着检验统计量取值的可值,就意味着检验统计量取值的可能性很小,进而可推断原假设成立的可能性很小,因而可以能性很小,进而可推断原假设成立的可能性很小,因而可以拒绝原假设。相反,如果拒绝原假设。相反,如果p值大于事先已确定的值大于事先已确定的值,就不能拒值,就不能拒绝原假设。绝原假设。第33页,此课件共69页哦l当检验统计量服从标准正态分布的,可以直接查阅事先准备好当检验统计量服从标准正态分布的,可以直接查阅事先准备好的标准正态分布函数表,从中获得特定计算结果的相伴概率。的标准正态分布函数表,从中获得特定计算结果的相伴概率。而对于服从而对于服从t-分布、分布、F-分布、卡方分布或其它特殊的理论分布的检分布、卡方分布或其它特殊的理论分布的检验统计量(大多数的假设检验是这样),无法直接计算相伴概率,验统计量(大多数的假设检验是这样),无法直接计算相伴概率,可以查阅各类假设检验的临界值表进行统计推断。这些表格以自由可以查阅各类假设检验的临界值表进行统计推断。这些表格以自由度和几个相伴概率(通常为度和几个相伴概率(通常为0.1、0.05和和0.01)为自变量,以检验)为自变量,以检验统计量的临界值为函数排列。统计量的临界值为函数排列。第34页,此课件共69页哦l在进行统计推断时,人们使用上述临界值表根据事在进行统计推断时,人们使用上述临界值表根据事先确定的显著性水平,查阅对应于某一自由度和特先确定的显著性水平,查阅对应于某一自由度和特定相伴概率的检验统计量的临界值,然后将所计算定相伴概率的检验统计量的临界值,然后将所计算出的检验统计量与该临界值相比较。如果检验统计出的检验统计量与该临界值相比较。如果检验统计量的计算值大于临界值,即实际的相伴概率小于事量的计算值大于临界值,即实际的相伴概率小于事先规定的显著性水平,便可拒绝原假设。否则,可先规定的显著性水平,便可拒绝原假设。否则,可接受原假设。接受原假设。第35页,此课件共69页哦l在假设检验中,只有在假设检验中,只有“显著显著”和和“不显著不显著”,没有,没有“极显著极显著”这样的断语。只要计算出的检验统计量的这样的断语。只要计算出的检验统计量的相伴概率(相伴概率(p值)低于事先确定的值)低于事先确定的值,就可以认为检值,就可以认为检验结果验结果“显著显著”(相关分析的原假设是(相关分析的原假设是“相关系数为零相关系数为零”,故此处的,故此处的“显著显著”实际意味着实际意味着“相关系数不为零相关系数不为零”,或,或说说“2个随机变量间有显著的相关关系个随机变量间有显著的相关关系”);同样,只要);同样,只要计算出的检验统计量的相伴概率(计算出的检验统计量的相伴概率(p值)高于事先确定值)高于事先确定的的值,就可以认为检验结果值,就可以认为检验结果“不显著不显著”。第36页,此课件共69页哦置信度置信度l置信度:也称为可靠度,或置信水平、置信系置信度:也称为可靠度,或置信水平、置信系数数,是指被考虑的量值在给定区间内的概率,是指被考虑的量值在给定区间内的概率(选定的或规定的选定的或规定的)。l置信区间:是指在某一置信水平下,样本统计置信区间:是指在某一置信水平下,样本统计值与总体参数值间误差范围。值与总体参数值间误差范围。l置信区间越大,置信度越高。置信区间越大,置信度越高。第37页,此课件共69页哦l置信水平就是变量落在置信区间的可能性,就是相信变置信水平就是变量落在置信区间的可能性,就是相信变量在设定的置信区间的程度,是个量在设定的置信区间的程度,是个01的数,用的数,用1-表表示。示。l显著性水平就是变量落在置信区间以外的可能性,显著性水平就是变量落在置信区间以外的可能性,“显著显著”就是与设想的置信区间不一样,用就是与设想的置信区间不一样,用表示。表示。l显然,显著性水平与置信水平的和为显然,显著性水平与置信水平的和为1。显著性水平如。显著性水平如果为果为,则置信度为则置信度为1-第38页,此课件共69页哦l显著性水平为显著性水平为0.05时,时,=0.05,1-=0.95l如果置信区间为(如果置信区间为(-1,1),即代表变量),即代表变量x在(在(-1,1)之间的可能性为之间的可能性为0.95。l显著性水平取显著性水平取0.05就是置信度为就是置信度为95%,取,取0.01置信度置信度就是就是99%。具体选哪个就看得到的结果了,如有大。具体选哪个就看得到的结果了,如有大部分都得部分都得P值都非常小,那就取值都非常小,那就取0.01了,要是了,要是P值都很值都很大,那就取大,那就取0.05好了。一般情况下,好了。一般情况下,0.05就可以,当就可以,当然然0.01就更精确了。就更精确了。第39页,此课件共69页哦l1-表表示示置置信信度度,置置信信度度表表示示原原假假设设成成立立的的概概率率,如如果果原原假假设设成成立立的的概概率率大大,就就接接受受原原假假设设,而而概概率率的的大大小小标标准准就就是是显显著著性性水水平平,在在显显著著性性水水平平为为5%的的时时候候,认认为为95%为为大大概概率率事事件件,在在显显著著性性水水平平为为1%时时,则则认认为为99%为大概率事件。为大概率事件。l总总之之,置置信信度度越越高高,显显著著性性水水平平越越低低,代代表表假假设设的的可可靠靠性越高,越好。性越高,越好。第40页,此课件共69页哦显著性水平选择显著性水平选择容易产生严重后果容易产生严重后果实验条件不易控制或实验条件不易控制或容易产生较大误差容易产生较大误差=0.05=0.0195%的置信区间的置信区间99%的置信区间的置信区间第41页,此课件共69页哦l显著性水平选择的实际应用显著性水平选择的实际应用品质管理品质管理消费者调查消费者调查政策性的调查政策性的调查0.10.050.01第42页,此课件共69页哦实验设计的基本原则实验设计的基本原则对照对照随机化随机化重复重复均衡均衡显示显示处理的处理的效应效应针对大量、针对大量、不可控制的不可控制的非处理因素非处理因素足够的足够的样本量、样本量、足够的功效足够的功效第43页,此课件共69页哦处理组处理组对照组对照组处理因素处理因素非处理非处理因素因素比较结比较结果果非处理非处理因素因素处理组与对照组之间处理组与对照组之间非处理因素非处理因素均衡均衡一致一致第44页,此课件共69页哦异常值异常值l系统误差系统误差/随机误差随机误差/过失误差过失误差l样本异常值:明显偏离所在样本的观测值样本异常值:明显偏离所在样本的观测值l异常值可能仅仅是数据中固有的异常值可能仅仅是数据中固有的随机误差的极随机误差的极端端表现,也可能是表现,也可能是过失误差。过失误差。第45页,此课件共69页哦异常值的剔除异常值的剔除将一组数据从小到大排列将一组数据从小到大排列计算的平均值和标准偏差计算的平均值和标准偏差计算统计量计算统计量T根据根据n和和查表,判断查表,判断第46页,此课件共69页哦品评员品评员色泽色泽外形外形表皮表皮内部组织内部组织甜味甜味松软性松软性滋润度滋润度121223222122222331223222422323225212221261222221722112228212223293222322102232221111222212122223122132332232145222122152221223总计总计30283230313030平均数平均数2.01.872.132.02.072.02.0第47页,此课件共69页哦l对于色泽:对于色泽:l结果排列:结果排列:2,1,1,.5,l计算平均值和标准差计算平均值和标准差l计算最大值计算最大值Ta和最小值和最小值Tb。l结论:查结论:查T值表,值表,n=15,a=0.01,Tn,a=2.71Ta=2.91,所以,所以5为异常值。为异常值。Tn,a=2.71Tb=0.97,所以,所以1为非异常值。为非异常值。第48页,此课件共69页哦样品样品品评员品评员交互作用交互作用样品编码样品编码样品间差异样品间差异品评员间品评员间差异差异品评员品评员筛选筛选第49页,此课件共69页哦样品编码的随机化样品编码的随机化l心理效应心理效应 顺序效应顺序效应l生理效应生理效应 感觉残留感觉残留数字数字符号符号中性字中性字字母字母第50页,此课件共69页哦品评员品评时的随机化品评员品评时的随机化(样品呈送时)(样品呈送时)l成对比较(成对比较(AB、BA)l二三点法二三点法 固定参照固定参照RAAB、RABA 平衡参照平衡参照RAAB、RABA、RBAB、RBBAl三点法(三点法(AAB、ABA、BAA、BBA、ABB)lA非非A法(法(AA、BB、AB、BA)NO.2NO.3NO.1AB第51页,此课件共69页哦样品间差异比较时方法的选择样品间差异比较时方法的选择l两个样品两个样品 成对比较、二三点法、三点法、评分、成对比较、二三点法、三点法、评分、A-非非Al三个以上样品三个以上样品 排序、评分、选择、五取二排序、评分、选择、五取二l嗜好型品评嗜好型品评 成对比较、选择、排序成对比较、选择、排序第52页,此课件共69页哦【例例】评分评分评价员评价员弹弹 性性合计合计ABCDP123 133P2130 22P3 331 21P4 23236P5 13215P633 226P703 1 20P8 3 2113合计合计 7192418原料配比不同的四种香肠制品,通过评分法判定这原料配比不同的四种香肠制品,通过评分法判定这四种香肠的弹性、色泽等有无差别。四种香肠的弹性、色泽等有无差别。第53页,此课件共69页哦方差分析方差分析计算各项平方和与自由度计算各项平方和与自由度列出方差分析表,进行列出方差分析表,进行F检验检验Duncan检验检验显著性差异判断显著性差异判断存在显著性差异存在显著性差异差异程度?差异程度?第54页,此课件共69页哦方差分析:方差分析:l误差校正值(误差校正值(CF)=评分总和评分总和2/试验总次数试验总次数 =182/32=10.125l样品平方和样品平方和=(各样品合计评分的平方和(各样品合计评分的平方和/各样品的试验次数)各样品的试验次数)-CF =(-7)2+192+22+42/8-CF=53.75-10.125=43.625l品评员平方和品评员平方和=(各品评员合计评分的平方和各品评员合计评分的平方和/各品评员的试验次各品评员的试验次数数)-CF =32+22+(-1)2+62+52+62+02+(-3)2/4-CF=120/4-10.125=19.875l总平方和总平方和=各评分分数的平方和各评分分数的平方和-CF =(-2)2+12+32+22+(-2)2+12-CF=156-10.125=43.625l样品自由度样品自由度=3,品评员自由度,品评员自由度=7,误差自由度,误差自由度=21第55页,此课件共69页哦l以样品自由度为分子自由度,误差自由度为分母自由度,查以样品自由度为分子自由度,误差自由度为分母自由度,查F分布表中相应的临界值,比较。若所计算的分布表中相应的临界值,比较。若所计算的F值大于某显著水平值大于某显著水平的的F临界值,表示在此显著水平存在差异。临界值,表示在此显著水平存在差异。lF值(值(3.7072)大于临界值()大于临界值(3.07),说明在),说明在5%显著水平存在差异。显著水平存在差异。l结论:结论:A、B、C、D四个样品,由于原料配比不同,成品的弹性在四个样品,由于原料配比不同,成品的弹性在5%显著水平存在显著差异。显著水平存在显著差异。差异原因差异原因自由度自由度平方和平方和方差方差F值值样品样品346.62514.54173.7072品评员品评员719.8751.83930.7238误差误差2182.3753.9226总计总计31145.875差异程度?差异程度?第56页,此课件共69页哦【例例】分类分类 由于加工工艺不同,通过检验,了解加工工艺对制品质量由于加工工艺不同,通过检验,了解加工工艺对制品质量的影响。的影响。1进行分类(如级别:进行分类(如级别:级级.)2检验分类之间有无显著性差异。检验分类之间有无显著性差异。X2=(AT)2/TA-观察值观察值T-期待值期待值12行总和行总和Ti.1A11(T11)A12(T12)T1.=A11+A122A21(T21)A22(T22)T1.=A21+A22列总列总和和T.iT.i=A11+A21T.2=A12+A22T.=A11+A12+A21+A2222列联表的一般形式列联表的一般形式第57页,此课件共69页哦l四种样品,通过检验分成为三类。为了四种样品,通过检验分成为三类。为了解工艺的不同对产品质量造成的影响,解工艺的不同对产品质量造成的影响,让让30个品评员按三类的划分进行了实验:个品评员按三类的划分进行了实验:级级级级级级A721230B189330C199230D1211730565014120 x2(4*3列联表列联表)第58页,此课件共69页哦级级级级级级A721230B189330C199230D1211730565014120级级级级级级A78.5 1.50B4 3.5 0.50C5 3.5 1.50D2 1.53.50000期待值期待值观察值观察值期待值期待值X2=19.49X2(41)(31),0.05)=12.59结论:三个类别在结论:三个类别在0.05水平上有差异(工艺对质量有影响)。水平上有差异(工艺对质量有影响)。第59页,此课件共69页哦【例例】选择选择lA、B、C三个以上样品中最喜欢(最不喜欢)哪个样品。三个以上样品中最喜欢(最不喜欢)哪个样品。某厂把自己生产的产品某厂把自己生产的产品X,与市场上销售的其他三个同类产,与市场上销售的其他三个同类产品品A、B、C进行比较,经过进行比较,经过60名品评员进行评价,并选名品评员进行评价,并选择一个最喜欢的样品。择一个最喜欢的样品。产品数产品数nXABC合计合计m认为此产品最好认为此产品最好的人数的人数xi202412460第60页,此课件共69页哦l1样品间差异判断。样品间差异判断。l2被多数人判断为最好的样品与其他样品间的被多数人判断为最好的样品与其他样品间的差异判断。差异判断。第61页,此课件共69页哦【例例】风味剖析风味剖析一般步骤一般步骤整理描述词汇整理描述词汇评价产品评价产品分析结果分析结果第62页,此课件共69页哦请适用你认为适宜的词,对产品的特性进行描述请适用你认为适宜的词,对产品的特性进行描述品尝前品尝前品尝中品尝中品尝后品尝后外观外观气味气味风味(味道风味(味道+芳香)芳香)质地(口感)质地(口感)质地(通过手或匙子)质地(通过手或匙子)用于删减描述词的标度用于删减描述词的标度没感觉没感觉0弱弱 1 稍弱稍弱2平均平均3稍强稍强4强强5第63页,此课件共69页哦l运用几何平均值运用几何平均值M将它们初步分级:将它们初步分级:lF描述词实际被述及的次数占该描述词所有描述词实际被述及的次数占该描述词所有可能被述及总次数的百分率;可能被述及总次数的百分率;lI评价小组实际给出的一个词的强度占该描评价小组实际给出的一个词的强度占该描述述词最大可能所的强度的百分率。词最大可能所的强度的百分率。第64页,此课件共69页哦l18个评价员用个评价员用9个描述词检验个描述词检验5种产品。每一个描述词可被述种产品。每一个描述词可被述及的次数为及的次数为90次(产品数次(产品数5乘以评价员数乘以评价员数18)。每一个描)。每一个描述词最大可能的强度为述词最大可能的强度为450(强度标度最大值(强度标度最大值5乘以产品数乘以产品数5乘以评价员数乘以评价员数18)。)。产产品品描述词描述词词词1词词2词词3词词4词词5词词6词词7词词8词词9112809817171122171701516941163212048011347135814141451906142323次数次数3947339544239638F值值43.352.23.343.36046.743.36.742.2第65页,此课件共69页哦产产品品描述词描述词词词1词词2词词3词词4词词5词词6词词7词词8词词9169430162764315192433303052449333332501342221143681068375055541903078511117强度强度15512810952071521032575I值值34.428.42.221.146.033.822.95.616.7第66页,此课件共69页哦描述词分类描述词分类参参数数描述词描述词词词1词词2词词3词词4词词5词词6词词7词词8词词9I0.3340.2840.0220.2110.4600.3380.2290.0560.167F0.4330.5220.0330.4330.6000.4670.4330.0670.422M0.3860.3850.0270.3020.5250.3970.3150.0610.265%38.638.52.730.252.539.731.56.126.5分类分类349612587列在最后两位的词列在最后两位的词3和词和词8可删除。可删除。第67页,此课件共69页哦用多元分析和方差分析二次删减描述词数目。用多元分析和方差分析二次删减描述词数目。l如:对如:对6个产品的描述词个产品的描述词1进行分析,通过方差进行分析,通过方差计算后值很小,即该计算后值很小,即该6个产品在这一特性上差个产品在这一特性上差别很小,那么可以将其删除。别很小,那么可以将其删除。第68页,此课件共69页哦l统计学家与科学研究者的合作者应该在实验设计阶段,而统计学家与科学研究者的合作者应该在实验设计阶段,而不是在需要数据处理的时候。不是在需要数据处理的时候。l试验完成后再找统计学家,无异于请统计学家为试验进试验完成后再找统计学家,无异于请统计学家为试验进行行“尸体解剖尸体解剖”。统计学家或许只能告诉你试验失败的。统计学家或许只能告诉你试验失败的原因。原因。第69页,此课件共69页哦