第六章方差分析.pptx
《第六章方差分析.pptx》由会员分享,可在线阅读,更多相关《第六章方差分析.pptx(212页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、方差分析方差分析(Analysis of variance,ANOVA)又叫变量分析,是英国著名统计学家又叫变量分析,是英国著名统计学家R.A.FisherR.A.Fisher于于2020世纪提出的。它是世纪提出的。它是用以检验用以检验两个或多个均数间两个或多个均数间两个或多个均数间两个或多个均数间差异的假设检验方法。它是一类特定情况下的统计假差异的假设检验方法。它是一类特定情况下的统计假设检验,或者说是平均数差异显著性检验的一种引伸。设检验,或者说是平均数差异显著性检验的一种引伸。方差分析的定义方差分析的定义方差分析的定义方差分析的定义第1页/共212页方差分析的方差分析的基本功能基本功能对
2、多组样本平均数差异的显著性进行对多组样本平均数差异的显著性进行检验检验第2页/共212页t t 检验可以判断两组数据平均数间的差异显著性,而方差分析既可以判断检验可以判断两组数据平均数间的差异显著性,而方差分析既可以判断两组又可以判断多组数据平均数之间的差异显著性。两组又可以判断多组数据平均数之间的差异显著性。有人说,我们可以把多组数据化成有人说,我们可以把多组数据化成n n个两组数据(化整个两组数据(化整为零),用为零),用n n次次t t检验来完成这个多组数据差异显著性的判检验来完成这个多组数据差异显著性的判断。断。第3页/共212页对多个处理进行平均数差异显著性检验时,采用对多个处理进行
3、平均数差异显著性检验时,采用t t检验法的缺点:检验法的缺点:1.1.检验过程烦琐。检验过程烦琐。试验包含个处理试验包含个处理t t 检验:检验:C C4 42 2 6 6次次缺缺 点点第4页/共212页缺缺 点点2.2.无统一的试验误差,误差估计的精确性和检验的无统一的试验误差,误差估计的精确性和检验的灵敏性低。灵敏性低。t t检验:检验:C C4 42 2 6 6次次需计算需计算 6 6个标准误个标准误误差估计不统一误差估计不统一误差估计精确性降低误差估计精确性降低第5页/共212页缺缺 点点3.3.推断的可靠性低,检验时犯推断的可靠性低,检验时犯错误概率大。错误概率大。t t检验:检验:
4、C C4 42 2 6 6次次H H0 0的概率:的概率:1-1-0.950.956 6次检验次检验相互独立相互独立6 6次都接受的概率次都接受的概率(0.95)(0.95)6 60.7350.735犯犯错误的概率错误的概率1-0.7351-0.7350.2650.265犯犯错误的概率明显增加错误的概率明显增加例如我们用例如我们用t t检验的方法检验检验的方法检验4 4个样本平均数之间的差异显著性个样本平均数之间的差异显著性第6页/共212页试验指标(experimental index):为衡量试验结果的好坏和处理效应的高低,在实验中具体测定的性状或观测的项目称为试验指标。常用的试验指标有:
5、身高、体重、日增重、酶活性、DNA含量等等。试验因素(experimental factor):试验中所研究的影响试验指标的因素叫试验因素。当试验中考察的因素只有一个时,称为单因素试验;若同时研究两个或两个以上因素对试验指标的影响时,则称为两因素或多因素试验。第7页/共212页因素水平(level of factor):试验因素所处的某种特定状态或数量等级称为因素水平,简称水平。如研究3个品种奶牛产奶量的高低,这3个品种就是奶牛品种这个试验因素的3个水平。试验处理(treatment):事先设计好的实施在实验单位上的具体项目就叫试验处理。如进行饲料的比较试验时,实施在试验单位上的具体项目就是具
6、体饲喂哪一种饲料。第8页/共212页试验单位(experimental unit):在实验中能接受不同试验处理的独立的试验载体叫试验单位。一只小白鼠,一条鱼,一定面积的小麦等都可以作为实验单位。重复(repetition):在实验中,将一个处理实施在两个或两个以上的试验单位上,称为处理有重复;一处理实施的试验单位数称为处理的重复数。例如,用某种饲料喂4头猪,就说这个处理(饲料)有4个重复。第9页/共212页第一节第一节 方差分析的基本原理方差分析的基本原理二、数学模型二、数学模型一、方差分析的基本思想、目的和用途一、方差分析的基本思想、目的和用途三、平方和与三、平方和与df的分解的分解四、统计
7、假设的显著性检验四、统计假设的显著性检验 五、多重比较五、多重比较第10页/共212页观观测测值值不不同同的的原原因因处理效应处理效应(treatment effect):处理不同引起处理不同引起试验误差:试验过程中偶然性试验误差:试验过程中偶然性因素的干扰和测量误差所致。因素的干扰和测量误差所致。方差:又叫均方,是标准差的平方,是表示变异的量。方差:又叫均方,是标准差的平方,是表示变异的量。在一个多处理试验中,可以得出一系列不同的观测值。在一个多处理试验中,可以得出一系列不同的观测值。第11页/共212页方差分析的基本思想方差分析的基本思想总变异处处理理效效应应试试验验误误差差第12页/共2
8、12页方差分析的目的方差分析的目的确定各种原因在总变异中所占的重要程度。确定各种原因在总变异中所占的重要程度。处理效应处理效应试验误差试验误差相差不大,说明试验处理对指标影响不大。相差不大,说明试验处理对指标影响不大。相差较大,即处理效应比试验误差大得多,相差较大,即处理效应比试验误差大得多,说明试验处理影响是很大的,不可忽视。说明试验处理影响是很大的,不可忽视。第13页/共212页方差分析的用途方差分析的用途1.1.用于多个样本平均数的比较用于多个样本平均数的比较2.2.分析多个因素间的交互作用分析多个因素间的交互作用3.3.回归方程的假设检验回归方程的假设检验4.4.方差的同质性检验方差的
9、同质性检验1.1.用于多个样本平均数的比较用于多个样本平均数的比较2.2.分析多个因素间的交互作用分析多个因素间的交互作用第14页/共212页二、数学模型二、数学模型假定有假定有k k组观测数据,每组有组观测数据,每组有n n个观测值,则共有个观测值,则共有nknk个观测值个观测值平均平均T=xij TkTiT2T1总和总和xk1xk2xkjxknxi1xi2x xij ijxinx21x22x2jx2nx11 x12 x1jx1n12jnki21 处理处理重复重复x x1 x2 xi xk 第15页/共212页用线性模型用线性模型(linear model)(linear model)来描述
10、每一观测值:来描述每一观测值:xij=+i+ij(i=1,2,3(i=1,2,3,k j=1,2,3,k j=1,2,3,n),n)总体平均数总体平均数i 处理效应处理效应ij 试验误差试验误差xij 是在第是在第 i 次处理下的第次处理下的第 j 次观测值次观测值要求要求ij 是相互独立的,且服从标准正态是相互独立的,且服从标准正态分布分布 N(0,2)二、数学模型二、数学模型第16页/共212页对于由样本估计的线性模型为对于由样本估计的线性模型为:xij=x+ti+eijx 样本平均数样本平均数ti 样本处理效应样本处理效应eij 试验误差试验误差二、数学模型二、数学模型xij=+i+ij
11、 第17页/共212页根据的根据的i i不同假定,可将数学模型分为以下三种不同假定,可将数学模型分为以下三种:固定模型固定模型随机模型随机模型混合模型混合模型二、数学模型二、数学模型第18页/共212页(一一)固定模型固定模型(fixed model)(fixed model)指各个处理的效应值指各个处理的效应值i i 是固定值是固定值,各个的平均效应,各个的平均效应i i i i 是一个常量,且是一个常量,且i i 0 0。就是说除去随机误差以后每个处理所产生的效。就是说除去随机误差以后每个处理所产生的效应是固定的。应是固定的。二、数学模型二、数学模型实验因素的各水平是根据试验目的事先主观选
12、定的而不是随机选定的。第19页/共212页不同离子对木聚糖酶活性的影响不同离子对木聚糖酶活性的影响(mg/ml)(mg/ml)0.000.250.500.751.001.250.000.060.120.180.240.300.000.400.80.80 01.201.602.000.000.400.600.801.001.20固定模型固定模型Na+K+Cu2+Mn2+二、数学模型二、数学模型第20页/共212页在固定模型中,除去随机误差之后的每个处理所产生的效应是固定的,试在固定模型中,除去随机误差之后的每个处理所产生的效应是固定的,试验重复时会得到相同的结果验重复时会得到相同的结果方差分析所
13、得到的结论只适合于选定的那几个水平,并不能将其结论扩方差分析所得到的结论只适合于选定的那几个水平,并不能将其结论扩展到未加考虑的其它水平上。展到未加考虑的其它水平上。固定模型固定模型二、数学模型二、数学模型第21页/共212页(二二)随机模型随机模型(random model)(random model)指各处理的效应值指各处理的效应值i i 不是固定的数值,而是由随机因素所引起的效应。不是固定的数值,而是由随机因素所引起的效应。这里这里i i 是一个随机变量,是从期望均值为是一个随机变量,是从期望均值为 0 0,方,方差为差为2 2 的标准正态总体中得到的随机变量。得出的结的标准正态总体中得
14、到的随机变量。得出的结论可以推广到多个随机因素的所有水平上。论可以推广到多个随机因素的所有水平上。二、数学模型二、数学模型第22页/共212页随机模型随机模型美国的黑核桃品种对不同地理条件的适应情况美国的黑核桃品种对不同地理条件的适应情况气候、水肥、土壤气候、水肥、土壤无法人为控制无法人为控制河南河南北京北京广州广州江苏江苏新疆新疆二、数学模型二、数学模型如果实验条件不能人为控制,那么这个样本对所属如果实验条件不能人为控制,那么这个样本对所属总体作出推断就属于随机模型。总体作出推断就属于随机模型。第23页/共212页随机模型随机模型在随机模型中,水平确定之后其处理所产生的效应并不是固定的,试验
15、重在随机模型中,水平确定之后其处理所产生的效应并不是固定的,试验重复时也很难得到相同的结果复时也很难得到相同的结果方差分析所得到的结论,可以推广到这个因素的所有水平上方差分析所得到的结论,可以推广到这个因素的所有水平上二、数学模型二、数学模型第24页/共212页固定模型与随机模型的比较固定模型与随机模型的比较1.1.两者在两者在设计思想和统计推断设计思想和统计推断设计思想和统计推断设计思想和统计推断上有明显不同,因此进行上有明显不同,因此进行方差分析时的公式推导也有所不同。其平方和与方差分析时的公式推导也有所不同。其平方和与dfdf的分的分解公式没有区别,但在进行统计推断时假设检验构成的解公式
16、没有区别,但在进行统计推断时假设检验构成的统计数统计数统计数统计数是不同的。是不同的。2.2.模型分析的侧重点也不完全相同,方差期望值也不模型分析的侧重点也不完全相同,方差期望值也不一样,固定模型主要侧重于一样,固定模型主要侧重于效应值效应值效应值效应值的估计和比较,而随的估计和比较,而随机模型则侧重效应机模型则侧重效应方差方差方差方差的估计和检验的估计和检验3.3.对于单因素方差分析来说,两者并无多大区别对于单因素方差分析来说,两者并无多大区别二、数学模型二、数学模型第25页/共212页(三三)混合模型混合模型(mixed model)(mixed model)指多因素试验中既有固定因素又有
17、随机因素时所用的模型指多因素试验中既有固定因素又有随机因素时所用的模型在实际应用中,固定模型应用最多,随机模型和混合模型相在实际应用中,固定模型应用最多,随机模型和混合模型相对较少对较少二、数学模型二、数学模型第26页/共212页方差是离均差平方和除以自由度的商方差是离均差平方和除以自由度的商2(x-)2 N(x-x)2 s2 2=n-1要把一个试验的总变异依据要把一个试验的总变异依据变异来源变异来源变异来源变异来源分为相应的变异,首先要将总平方和分为相应的变异,首先要将总平方和和总和总dfdf分解为各个变异来源的的相应部分。分解为各个变异来源的的相应部分。方差分析的方差分析的基本思想基本思想
18、基本思想基本思想引起观测值出现变异分解为处引起观测值出现变异分解为处理效应的变异和试验误差的变异。理效应的变异和试验误差的变异。第27页/共212页平均平均T=xij TkTiT2T1总和总和xk1xk2xkjxknxi1xi2xijxinx21x22x2jx2nx11 x12 x1jx1n12jnki21处理处理重复重复x x1 x2 xi xk 处理间平均数的处理间平均数的差异是由处理效差异是由处理效应引起的:应引起的:处理内的变异是处理内的变异是由随机误差引起:由随机误差引起:平平方方和和(x-xi)(xi x)第28页/共212页根据线性可加模型,则有:根据线性可加模型,则有:平平方方
19、和和(xi x)(x-x)(x-xi)+(x-x)2 2(x-xi)+(xi x)(xi x)2(x-x)2 1 n 1 n(x-xi)2+(x-xi)(xi x)21 n+1 n 每一个处理每一个处理n n 个观测值离均差平方和累加:个观测值离均差平方和累加:(x-xi)2+2(x-xi)(xi x)+(xi x)2 0第29页/共212页平均平均T=xij TkTiT2T1总和总和xk1xk2xkjxknxi1xi2xijxinx21x22x2jx2nx11 x12 x1jx1n12jnki21处理处理重复重复x x1 x2 xi xk(xi x)0(x-xi)21 n 第30页/共212
20、页(xi x)(x-xi)由于由于 0,则:,则:21 n(x-x)2 (xi x)2(x-xi)2 n n 11+1 n(xi x)2(x-xi)2(x-x)2 1 n 1 k 1 n 1 k+n1 k 总平方和总平方和 SST 处理内或组处理内或组内平方和内平方和 SSe处理间或组处理间或组间平方和间平方和 SSt平平方方和和把把k k 个处理的离均差平方在累加,得个处理的离均差平方在累加,得第31页/共212页平平方方和和总平方和处理间平方和总平方和处理间平方和 +处理内平方和处理内平方和SST SSt+SSeSST (x-x)21 n 1 k=x2-T2 kn(x)2 kn x2-SS
21、T x2-C令矫正数令矫正数C ,则:则:T2 kn第32页/共212页平平方方和和SSt n1 k(xi x)2 k n(-2 +)1x xi i2 2 x xi ixx2=n n -+nknk1 k x xi i2 2 2n 1 k xx xi ix2=-2nk +n1 k x xi i2 2 x2 nkxnkx2 2 =-n1 k x xi i2 2 nkxnkx2 2 =-n n1 k T Ti i2 2 n2 nkT T2 2(nk)2=T Ti i2 2 -Cn11 k x xi i=kxx xi i=T Ti in n=T Tnknkx第33页/共212页总平方和:总平方和:SS
22、T x2-C 处理间平方和:处理间平方和:SSt=T Ti i2 2 -Cn1处理内平方和:处理内平方和:SSe=SST -SSt平平方方和和第34页/共212页自自由由度度总自由度也可分解为处理间自由度和处理内自由度:总自由度也可分解为处理间自由度和处理内自由度:dfT=dft+dfe总总 df处理间处理间df处理内处理内df第35页/共212页自由度自由度dfT=nk-1nk-1dft=k-1k-1dfe=dfT-dft=nk-1-(k-1)=nk-k=k(n-1)平均平均T=xij TkTiT2T1总和总和xk1xk2xkjxknxi1xi2xijxinx21x22x2jx2nx11 x
23、12 x1jx1n12jnki21处理处理重复重复x x1 x2 xi xk 第36页/共212页根据各变异部分的平方和和自由度,可求得根据各变异部分的平方和和自由度,可求得处理间方差处理间方差(st2)和和处处理内方差理内方差(se2 ):):st2=SStdftSSedfese2=第37页/共212页平方和平方和自由度自由度方差方差处理间处理间处理内处理内总变异总变异第38页/共212页某猪场对某猪场对4 4个不同品种幼猪进行个不同品种幼猪进行4 4个月增重量的测个月增重量的测定,每个品种选择体重接近的幼猪定,每个品种选择体重接近的幼猪4 4头,测定结果列于头,测定结果列于下表,试进行方差
24、分析。下表,试进行方差分析。=27.227.924.125.830.9T=434.4111.496.2103.2123.6T Ti i27.030.829.024.622.223.026.724.324.825.726.825.931.924.031.835.91234沈花沈花沈黑沈黑沈白沈白大白大白品品 种种重重复复x xi ixk=4,n=4,nk=16第39页/共212页例例 =27.227.924.125.830.9T=434.4111.496.2103.2123.6T Ti i27.030.829.024.622.223.026.724.324.825.726.825.931.924
25、.031.835.91234沈花沈黑沈白大白 品 种重复x xi ix4个不同品种猪个不同品种猪4个月的增重量个月的增重量(kg)(1)平方和的计算:平方和的计算:T2 knC434.42 1611793.96SST x2-C 31.92+24.02+24.62-C213.3SSt=T Ti i2 2 -Cn11/4(123.62+103.22+111.42)-C103.94SSe SST-SSt=213.3-103.94=109.36第40页/共212页例例(2)自由度的计算:自由度的计算:dfdfT T nk-1 nk-1=16-1=15=16-1=15dfdft t=k-1 k-1=4-
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 第六 方差分析
限制150内