研究生统计学讲义第5讲第5章方差分析.ppt
《研究生统计学讲义第5讲第5章方差分析.ppt》由会员分享,可在线阅读,更多相关《研究生统计学讲义第5讲第5章方差分析.ppt(54页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、第第5 5章章方差分析方差分析analysisofvariance,ANOVA方差分析目的是利用变异的关系来判别多组资料方差分析目的是利用变异的关系来判别多组资料的总体平均值是否有差别。基本思想是:先假设(的总体平均值是否有差别。基本思想是:先假设(H0)各总体均数全相等;将总变异)各总体均数全相等;将总变异SS总总,按设计和资料,按设计和资料分析的需要分为两个或多个组成部分,其自由度也相分析的需要分为两个或多个组成部分,其自由度也相应地分为几个部分,以随机误差为基础,按应地分为几个部分,以随机误差为基础,按F分布的分布的规律作统计推断。规律作统计推断。方差分析首先要进行方差分析首先要进行F
2、检验,统计量为检验,统计量为F,我们先,我们先介绍其统计量的分布介绍其统计量的分布F分布。分布。定义:如果随机变量定义:如果随机变量X1、X2分别服从自由度为分别服从自由度为df1,df2的的 2分布,则称随机变量分布,则称随机变量预备知识预备知识服从自由度为服从自由度为df1,df2的的F分布分布(F-distribution)。F0.05(5,10)=3.33,P(F 3.33)=0.05;P(F12.1)=0.01,P(F 12.1)=0.01,P(F 39.36)=0.025,P(F 1F 要大于要大于1多少才有统计意义呢?可查多少才有统计意义呢?可查F 界值表界值表(见附表见附表6)
3、得得P 值,按值,按P 值的大小作出推断结论。值的大小作出推断结论。2.2.方差分析的应用条件方差分析的应用条件 (1)各样本是相互各样本是相互独立独立的随机样本的随机样本。(2)正态性正态性(normality),各样本来自正态分布总体。方,各样本来自正态分布总体。方差分析的这一应用条件是对样本含量较小时的资料而言,差分析的这一应用条件是对样本含量较小时的资料而言,对于样本含量较大的资料来说,则样本不论来自什么总对于样本含量较大的资料来说,则样本不论来自什么总体,方差分析都是强有力的分析方法。因为当各组的样体,方差分析都是强有力的分析方法。因为当各组的样本含量较大时,样本均数近似正态分布。本
4、含量较大时,样本均数近似正态分布。(3)各比较组总体方差相等各比较组总体方差相等(12=22=k2),称为,称为方方差齐性差齐性(homogeneityofvariance)。方差分析的这一)。方差分析的这一应用条件主要是对完全随机设计资料而言,注意:无应用条件主要是对完全随机设计资料而言,注意:无重复数据的方差分析,如配伍设计、交叉设计、正交重复数据的方差分析,如配伍设计、交叉设计、正交设计的方差分析,因每个单元格子中只有一个观察数设计的方差分析,因每个单元格子中只有一个观察数据,不需考虑正态性和方差齐性的要求。据,不需考虑正态性和方差齐性的要求。3.方差分析的优点方差分析的优点方差分析的优
5、点有:方差分析的优点有:不受对比的不受对比的组数之限制;组数之限制;可同时分析多个因素的作用;可同时分析多个因素的作用;可分可分析因素间的交互作用。析因素间的交互作用。第二节第二节 完全随机设计资料的多个样本均数比较完全随机设计资料的多个样本均数比较一、完全随机设计资料的方差分析一、完全随机设计资料的方差分析单因素方差分析单因素方差分析(one-wayANOVA)H0:1=2=n,H1:1,2,n不等或不不等或不全等;全等;=0.05。单因素方差分析(完全随机设计多个样本均数比单因素方差分析(完全随机设计多个样本均数比较的方差分析)检验统计量为较的方差分析)检验统计量为F 值:值:FMS组间组
6、间/MS组内组内(6.6)如果如果F,在,在水平上不拒绝水平上不拒绝H0,认为多,认为多个总体均数间差别无统计学意义,个总体均数间差别无统计学意义,如果如果FF,则,则P,在,在水平上拒绝水平上拒绝H0,认为多个,认为多个总体均数间差别有统计学意义,但并不意味着任何两总体均数间差别有统计学意义,但并不意味着任何两总体均数有差别,只能说至少有两组有差别,可能有总体均数有差别,只能说至少有两组有差别,可能有的组间没有差别,要了解哪些组间有差别,哪些组间的组间没有差别,要了解哪些组间有差别,哪些组间没有差别,需要进一步作多个样本均数间的两两比较。没有差别,需要进一步作多个样本均数间的两两比较。二、多
7、重比较二、多重比较 多重比较多重比较(multiplecomparison)即多个样本均数即多个样本均数间的两两比较,由于涉及的对比组数大于间的两两比较,由于涉及的对比组数大于2,若仍用,若仍用t检验作每两个对比组比较的结论,会使犯第一类错误检验作每两个对比组比较的结论,会使犯第一类错误的概率的概率增大,即可能把本来无差别的两个总体均数增大,即可能把本来无差别的两个总体均数判为有差别。判为有差别。例如有例如有4个样本均数间的两两比较有个样本均数间的两两比较有42=4!/2!(4-2)!6种情况,即可有种情况,即可有6次对比,若每次比次对比,若每次比较的检验水准较的检验水准=0.05,则每次比较
8、不犯第一类错误的概,则每次比较不犯第一类错误的概率为率为0.95,按概率的乘法定理,按概率的乘法定理,6次比较均不犯第一类次比较均不犯第一类错误的概率为错误的概率为(1-0.05)660.2649,比,比0.05大多了。大多了。例例5.2曾经有人观察甲、乙两种性激素对成四种中曾经有人观察甲、乙两种性激素对成四种中药纤维细胞生长的影响,以安慰剂为对照,三组样本药纤维细胞生长的影响,以安慰剂为对照,三组样本含量均为含量均为10,结果是甲组为,结果是甲组为364,乙组为,乙组为393,安慰,安慰剂组为剂组为404。按检验水准。按检验水准=0.05,使用,使用t 检验作两两检验作两两比较,结论:甲组与
9、乙组组比较比较,结论:甲组与乙组组比较t=1.897,P0.05,差异无统计学意义;乙组与安慰剂组比较,差异无统计学意义;乙组与安慰剂组比较,t=0.632,P0.05,差异无统计学意义;甲组与安慰剂组比较,差异无统计学意义;甲组与安慰剂组比较,t=2.236,P0.04,差异有统计学意义。显然在逻辑上,差异有统计学意义。显然在逻辑上是矛盾的。是矛盾的。本例方差分析的本例方差分析的F=2.96;根据组间自由度;根据组间自由度df组间组间k-13-12,组内自由度,组内自由度df组内组内=N-k=30-3=27,F 界值界值F0.05(2,27)=3.35,F0.05,所以,正确的结果应当,所以
10、,正确的结果应当是三组之间差异并无统计学意义。是三组之间差异并无统计学意义。多个样本均数比较一般有两种情况:一种是在研究多个样本均数比较一般有两种情况:一种是在研究设计阶段未预先考虑或未预料到,经数据结果的提示设计阶段未预先考虑或未预料到,经数据结果的提示后,才决定用多个均数间的两两比较,常见于探索性后,才决定用多个均数间的两两比较,常见于探索性研究,这种情况下,往往涉及到任意两个均数的比较。研究,这种情况下,往往涉及到任意两个均数的比较。另一种是在设计阶段就根据研究目的或专业知识而决另一种是在设计阶段就根据研究目的或专业知识而决定的某些均数间的两两比较,常见于事先有明确假设定的某些均数间的两
11、两比较,常见于事先有明确假设的证实性实验研究,例如多个处理组分别与一个对照的证实性实验研究,例如多个处理组分别与一个对照组的比较,处理后不同时间分别与处理前的比较等。组的比较,处理后不同时间分别与处理前的比较等。多个实验组分别与一个对照组比较常用多个实验组分别与一个对照组比较常用Dunnett法。法。每两个均数的比较常用最小显著差值(每两个均数的比较常用最小显著差值(LSD)、)、SNK(Student-Newman-Keuls)法,又称)法,又称q 检验;也检验;也常用常用Tukey法、法、Bonferroni校正法、校正法、Duncan的多重极的多重极差检验差检验。Bonferroni校正
12、法的思想是考虑到若以校正法的思想是考虑到若以m 代表代表t 检检验次数验次数,每次使用每次使用水平进行比较水平进行比较,m 次比较均不犯次比较均不犯类错误的概率为类错误的概率为:(1)m总的检验犯第一类错误的概率为总的检验犯第一类错误的概率为:1(1)m值很小的时,值很小的时,1(1)m m以以Pmin代表代表m次次t检验中的最小检验中的最小P 值,以值,以P校正校正代表校代表校正正P 值,当值,当P校正校正mPmin时,总的检验水准近似是时,总的检验水准近似是。所以,当总检验水准为所以,当总检验水准为时,进行多组间两两比较须时,进行多组间两两比较须坚持坚持P校正校正=mPmin作为判断具有统
13、计学意义的界值;作为判断具有统计学意义的界值;换言之换言之,只有只有m 次次t 检验中的检验中的才推断差异在总检验水准为才推断差异在总检验水准为下具有统计学意义,下具有统计学意义,这就是这就是Bonferroni标准,利用标准,利用Bonferroni标准进行多组标准进行多组比较的方法,称为比较的方法,称为Bonferroni校正法。校正法。例例5.3已知表已知表5-1资料满足方差分析的应用条件,试分资料满足方差分析的应用条件,试分析四种用药情况对小白鼠细胞免疫机能的影响是否相析四种用药情况对小白鼠细胞免疫机能的影响是否相同。同。本例资料一个研究因素,满足方差分析的应用条件,本例资料一个研究因
14、素,满足方差分析的应用条件,比较各组总体均数相等用单因素方差分析法。比较各组总体均数相等用单因素方差分析法。H0:1=2=3=4即各总体均数相等即各总体均数相等,H1:各总体均各总体均数不全不等数不全不等;=0.05输出结果输出结果第三节第三节 配伍组设计资料的方差分析及多重比较配伍组设计资料的方差分析及多重比较 配伍组设计的多个样本均数比较,符合方差分析配伍组设计的多个样本均数比较,符合方差分析条件时,可用无重复数据的两因素方差分析条件时,可用无重复数据的两因素方差分析(Two-wayANOVA)。两因素是指主要的。两因素是指主要的处理因素和配伍因素。处理因素和配伍因素。配伍组设计试验的结果
15、按处理和配伍两个因素纵横排配伍组设计试验的结果按处理和配伍两个因素纵横排列构成多行多列资料,每个格子中仅有一个数据,故列构成多行多列资料,每个格子中仅有一个数据,故称无重复数据。称无重复数据。例例5.4为了控制年龄因素对治愈某病所需时间的影响,为了控制年龄因素对治愈某病所需时间的影响,采用了配伍组设计,选定采用了配伍组设计,选定5个年龄组,每组个年龄组,每组3个病人,个病人,随机分配到不同的处理组中去,资料如表随机分配到不同的处理组中去,资料如表6-2,试分析,试分析三种疗法治愈某病所需时间是是否相等。三种疗法治愈某病所需时间是是否相等。一、配伍组设计资料的方差分析一、配伍组设计资料的方差分析
16、年年龄龄组组(岁岁)疗疗法法中西医结中西医结合合中中医医西医西医20以下以下20304050及以上及以上78910119999121010121214处理组处理组H0:1=2=3,即不同疗法治愈天数的总,即不同疗法治愈天数的总体均数相等;体均数相等;H1:不同疗法治愈天数的总体均数有不:不同疗法治愈天数的总体均数有不等或全不相等。等或全不相等。=0.05配伍组配伍组H0:不同年龄治愈天数的总体均数相等;:不同年龄治愈天数的总体均数相等;H1:不同年龄的治愈天数的总体均数有不等或全不等。:不同年龄的治愈天数的总体均数有不等或全不等。=0.05Analyze,GeneralLinearModels
17、,UnivariateTestsofBetween-SubjectsEffectsDependentVariable:治愈天数治愈天数 CorrectedModel43.467(a)67.24416.718.000Intercept1520.06711520.0673507.846.000年龄年龄24.93346.23314.385.001疗法疗法18.53329.26721.385.001Error3.4678.433Total1567.00015SourceTypeIIISumofSquaresdfMeanSquareFSig.CorrectedTotal46.93314中西结中西结合合中
18、医中医-.6000.41633.188-1.5601.3601西医西医-2.6000(*).41633.000-3.5601-1.6399中医中医中西结中西结合合.6000.41633.188-.36011.5601西医西医-2.0000(*).41633.001-2.9601-1.0399西医西医中西结中西结合合2.6000(*).41633.0001.63993.5601(I)法法(J)法法MeanDifferenc(I-J)Std.ErrorSig.95%ConfidenceIntervalLowerBoundUpperBound中医中医2.0000(*).41633.0011.0399
19、2.9601MultipleComparisons二二 、完全随机设计与配伍设计方差分析的比较、完全随机设计与配伍设计方差分析的比较 例例5.2和例和例5.1不同的是多增加了不同的是多增加了“配伍组配伍组”。测定。测定结果的变异除了不同处理结果的变异除了不同处理(疗法疗法)组的变异和随机误差组的变异和随机误差外,还存在配伍组外,还存在配伍组(不同年龄不同年龄)变异,记为变异,记为SS配伍配伍,所以,所以,配伍组设计的方差分析中,可将总变异分为三部分,配伍组设计的方差分析中,可将总变异分为三部分,即即SS总总=SS处理处理+SS配伍配伍+SS误差误差。自由度也相应分为三。自由度也相应分为三部分,
20、即部分,即df总总=df处理处理+df配伍配伍+df误差误差。分别检验处理组间。分别检验处理组间变异、配伍组间变异有无统计的意义。配伍组设计与变异、配伍组间变异有无统计的意义。配伍组设计与分析的目的是为了减少误差。若配伍组间变异无统计分析的目的是为了减少误差。若配伍组间变异无统计的意义,则将配伍与误差合并为组内,为完全随机设的意义,则将配伍与误差合并为组内,为完全随机设计试验的方差分析。计试验的方差分析。完全随机设计完全随机设计配伍设计配伍设计F值公式值公式F处理处理=MS处理处理/MS组内组内F处理处理=MS处理处理/MS误差误差F的分母的分母MSMS组内组内=SS组内组内/df组内组内MS
21、误差误差=SS误差误差/df误差误差MS的的 分分 子子SSSS组内组内=SS总总SS处理处理SS误误差差=SS总总SS处处理理SS配伍配伍MS的分母的分母dfdf组内组内=df总总df处理处理df组内组内=k(n1)df误误差差=df总总df处处理理df配配伍伍df误差误差=(k1)(n1)表表5-3完全随机设计与配伍设计方差分析的比较完全随机设计与配伍设计方差分析的比较。在。在MS处理处理恒定时,完全随机设计与配伍组设计方差分恒定时,完全随机设计与配伍组设计方差分析的效率分别取于析的效率分别取于MS组内组内与与MS误差误差的大小,而均方的大小,而均方MS 的大小是由离均差平方和的大小是由离
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 研究生 统计学 讲义 方差分析
限制150内