第四章多个样本均数比较优秀课件.ppt
第四章多个样本均数比较第1页,本讲稿共83页 Contentw1.Basal ideal and application conditionsw2.ANOVA of completely random designed data w3.ANOVA of randomized block designed dataw4.ANOVA of latin square designed data w5.ANOVA of cross-over designed data(自学)(自学)w6.Multiple comparison of sample meansw7.Bartlett test and Levene test(自学)自学)第2页,本讲稿共83页第一节第一节 方差分析的基本思想方差分析的基本思想及其应用条件及其应用条件第3页,本讲稿共83页目的:目的:推断多个总体均数是否有差别。推断多个总体均数是否有差别。也可用于两个也可用于两个 方法:方法:方差分析,即多个样本均数比较方差分析,即多个样本均数比较 的的F检验。检验。基本思想:基本思想:根据资料设计的类型及研究目的,可将总变异分解为两个或多个部分,每个部分的变异可由某因素的作用来解释。通过比较可能由某因素所至的变异与随机误差,即可了解该因素对测定结果有无影响。第4页,本讲稿共83页应用条件:应用条件:1 1)各样本:相互)各样本:相互独立独立的的随机随机样本,均来自样本,均来自正态分布正态分布总体总体。(独立随机同分布)。(独立随机同分布)2 2)各样本的总体方差相等(方差齐)。)各样本的总体方差相等(方差齐)。本章涉及的设计类型:本章涉及的设计类型:完全随机设计资料的方差分析完全随机设计资料的方差分析随机区组设计资料的方差分析随机区组设计资料的方差分析拉丁方设计资料的方差分析拉丁方设计资料的方差分析两阶段交叉设计资料的方差分析(自学)两阶段交叉设计资料的方差分析(自学)第5页,本讲稿共83页完全随机设计资料的方差分析基本思想完全随机设计资料的方差分析基本思想 合计合计N S :第第i个处理组第个处理组第j个观察结果个观察结果第6页,本讲稿共83页w记总均数为,各处理组均数为,总例数为Nnl+n2+ng,g为处理组数。第7页,本讲稿共83页w1.1.总变异总变异:全部测量值大小不同,这种变异称为总变异。w总变异的大小可以用离均差平方和(sumofsquaresofdeviationsfrommean,SS)表示,即各测量值Xij与总均数差值的平方和,记为SS总。w总变异SS总反映了所有测量值之间总的变异程度。第8页,本讲稿共83页计算公式为计算公式为其中:其中:第9页,本讲稿共83页w2组间变异:组间变异:各处理组由于接受处理的水平不同,各组的样本均数(i1,2,g)也大小不等,这种变异称为组间变异。w其大小可用各组均数与总均数的离均差平方和表示,记为SS组间。第10页,本讲稿共83页计算公式为计算公式为第11页,本讲稿共83页w3 3组组内内变变异异:在同一处理组中,虽然每个受试对象接受的处理相同,但测量值仍各不相同,这种变异称为组内变异(误差)。组内变异可用组内各测量值Xij与其所在组的均数的差值的平方和表示,记为SS组内,表示随机误差的影响。第12页,本讲稿共83页w第13页,本讲稿共83页三种变异的关系三种变异的关系:第14页,本讲稿共83页 均方差,均方均方差,均方(mean square,MS)。第15页,本讲稿共83页检验统计量:检验统计量:如果如果 ,说明各样本来自相同总体,说明各样本来自相同总体,处理因素不起作用,则组间变异与组内变异一样,处理因素不起作用,则组间变异与组内变异一样,只反映随机误差的作用大小,计算得到只反映随机误差的作用大小,计算得到F F值应接近于值应接近于1 1。反之,如果反之,如果 不全相等,不全相等,F F值将远大于值将远大于1 1。用用F F界值表(界值表(P806,单侧界值)确定单侧界值)确定P P值。值。第16页,本讲稿共83页第二节第二节完全随机设计资料的方差分析完全随机设计资料的方差分析(ANOVA of completely random designed data)第17页,本讲稿共83页 (completelyrandomdesign)是采用完全随机化的分组方法,将全部试验对象分配到g个处理组(水平),各组分别接受不同的处理,试验结束后比较各组均数之间的差别有无统计学意义,推论处理因素的效应。一、完全随机设计一、完全随机设计第18页,本讲稿共83页例例4-14-1 某医生为了研究一种降血脂新药的临某医生为了研究一种降血脂新药的临床疗效,按统一纳入标准选择床疗效,按统一纳入标准选择120120名患者,采名患者,采用完全随机设计方法将患者等分为用完全随机设计方法将患者等分为4 4组进行双组进行双盲试验。问如何进行分组?盲试验。问如何进行分组?第19页,本讲稿共83页(1 1)完全随机分组方法:)完全随机分组方法:1.1.编编号号:120120名名高高血血脂脂患患者者从从1 1开开始始到到120120编编号,见表号,见表4-24-2第第1 1行(行(P72P72););2.2.取取随随机机数数字字:从从附附表表1515中中的的任任一一行行任任一一列列开开始始,如如第第5 5行行第第7 7列列开开始始,依依次次读读取取三三位位数数作为一个随机数录于编号下,见表作为一个随机数录于编号下,见表4-24-2第第2 2行;行;第20页,本讲稿共83页3.3.编序号编序号:将全部随机数字从小到大:将全部随机数字从小到大 (数据相同则按先后顺数据相同则按先后顺序)编序号,见表序)编序号,见表4-24-2第第3 3行。行。4.4.事先规定:事先规定:序号序号1-301-30为甲组,序号为甲组,序号31-6031-60为乙组,序号为乙组,序号61-61-9090为丙组,序号为丙组,序号91-12091-120为丁组,见表为丁组,见表4-24-2第四行。第四行。第21页,本讲稿共83页(2 2)统计分析方法选择:)统计分析方法选择:1.对对于于正正态态分分布布且且方方差差齐齐同同的的资资料料,常常采采用用完完全全随随机机设设计计的的单单因因素素方方差差分分析析(one-way ANOVA)或成组资料的或成组资料的 t 检验(检验(g=2););2.对对于于非非正正态态分分布布或或方方差差不不齐齐的的资资料料,可可进进行行数据变换数据变换或采用或采用Wilcoxon秩和检验秩和检验。第22页,本讲稿共83页二、变异分解二、变异分解第23页,本讲稿共83页 例例4-2 某某医医生生为为了了研研究究一一种种降降血血脂脂新新药药的的临临床床疗疗效效,按按统统一一纳纳入入标标准准选选择择120120名名高高血血脂脂患患者者,采采用用完完全全随随机机设设计计方方法法将将患患者者等等分分为为4 4组组(具具体体分分组组方方法法见见例例4-14-1),进进行行双双盲盲试试验验。6 6周周后后测测得得低低密密度度脂脂蛋蛋白白作作为为试试验验结结果果,见见表表4-34-3。问问4 4个个处处理理组组患患者者的的低密度脂蛋白含量总体均数有无差别低密度脂蛋白含量总体均数有无差别?第24页,本讲稿共83页表表4-3 44-3 4个处理组低密度脂蛋白测量值个处理组低密度脂蛋白测量值(mmol/L)第25页,本讲稿共83页三、分析步骤三、分析步骤H0:即即4个试验组个试验组总体均数总体均数相等相等 H1:4个试验组个试验组总体均数总体均数不等或不全相等不等或不全相等 2.计算检验统计量计算检验统计量:1.建立检验假设,确定检验水准建立检验假设,确定检验水准:第26页,本讲稿共83页第27页,本讲稿共83页表表4-5 完全随机设计方差分析表完全随机设计方差分析表列方差分析表列方差分析表第28页,本讲稿共83页3.确定确定P值,作出推断结论:值,作出推断结论:按按 水水准准,拒拒绝绝H0,接接受受H1,认认为为4个个试试验验组组ldl-c总总体体均均数数不不等等或或不不全全相相等等,即即不不同剂量药物对血脂中同剂量药物对血脂中ldl-c降低有影响。降低有影响。第29页,本讲稿共83页注意:注意:方方差差分分析析的的结结果果拒拒绝绝H0,接接受受H1,不不能能说说明明各各组组总总体体均均数数间间两两两两都都有有差差别别。如如果果要要分分析析哪哪些些两两组组间间有有差差别别,可可进进行行多多个个均均数数间间的的多多重重比比较较(见见本本章章第第六六节节)。当当g=2时时,完完全全随随机机设设计计方方差差分分析析与与成成组组设设计计资资料的料的t 检验等价,有检验等价,有 。第30页,本讲稿共83页第三节第三节随机区组设计资料的方差分析随机区组设计资料的方差分析(ANOVA of randomized block designed data)第31页,本讲稿共83页一、随机区组设计一、随机区组设计(randomized block design)w随机区组设计(randomizedblockdesign)又称为配伍组设计,是配对设计的扩展。具体做法是:先按影响试验结果的非处理因素(如性别、体重、年龄、职业、病情、病程等)将受试对象配成区组(block),再分别将各区组内的受试对象随机分配到各处理或对照组。(1 1)随机分组方法)随机分组方法:第32页,本讲稿共83页(2 2)随机区组设计的特点)随机区组设计的特点随机分配的次数要重复多次,每次随机分配都对同一个区组内的受试对象进行,且各个处理组受试对象数量相同。区组内均衡。在进行统计分析时,将区组变异离均差平方和从完全随机设计的组内离均差平和中分离出来,从而减小组内离均差平方和(误差平方和),提高了统计检验效率。第33页,本讲稿共83页例例4-3 如何按随机区组设计,分配如何按随机区组设计,分配5 5个区组的个区组的1515只小只小白鼠接受甲、乙、丙三种抗癌药物?白鼠接受甲、乙、丙三种抗癌药物?分分组组方方法法:先先将将小小白白鼠鼠按按体体重重编编号号,体体重重相相近近的的3只只小小白白鼠鼠配配成成一一个个区区组组,见见表表4-6。在在随随机机数数字字表表中中任任选选一一行行一一列列开开始始的的2位位数数作作为为1个个随随机机数数,如如从从第第8行行第第3列列开开始始纪纪录录,见见表表4-6;在在每每个个区区组组内内将将随随机机数数按按大大小小排排序序;各各区区组组中中内内序序号号为为1的的接接受受甲甲药药、序序号号为为2的的接接受受乙乙药药、序序号为号为3的接受的接受丙药丙药,分配结果见表,分配结果见表4-6。第34页,本讲稿共83页第35页,本讲稿共83页(3 3)统计方法选择)统计方法选择:1.正正态态分分布布且且方方差差齐齐同同的的资资料料,应应采采用用两两因因素素(处处理理、配配伍伍)方方差差分分析析(two-way ANOVA)或配对或配对t检验(检验(g=2););2.当当不不满满足足方方差差分分析析和和t检检验验条条件件时时,可可对对数数据据进进行行变变换换或或采采用用随随机机区区组组设设计计资资料料的的Friedman M检验检验。第36页,本讲稿共83页 表4-7 随机区组设计的试验结果 第37页,本讲稿共83页二、变异分解二、变异分解(1)总变异:总变异:反映所有观察值之间的变异反映所有观察值之间的变异,记为记为SS总总。(2)处处理理间间变变异异:由由处处理理因因素素的的不不同同水水平平作作用用和和随随机机误误差差产产生生的的变变异,记为异,记为SS处理处理。(3)区区组组间间变变异异:由由不不同同区区组组作作用用和和随随机机误误差差产产生生的的变变异异,记记为为SS区组区组.(4)误差变异:误差变异:完全由随机误差产生的变异,记为完全由随机误差产生的变异,记为SS误差误差。对总离均差平方和及其自由度的分解,有对总离均差平方和及其自由度的分解,有:第38页,本讲稿共83页 表4-8 随机区组设计资料的方差分析表第39页,本讲稿共83页三、分析步骤三、分析步骤例例4-4 某某研研究究者者采采用用随随机机区区组组设设计计进进行行实实验验,比比较较三三种种抗抗癌癌药药物物对对小小白白鼠鼠肉肉瘤瘤抑抑瘤瘤效效果果,先先将将15只只染染有有肉肉瘤瘤小小白白鼠鼠按按体体重重大大小小配配成成5个个区区组组,每每个个区区组组内内3只只小小白白鼠鼠随随机机接接受受三三种种抗抗癌癌药药物物(具具体体分分配配方方法法见见例例4-3),以以肉肉瘤瘤的的重重量量为为指指标标,试试验验结结果果见见表表4-9。问问三三种种不同的药物的抑瘤效果有无差别?不同的药物的抑瘤效果有无差别?第40页,本讲稿共83页 表表4-9 不同药物作用后小白鼠肉瘤重量不同药物作用后小白鼠肉瘤重量(g g)第41页,本讲稿共83页H0:,即三种不同药物作用后,即三种不同药物作用后 小白鼠肉瘤重量的小白鼠肉瘤重量的总体均数相等总体均数相等 H1:三种不同药物作用后小白鼠肉瘤重:三种不同药物作用后小白鼠肉瘤重 量的量的总体均数不等或不全相等总体均数不等或不全相等第42页,本讲稿共83页第43页,本讲稿共83页第44页,本讲稿共83页 据据 1=2、2=8查附表查附表3的的F界值表,得界值表,得 在在=0.05的的水水准准上上,拒拒绝绝H0,接接受受H1,认认为为三三种种不不同同药药物物作作用用后后小小白白鼠鼠肉肉瘤瘤重重量量的的总总体体均均数数不不全全相相等等,即即不不同同药药物物的的抑抑瘤瘤效效果果有有差差别别。同同理理可可对对区区组组间间的的差别进行检验。差别进行检验。第45页,本讲稿共83页注意:注意:方方差差分分析析的的结结果果拒拒绝绝H0,接接受受H1,不不能能说说明明各各组组总总体体均均数数间间两两两两都都有有差差别别。如如果果要要分分析析哪哪些些两两组组间间有有差差别别,可可进进行行多多个个均均数数间间的的多多重重比比较较(见见本本章章第第六六节节)。当当g=2时时,随随机机区区组组设设计计方方差差分分析析与与配配对对设设计计资资料的料的t 检验等价,有检验等价,有 。第46页,本讲稿共83页 随随机机区区组组设设计计确确定定区区组组因因素素应应是是对对试试验验结结果果有有影影响响的的非非处处理理因因素素。区区组组内内各各试试验验对对象象应应均均衡衡,区区组组之之间间试试验验对对象象具具有有较较大大的的差差异异为为好好,这这样样利利用用区区组组控控制制非非处处理理因因素素的的影影响响,并并在在方方差差分分析析时时将将区区组组间间的的变变异异从从组组内内变变异异中中分分解解出出来。来。因因此此,当当区区组组间间差差别别有有统统计计学学意意义义时时,这这种种设设计计的的误误差差比比完完全全随随机机设设计计小小,试试验验效效率率得得以以提高。提高。第47页,本讲稿共83页第四节拉丁方设计资料的方差分析拉丁方设计资料的方差分析(ANOVA of latin square designed data)第48页,本讲稿共83页基本概念基本概念n欲比较一个处理因素中K个水平的各均数,同时要控制另外两个因素(控制因素)的作用,且每个因素类或水平数相等时,可用拉丁方设计。n用K个拉丁字母排列成K行K列的方阵,将两个控制因素分别安排在拉丁方设计的行和列上。使每行、每列中每个字母仅出现1次,这样的方阵称为拉丁方。第49页,本讲稿共83页拉丁方举例拉丁方举例例如:22拉丁方 33拉丁方 A B A B C B A C A B B C A 44拉丁方 55拉丁方 A B C D A B C D E B C D A B E D A C D A B C C A E B D C D A E D C A E B E D B C A拉丁方的行和行,或列和列交换,仍为拉丁方。第50页,本讲稿共83页基本步骤基本步骤w 拉丁方设计实际上是一种特殊类型的三因素试验设计,三个因素的水平数必须相同。w 基本步骤:(1)首先根据水平数选定拉丁方。(2)再随机交换拉丁方的行或列。(3)然后将三个因素分别放置于拉丁方的行、列 及字母上面,主要考察因素(处理因素)放置于 字母上。(4)根据设计进行试验,把试验结果记入相应位置。(5)进行方差分析,得出结论。第51页,本讲稿共83页实例分析实例分析例1:五种防护服,由五人各在不同的五天中穿着测定脉搏数(如表1)。试比较五种防护服对脉搏数有无不同。表1 比较5种防护服对脉搏数有无影响第52页,本讲稿共83页总变异的分解总变异的分解 字母间(处理间)w总变异行间列间误差w拉丁方设计是在随机区组设计的基础上,多安排了一个已知的对试验结果有影响的非处理因素。w相对于随机区组设计,总变异分解更细,误差更小,效率也更高。第53页,本讲稿共83页拉丁方设计的方差分析基本步骤拉丁方设计的方差分析基本步骤一、建立检验假设,确定检验水准:(1)H(1)H0 0:各种防护服的平均脉搏数相同各种防护服的平均脉搏数相同;H H1 1:各种防护服的平均脉搏数不全相同各种防护服的平均脉搏数不全相同;F F1 1=MS=MS防护服间防护服间/MS/MS误差误差(2)H0:各个受试者的平均脉搏数相同;H1:各个受试者的平均脉搏数不全相同;F2=MS受试者间/MS误差(3)H0:不同日期的平均脉搏数相同;H1:不同日期的平均脉搏数不全相同。F3=MS日期间/MS误差第54页,本讲稿共83页二、计算检验统计量(二、计算检验统计量(F F值)值)例1的方差分析表变异来源SSDFMSFP总变异4105.9124日期间508.074127.012.890.05受试者间2853.674713.4116.270.05误差526.141243.84F0.05(4,12)=3.26,F0.01(4,12)=5.41三、确定三、确定P值,作出推论。值,作出推论。第55页,本讲稿共83页第五节两阶段交叉设计资料的方差分析两阶段交叉设计资料的方差分析 (自学)(自学)第56页,本讲稿共83页第六节第六节多个样本均数间的多重比较多个样本均数间的多重比较 (multiplecomparison)第57页,本讲稿共83页多重比较不能采用多次的两样本均数间比较多重比较不能采用多次的两样本均数间比较的的t t检验检验!若用多次两样本均数比较的若用多次两样本均数比较的t 检验进行检验进行多重比较,将会加大犯多重比较,将会加大犯类错误(把本无类错误(把本无差别的两个总体均数判为有差别)的概差别的两个总体均数判为有差别)的概率。率。第58页,本讲稿共83页例例 如如,有有 4个个 样样 本本 均均 数数,两两 两两 组组 合合 数数 为为 ,若若用用 t 检检验验做做6次次比比较较,且且每每次次比比较较的的检检验验水水准准定定为为=0.05,则则每每次次比比较较不不犯犯类类错错误误的的概概率率为为(10.05),6次次均均不不犯犯类类错错误误的的概概率率 为为 ,这这 时时,总总 的的 检检 验验 水水 准准 变变 为为 ,远远比比0.05大大。因因此此,样样本本均均数数间间的的多多重重比比较较不能用两样本均数比较的不能用两样本均数比较的 t 检验。检验。第59页,本讲稿共83页适用条件:当当方方差差分分析析的的结结果果为为拒拒绝绝H0,接接受受H1时时,只只说说明明g个个总总体体均均数数不不全全相相等等。若若想想进进一一步步了了解解哪哪些些两两个个总总体体均均数数不不等等,需需进进行行多多个个样样本本均均数数间间的的两两两比较或称多重比较。两比较或称多重比较。第60页,本讲稿共83页一、一、LSD-t检验检验(leastsignificantdifference)适用范围:一对或几对在专业上有特殊适用范围:一对或几对在专业上有特殊 意义的样本均数间的比较。意义的样本均数间的比较。第61页,本讲稿共83页检验统计量检验统计量t的计算公式为的计算公式为式中第62页,本讲稿共83页注意:注意:第63页,本讲稿共83页第64页,本讲稿共83页例例4-7 对例对例4-2资料,问高血脂患资料,问高血脂患者的降血脂新药者的降血脂新药2.4g组、组、4.8g组、组、7.2g组与安慰剂组的低密度脂蛋白含组与安慰剂组的低密度脂蛋白含量总体均数有无差别?量总体均数有无差别?第65页,本讲稿共83页 ,即降血脂新药,即降血脂新药2.4g组与安慰剂组与安慰剂 组的低密度脂蛋白含量总体均数相等组的低密度脂蛋白含量总体均数相等 ,即降血脂新药即降血脂新药2.4g组与安慰剂组与安慰剂 组的低密度脂蛋白含量总体均数不等组的低密度脂蛋白含量总体均数不等=0.05降血脂新药降血脂新药2.4g2.4g组与安慰剂组的比较:组与安慰剂组的比较:第66页,本讲稿共83页第67页,本讲稿共83页 新药新药4.8g组组VS安慰剂组安慰剂组:LSD-t为为-4.29 7.2g组组VS安慰剂组安慰剂组:LSD-t 为为-8.59。同理:同理:按按 水准,降血脂新药水准,降血脂新药4.8g组、组、7.2g组与安慰剂组间差别有统计学意义。组与安慰剂组间差别有统计学意义。第68页,本讲稿共83页二、二、Dunnett-t 检验检验适用条件:适用条件:g-1个实验组与一个对照组均数个实验组与一个对照组均数差别的多重比较,检验统计量为差别的多重比较,检验统计量为t,亦称,亦称t检验。检验。第69页,本讲稿共83页式中计算公式为:Dunnett-第70页,本讲稿共83页例例4-8 对例对例4-2资料,问高血脂患者的三资料,问高血脂患者的三个不同剂量降血脂新药组与安慰剂组的低密度个不同剂量降血脂新药组与安慰剂组的低密度脂蛋白含量总体均数是否有差别?脂蛋白含量总体均数是否有差别?H0:i=0,即即各实验组各实验组与与安慰剂组安慰剂组的低密度的低密度 脂蛋白含脂蛋白含 量总体均数相等量总体均数相等H1:i 0,即各实验组与安慰剂组的低密度即各实验组与安慰剂组的低密度 脂蛋白含量总体均数不等脂蛋白含量总体均数不等=0.05第71页,本讲稿共83页Dunnett-Dunnett-Dunnett-第72页,本讲稿共83页第73页,本讲稿共83页三、SNK-q检验(Student-Newman-Keuls)适用于多个样本均数两两之间的全面比较。第74页,本讲稿共83页检验统计量q的计算公式为第75页,本讲稿共83页例例4-9 对例对例4-4资料,问三种不同药物资料,问三种不同药物的抑瘤效果两两之间是否有差别?的抑瘤效果两两之间是否有差别?H0:A=B,即任两对比较组的总体均数相等即任两对比较组的总体均数相等H1:AB,即任两对比较组的总体均数不相等即任两对比较组的总体均数不相等=0.05第76页,本讲稿共83页将三个样本均数由小到大排列,并编组次:将三个样本均数由小到大排列,并编组次:第77页,本讲稿共83页 列列出出对对比比组组,并并计计算算两两对对比比组组的的均均数数之之差差,写出写出两对比组包含的组数两对比组包含的组数a a。已已知知=8=8和和a a,查查附附表表4 4的的q q界界值值,得得出出相相应应的的q q界值。界值。以以实实际际的的q q值值和和相相应应的的q q界界值值作作比比较较,确确定定对对应的应的P P值值 。第78页,本讲稿共83页表4-15 多个均数两两比较值第79页,本讲稿共83页结论:结论:可认为可认为A A药和药和B B药、药、C C药的抑瘤药的抑瘤 效果有差别,还不能认为效果有差别,还不能认为B B药和药和C C药的药的抑瘤效果有差别。抑瘤效果有差别。第80页,本讲稿共83页第七节多样本方差比较的多样本方差比较的BartlettBartlett检验和检验和LeveneLevene检验检验(自学)(自学)第81页,本讲稿共83页 课后练习题1 1、最佳选择题:全部、最佳选择题:全部2 2、分析计算题:第、分析计算题:第1 1、2 2、3 3、7 7题题第82页,本讲稿共83页The end!Thanks!第83页,本讲稿共83页