《医学医学统计学方差分析课件.pptx》由会员分享,可在线阅读,更多相关《医学医学统计学方差分析课件.pptx(37页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、6/1/202311:53:59AM6/1/202311:53:59AM1 ANOVA ANOVA 由英国统计由英国统计学家学家R.A.FisherR.A.Fisher首创,首创,为纪念为纪念FisherFisher,以,以F F命命名,故方差分析又称名,故方差分析又称 F F 检验检验 (F F test test)。用)。用于推断于推断多个总体均数多个总体均数有有无差异无差异 6/1/202311:53:59AM6/1/202311:53:59AM2 因素也称为处理因素也称为处理因素(因素(因素(因素(factorfactor)(名义分类变量)(名义分类变量)(名义分类变量)(名义分类变量
2、),每一处,每一处理因素至少有两个水平理因素至少有两个水平(level)(也称(也称“处理组处理组”)。)。一个因素(水平间独立)一个因素(水平间独立)单向方差分析单向方差分析 两个因素(水平间独立或相关)两个因素(水平间独立或相关)双向方差分析双向方差分析一个个体多个测量值一个个体多个测量值重复测量资料的方差分析重复测量资料的方差分析 ANOVA与回归分析相结合与回归分析相结合协方差分析协方差分析 目的:用这类资料的样本信息来推断各处理组间多个总体均目的:用这类资料的样本信息来推断各处理组间多个总体均数的差别有无统计学意义。数的差别有无统计学意义。基本概念6/1/202311:53:59AM
3、6/1/202311:53:59AM3SiS1S2S3S4合计值5.994.153.784.716.656/1/202311:54:00AM6/1/202311:54:00AM46/1/202311:54:01AM6/1/202311:54:01AM5单向方差分析单向方差分析One-way analysis of variance第一节第一节 方差分析的基本思想方差分析的基本思想将所有测量值间的总变异总变异按照其变异的来源分解为多个部份分解为多个部份,然后进行比较,评价由某种因素某种因素所引起的变异是否具有统计学意义。6/1/202311:54:01AM6/1/202311:54:01AM6一
4、、离均差平方和的分解一、离均差平方和的分解组间变异组间变异总变异总变异组内变异组内变异6/1/202311:54:01AM6/1/202311:54:01AM7对于实例(完全随机设计)对于实例(完全随机设计)资料,共有三种不同的变异资料,共有三种不同的变异1.总变异总变异(Total variation):全部测量值):全部测量值Yij与与总均数总均数 间的差异间的差异2.组间变异组间变异(between group variation):各):各组的均数组的均数 与总均数与总均数 间的差异间的差异3.组内变异组内变异(within group variation):每组的:每组的每个测量值每
5、个测量值Yij与该组均数与该组均数 的差异的差异下面用下面用离均差平方和离均差平方和(sum of squares of(sum of squares of deviations from meandeviations from mean,SSSS)反映变异的大小反映变异的大小 1.1.总变异总变异:所有测量值之间总所有测量值之间总的变异程度,计算公式的变异程度,计算公式校正系数校正系数:2 2组组间间变变异异:各各组组均均数数与与总总均均数数的的离均差平方和,计算公式为离均差平方和,计算公式为SS组间反映了各组均数 的变异程度组间变异组间变异随机误差随机误差+处理因素效应处理因素效应 3组内
6、变异:在同一处理组内,虽然每个受试对象接受的处理相同,但测量值仍各不相同,这种变异称为组内变异,也称SS误差。用各组内各测量值Yij与其所在组的均数差值的平方和来表示,反映随机误差的影响。计算公式为三种三种“变异变异”之间的关系之间的关系离均差平方和离均差平方和分解分解:One-FactorANOVAPartitionsofTotalVariationVariation Due to Treatment SSBVariation Due to Random Sampling SSWTotal Variation SSTwCommonlyreferredtoas:oSumofSquaresWit
7、hin,oroSumofSquaresError,oroWithinGroupsVariationwCommonlyreferredtoas:oSumofSquaresAmong,oroSumofSquaresBetween,oroSumofSquaresModel,oroAmongGroupsVariation=+均方差,均方均方差,均方(mean square,MS)二、二、F 值与值与F分布分布,6/1/202311:54:05AM15F 分布曲线分布曲线6/1/202311:54:05AM16F 界值表界值表附表附表5 5 F F界值表(方差分析用,单侧界值)界值表(方差分析用,单侧界
8、值)上行:上行:P P=0.05 =0.05 下行:下行:P P=0.01=0.01分母自由度分母自由度2 2分子的自由度,分子的自由度,1 11 12 23 34 45 56 61 11611612002002162162252252302302342344052405249994999540354035625562557645764585958592 218.5118.5119.0019.0019.1619.1619.2519.2519.3019.3019.3319.3398.4998.4999.0099.0099.1799.1799.2599.2599.3099.3099.3399.33
9、25254.244.243.393.392.992.992.762.762.602.602.492.497.777.775.575.574.684.684.184.183.853.853.633.63(P440-443)6/1/202311:54:05AM17F F 分布曲线下面积与概率分布曲线下面积与概率6/1/202311:54:05AM186/1/202311:54:05AM6/1/202311:54:05AM19实例的方差分析实例的方差分析实例的方差分析实例的方差分析6/1/202311:54:05AM6/1/202311:54:05AM20H0:即即4个试验组总体均数相等个试验组总体
10、均数相等 H1:4个试验组总体均数个试验组总体均数不全相等不全相等 检验水准检验水准 一、一、建立检验假设建立检验假设6/1/202311:54:05AM6/1/202311:54:05AM21SiS1S2S3S4合计值5.994.153.784.716.656/1/202311:54:06AM6/1/202311:54:06AM22二、二、计算离均差平方、自由度、均方计算离均差平方、自由度、均方6/1/202311:54:07AM6/1/202311:54:07AM23三、计算三、计算F值值6/1/202311:54:07AM6/1/202311:54:07AM24四、下结论四、下结论 注意
11、:当组数为注意:当组数为2时,完全随机设计的方时,完全随机设计的方差分析结果与两样本均数比较的差分析结果与两样本均数比较的t检验结果等检验结果等价,对同一资料价,对同一资料,有:有:6/1/202311:54:08AM6/1/202311:54:08AM25平均值之间的多重比较平均值之间的多重比较平均值之间的多重比较平均值之间的多重比较不拒绝不拒绝H0,表示拒绝总体均数相等的证据,表示拒绝总体均数相等的证据不足不足 分析终止。分析终止。拒绝拒绝H0,接受,接受H1,表示总体均数不全相等表示总体均数不全相等哪两两均数之间相等?哪两两均数之间相等?哪两两均数之间不等?哪两两均数之间不等?需要进一步
12、作多重比较。需要进一步作多重比较。6/1/202311:54:08AM6/1/202311:54:08AM26控制累积控制累积控制累积控制累积类错误概率增大的方法类错误概率增大的方法类错误概率增大的方法类错误概率增大的方法采用采用Bonferroni法、法、SNK法和法和Tukey法等方法法等方法6/1/202311:54:08AM6/1/202311:54:08AM27累积累积累积累积类错误的概率为类错误的概率为类错误的概率为类错误的概率为 当有当有k个均数需作两两比较时,比较的次数共有个均数需作两两比较时,比较的次数共有c=k!/(2!(k-2)!)=k(k-1)/2设每次检验所用设每次检
13、验所用类错误的概率水准为类错误的概率水准为,累积,累积类错误的概率为类错误的概率为,则在对同一实验资料进行,则在对同一实验资料进行c次检次检验时,在样本彼此独立的条件下,根据概率乘法原理,验时,在样本彼此独立的条件下,根据概率乘法原理,其累积其累积类错误概率类错误概率与与c有下列关系:有下列关系:1(1)c 例如,设例如,设0.05,c=3(即即k=3),其累积,其累积类错误类错误的概率为的概率为1(1-0.05)3=1-(0.95)3=0.1436/1/202311:54:08AM6/1/202311:54:08AM28一、一、一、一、BonferroniBonferroniBonferro
14、niBonferroni法法法法方法:采用方法:采用/c作为下结论时所采用的作为下结论时所采用的检验水准。检验水准。c为两两比较次数,为两两比较次数,为累积为累积I类错误的概率。类错误的概率。6/1/202311:54:08AM6/1/202311:54:08AM29例例例例8-18-18-18-1四个均值的四个均值的四个均值的四个均值的BonferroniBonferroniBonferroniBonferroni法比较法比较法比较法比较 设设/c0.05/6=0.0083,由此由此t的临的临界值为界值为t(0.0083/2,20)=2.92716/1/202311:54:08AM6/1/2
15、02311:54:08AM30BonferroniBonferroniBonferroniBonferroni法的适用性法的适用性法的适用性法的适用性 当当比较次数不多时比较次数不多时,Bonferroni法的效果法的效果较好。较好。但当但当比较次数较多比较次数较多(例如在例如在10次以上次以上)时,时,则由于其检验水准选择得过低,结论偏于保则由于其检验水准选择得过低,结论偏于保守。守。6/1/202311:54:08AM6/1/202311:54:08AM31二、二、二、二、SNKSNKSNKSNK法法法法SNK(student-Newman-Keuls)法又称q检验,是根据q值的抽样分布作
16、出统计推论(实例)。1将各组的平均值按由大到小的顺序排列由大到小的顺序排列:顺序顺序(1)(2)(3)(4)平均值平均值28.018.718.514.8 原组号原组号BCAD2.计算两个平均值之间的差值及组间跨度差值及组间跨度k,见下表第(2)、(3)两列。3.计算统计量计算统计量q值值4.根据计算的q值及查附表5得到的q界值(p444),作出统计统计推断推断。6/1/202311:54:08AM6/1/202311:54:08AM32附表附表56/1/202311:54:09AM6/1/202311:54:09AM33三、三、三、三、TukeyTukeyTukeyTukey法法法法6/1/2
17、02311:54:10AM6/1/202311:54:10AM34方差分析的假定条件和数据转换方差分析的假定条件和数据转换方差分析的假定条件和数据转换方差分析的假定条件和数据转换一、方差分析的假定条件(上述条件与两均数比较的t检验的应用条件相同。)1.各处理组样本来自随机、独立的正态总体(D法、W法、卡方检验);2.各处理组样本的总体方差相等(不等会增加I型错误的概率,影响方差分析结果的判断)二、方差齐性检验1.Bartlett检验法2.Levene等3.最大方差与最小方差之比3,初步认为方差齐同。6/1/202311:54:10AM6/1/202311:54:10AM351.Bartlett 检验法6/1/202311:54:11AM6/1/202311:54:11AM362.Levene 检验法将原样本观察值作离均差变换,或离均差平方变换,然后执行完全随机设计的方差分析,其检验结果用于判断方差是否齐性。因为levene检验对原数据是否为正态不灵敏,所以比较稳健。目前均推荐采用LEVENE方差齐性检验6/1/202311:54:11AM6/1/202311:54:11AM37三、数据变换三、数据变换改善数据的正态性或方差齐性。使之满足方差分析的假定条件。1.平方根反正弦变换适用于二项分布率(比例)数据。2.平方根变换适用于泊松分布的计数资料3.对数变换适用于对数正态分布资料
限制150内