《医学医学统计学方差分析.pptx》由会员分享,可在线阅读,更多相关《医学医学统计学方差分析.pptx(38页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、1 ANOVA ANOVA 由英国统计学家R.A.FisherR.A.Fisher首创,为纪念FisherFisher,以F F命名,故方差分析又称 F F 检验 (F F test test)。用于推断多个总体均数有无差异 第1页/共38页2 因素也称为处理因素(因素(factorfactor)(名义分类变量)(名义分类变量),每一处理因素至少有两个水平(level)(也称“处理组”)。一个因素(水平间独立)单向方差分析 两个因素(水平间独立或相关)双向方差分析一个个体多个测量值重复测量资料的方差分析 ANOVA与回归分析相结合协方差分析 目的:用这类资料的样本信息来推断各处理组间多个总体均
2、数的差别有无统计学意义。基本概念第2页/共38页3SiS1S2S3S4合计值5.994.153.784.716.65第3页/共38页4第4页/共38页5单向方差分析单向方差分析One-way analysis of variance第一节 方差分析的基本思想 将所有测量值间的总变异按照其变异的来源分解为多个部份,然后进行比较,评价由某种因素所引起的变异是否具有统计学意义。第5页/共38页6一、离均差平方和的分一、离均差平方和的分解解组间变异组间变异总变异总变异组内变异组内变异第6页/共38页7对于实例(完全随机设计)资料,共有三种不同的变异 1.总变异(Total variation):全部测
3、量值Yij与总均数 间的差异 2.组间变异(between group variation):各组的均数 与总均数 间的差异3.组内变异(within group variation):每组的每个测量值Yij与该组均数 的差异下面用下面用离均差平方和离均差平方和(sum of squares of(sum of squares of deviations from meandeviations from mean,SSSS)反映变异的大小反映变异的大小 第7页/共38页 1.1.总变异总变异:所有测量值之间总所有测量值之间总的变异程度,计算公式的变异程度,计算公式校正系数校正系数:第8页/共3
4、8页 2 2组组间间变变异异:各各组组均均数数与与总总均均数数的的离均差平方和,计算公式为离均差平方和,计算公式为SS组间反映了各组均数 的变异程度组间变异随机误差+处理因素效应 第9页/共38页 3组内变异:在同一处理组内,虽然每个受试对象接受的处理相同,但测量值仍各不相同,这种变异称为组内变异,也称SS误差。用各组内各测量值Yij与其所在组的均数差值的平方和来表示,反映随机误差的影响。计算公式为第10页/共38页三种“变异”之间的关系离均差平方和离均差平方和分解分解:第11页/共38页One-Factor ANOVA Partitions of Total VariationVariati
5、on Due to Treatment SSBVariation Due to Random Sampling SSWTotal Variation SSTwCommonly referred to as:oSum of Squares Within,oroSum of Squares Error,oroWithin Groups VariationwCommonly referred to as:oSum of Squares Among,oroSum of Squares Between,oroSum of Squares Model,oroAmong Groups Variation=+
6、第12页/共38页 均方差,均方均方差,均方(mean square,MS)第13页/共38页 二、F 值与F分布,第14页/共38页2/22/202312:51:44AM15F 分布曲线第15页/共38页2/22/202312:51:44AM16F 界值表附表5 5 F F界值表(方差分析用,单侧界值)上行:P P=0.05 =0.05 下行:P P=0.01=0.01分母自由度分母自由度2 2分子的自由度,分子的自由度,1 11 12 23 34 45 56 61 116116120020021621622522523023023423440524052499949995403540356
7、25562557645764585958592 218.5118.5119.0019.0019.1619.1619.2519.2519.3019.3019.3319.3398.4998.4999.0099.0099.1799.1799.2599.2599.3099.3099.3399.3325254.244.243.393.392.992.992.762.762.602.602.492.497.777.775.575.574.684.684.184.183.853.853.633.63(P440-443)第16页/共38页2/22/202312:51:45AM17F F 分布曲线下面积与概率分
8、布曲线下面积与概率第17页/共38页2/22/202312:51:45AM18第18页/共38页19实例的方差分析实例的方差分析实例的方差分析实例的方差分析第19页/共38页20H0:即4个试验组总体均数相等 H1:4个试验组总体均数不全相等 检验水准 一、一、建立检验假设建立检验假设第20页/共38页21SiS1S2S3S4合计值5.994.153.784.716.65第21页/共38页22二、二、计算离均差平方、自由度、均方计算离均差平方、自由度、均方第22页/共38页23三、计算三、计算F值值第23页/共38页24四、下结论四、下结论 注意:当组数为2时,完全随机设计的方差分析结果与两样
9、本均数比较的t检验结果等价,对同一资料,有:第24页/共38页25平均值之间的多重比较平均值之间的多重比较平均值之间的多重比较平均值之间的多重比较不拒绝H0,表示拒绝总体均数相等的证据不足 分析终止。拒绝H0,接受H1,表示总体均数不全相等哪两两均数之间相等?哪两两均数之间不等?需要进一步作多重比较。第25页/共38页26控制累积控制累积控制累积控制累积类错误概率增大的方法类错误概率增大的方法类错误概率增大的方法类错误概率增大的方法采用Bonferroni法、SNK法和Tukey法等方法第26页/共38页27累积累积累积累积类错误的概率为类错误的概率为类错误的概率为类错误的概率为 当有k个均数
10、需作两两比较时,比较的次数共有c=k!/(2!(k-2)!)=k(k-1)/2设每次检验所用类错误的概率水准为,累积类错误的概率为,则在对同一实验资料进行c次检验时,在样本彼此独立的条件下,根据概率乘法原理,其累积类错误概率与c有下列关系:1(1)c 例如,设0.05,c=3(即k=3),其累积类错误的概率为1(1-0.05)3=1-(0.95)3=0.143第27页/共38页28一、一、一、一、BonferroniBonferroniBonferroniBonferroni法法法法方法:采用方法:采用/c作为下结论时所采用的作为下结论时所采用的检验水准。检验水准。c为两两比较次数,为两两比较
11、次数,为累积为累积I类错误的概率。类错误的概率。第28页/共38页29例例例例8-18-18-18-1四个均值的四个均值的四个均值的四个均值的BonferroniBonferroniBonferroniBonferroni法比较法比较法比较法比较 设设/c0.05/6=0.0083,由此由此t的临的临界值为界值为t(0.0083/2,20)=2.9271第29页/共38页30BonferroniBonferroniBonferroniBonferroni法的适用性法的适用性法的适用性法的适用性 当当比较次数不多时比较次数不多时,Bonferroni法的效果法的效果较好。较好。但当但当比较次数较
12、多比较次数较多(例如在例如在10次以上次以上)时,时,则由于其检验水准选择得过低,结论偏于保则由于其检验水准选择得过低,结论偏于保守。守。第30页/共38页31二、二、二、二、SNKSNKSNKSNK法法法法 SNK(student-Newman-Keuls)法又称q检验,是根据q值的抽样分布作出统计推论(实例)。1将各组的平均值按由大到小的顺序排列:顺序(1)(2)(3)(4)平均值28.018.718.514.8 原组号BCAD2.计算两个平均值之间的差值及组间跨度k,见下表第(2)、(3)两列。3.计算统计量q值4.根据计算的q值及查附表5得到的q界值(p444),作出统计推断。第31页
13、/共38页32附表5第32页/共38页33三、三、三、三、TukeyTukeyTukeyTukey法法法法第33页/共38页34方差分析的假定条件和数据转换方差分析的假定条件和数据转换方差分析的假定条件和数据转换方差分析的假定条件和数据转换一、方差分析的假定条件(上述条件与两均数比较的t检验的应用条件相同。)1.各处理组样本来自随机、独立的正态总体(D法、W法、卡方检验);2.各处理组样本的总体方差相等(不等会增加I型错误的概率,影响方差分析结果的判断)二、方差齐性检验1.Bartlett检验法2.Levene等3.最大方差与最小方差之比3,初步认为方差齐同。第34页/共38页351.1.Bartlett Bartlett 检验法检验法第35页/共38页362.Levene 2.Levene 检验法 将原样本观察值作离均差变换,或离均差平方变换,然后执行完全随机设计的方差分析,其检验结果用于判断方差是否齐性。因为levene检验对原数据是否为正态不灵敏,所以比较稳健。目前均推荐采用LEVENE方差齐性检验第36页/共38页37三、数据变换三、数据变换改善数据的正态性或方差齐性。使之满足方差分析的假定条件。1.平方根反正弦变换适用于二项分布率(比例)数据。2.平方根变换适用于泊松分布的计数资料3.对数变换适用于对数正态分布资料第37页/共38页38谢谢您的观看!第38页/共38页
限制150内