方差分析介绍及案例分析 (2).ppt
关于方差分析介绍及案例分析(2)现在学习的是第1页,共45页方差分析的优点方差分析的优点v不受比较组数的限制,可比较不受比较组数的限制,可比较多组均数多组均数v可同时分析可同时分析多个因素多个因素的作用的作用v可分析因素间的可分析因素间的交互作用交互作用现在学习的是第2页,共45页方差分析的应用条件v独立性独立性:各样本是相互独立随机的样本:各样本是相互独立随机的样本v正态性正态性:各样本都来自正态总体:各样本都来自正态总体v方差齐性方差齐性:各样本的总体方差相等:各样本的总体方差相等现在学习的是第3页,共45页看一个实例看一个实例v例例6.6 某地用某地用A、B和和C三种方案治疗血红蛋白三种方案治疗血红蛋白含量不满含量不满10g的婴幼儿贫血患者,治疗一月后,记的婴幼儿贫血患者,治疗一月后,记录下每名受试者血红蛋白的上升克数,资料见表录下每名受试者血红蛋白的上升克数,资料见表6.3,问三种治疗方案对婴幼儿贫血的疗效是否相同问三种治疗方案对婴幼儿贫血的疗效是否相同?现在学习的是第4页,共45页现在学习的是第5页,共45页变异分解变异分解 组间变异总变异 组内变异SS总=SS组间+SS组内总=组间组内 现在学习的是第6页,共45页总变异总变异SS总总(离均差平方和(离均差平方和)总=N-1 现在学习的是第7页,共45页组间变异组间变异SS组间组间组间=k-1 MS组间=SS组间/(k-1)现在学习的是第8页,共45页组内变异组内变异SS组内组内组内=N-k MS组内=SS组内/(N-k)现在学习的是第9页,共45页方差分析的基本思想方差分析的基本思想 抽样误差 本质上的差别+抽样误差 (组间差异)(组间差异)(组内差异)(组内差异)现在学习的是第10页,共45页如果三种治疗方案效果相同,也即三组样本均数来自同一总体(H0:1=2=3),那么从理论上说组间变异应该等于组内变异,因为两者均只反映随机误差(包括个体差异),这时若计算组间均方与组内均方的比值:F=MS组间/MS组内 现在学习的是第11页,共45页则F值在理论上应等于1,但由于抽样误差的影响,F通常接近1,而并不正好等于1。相反,若三种疗法效果不同,则组间变异就会增大,F值则明显大于1,要大到什么程度才有统计学意义呢?可通过查附表4 方差分析用F界值表得到P值,将其与事先规定的值比较后作出判断。现在学习的是第12页,共45页单因素多个样本均数的比较单因素多个样本均数的比较(analysis of one way variance)处理因素只有一个 属于完全随机设计完全随机设计:随机抽样 随机分组 随机试验现在学习的是第13页,共45页现在学习的是第14页,共45页基本步骤建立检验假设建立检验假设计算检验统计量计算检验统计量(列方差分析表列方差分析表)计算计算 P 值值下结论下结论现在学习的是第15页,共45页建立假设H0:A=B=C,三三种种治治疗疗方方案案治治疗疗婴婴幼幼儿儿 贫贫血血的疗效相同,的疗效相同,H1:三三种种治治疗疗方方案案治治疗疗婴婴幼幼儿儿贫贫血血的的疗疗效效 不全相同或全不相同。不全相同或全不相同。=0.05现在学习的是第16页,共45页计算基本数据现在学习的是第17页,共45页计算SS总,SS组间,和SS组内 C=(83.70)2/60=116.7615SS总=184.43116.76=67.6685SS组内=0.91332191.2971219 0.7800219=59.3747 现在学习的是第18页,共45页列方差分析表 现在学习的是第19页,共45页界定界定P值,作结论值,作结论总自由度为N1=601=59组间自由度=组数(k)1=31=2组内自由度=总自由度组间自由度=592=57。现在学习的是第20页,共45页查方差分析表得F0.05(2,57)=3.15,FF0.05(2,57),则P0.05。故按 =0.05的水准,拒绝H0,接受H1,故可认为三种治疗方案的治疗效果不一样。现在学习的是第21页,共45页多个样本均数的两两比较 在方差分析认为多组均数间差异有统计学意义的基础上,若需了解究竟哪些组均数之间有差别,还是各组间均有差别,可用多个样本均数的两两比较(又称多重比较 multiple comparison)。现在学习的是第22页,共45页多个样本均数的两两比较不宜用多个样本均数的两两比较不宜用t检验检验如用 t 检验,则第一类错误率将增大,此时易将无差别的两均数错判为有差别 =1-(1-)m (m=Ck2=k(k-1)/2)如:三个组的比较 1-(1-0.05)3=0.14,比0.05大多了。现在学习的是第23页,共45页多个样本均数间的两两比较多个样本均数间的两两比较 用q检验(又称Student-Newman-Keuls法,即SNK法),统计量为q:现在学习的是第24页,共45页H0:A=B,每次对比时两个总体均数相等;H1:AB,每次对比时两个总体均数不等。=0.05。将三个样本均数按从大到小顺序排列从大到小顺序排列并编上组次:组次 1 2 3 均数 1.840 1.415 0.930 组别(治疗方案)A B C 现在学习的是第25页,共45页 q0.05,(57,3)=3.40 q0.05,(57,2)=2.83现在学习的是第26页,共45页结论结论总的说来,三种治疗方案的治疗婴幼儿贫血疗效有差别。而这种差别主要来自A方案和C方案。这一结论可用下列形式表示:A B C 1.840 1.415 0.930现在学习的是第27页,共45页多个实验组与一个对照组均数间的两多个实验组与一个对照组均数间的两两比较两比较 常用q检验,又称Duncan法,其计算公式为:公式与q检验公式类似,但需查附表9 q界值表。现在学习的是第28页,共45页两因素多个样本均数的比较两因素多个样本均数的比较(two way analysis of variance)两因素:配伍因素和 处理因素属于随机区组设计随机区组设计 (randomized block design)又称“配伍组设计”现在学习的是第29页,共45页配伍的概念是“配对配对”概念的扩展概念的扩展,不是按每两个配对,而是按每三个、每四个或更多个配起来,这就超出了“对子”的涵义,而是配伍组设计了。现在学习的是第30页,共45页配伍设计的目的对研究因素以外的已知的干扰因素加以控制,从而将研究因素的作用与干扰因素的作用区分开,以达到提高检验的功效之目的。现在学习的是第31页,共45页实例例6.10 在抗癌药筛选试验中,拟用20只小白鼠按不同窝别分为5组,分别观察三种药物对小白鼠肉瘤(S180)的抑瘤效果,资料见表6.7,问三种药物有无抑瘤作用?现在学习的是第32页,共45页现在学习的是第33页,共45页两因素方差分析的原理类似于单因素方差分析,前者仅在后者的基础上,从误差中再分离出配伍组效应,使误差减少,达到提高检验功效之目的 SS总=SS处理+SS配伍+SS误差现在学习的是第34页,共45页实验因素:H0:三种药物对小白鼠肉瘤(S180)的抑瘤效 果与对照组相同,即对照=A=B=C;H1:三种药物对小白鼠肉瘤(S180)的抑瘤效果与对照组不全同或全不同。=0.05。建立检验假设建立检验假设现在学习的是第35页,共45页干扰因素:干扰因素:H0:5个窝别小白鼠对肉瘤生长的反应相同;H1:5个窝别小白鼠对肉瘤生长的反应不全相 同或全不相同。=0.05。现在学习的是第36页,共45页计算SS总,SS处理,SS配伍和SS误差 现在学习的是第37页,共45页SS误差=SS总SS处理SS配伍=0.741280.410840.11233=0.21811 现在学习的是第38页,共45页计算自由度计算自由度总=总例数1=201=19处理=处理组数1=41=3配伍=配伍组数1=51=4误差=总处理配伍=1934=12 现在学习的是第39页,共45页列方差分析表 现在学习的是第40页,共45页界定P值,作结论 F0.05,(3,12)=3.49 F0.05,(4,12)=3.26F0.01,(3,12)=5.95 F0.01,(4,12)=5.41 现在学习的是第41页,共45页显然处理组间均数的检验结果是FF0.01,P0.01,拒绝H0,接受H1,差别有统计学意义,可认为三种药物对小白鼠肉瘤(S180)的抑瘤效果与对照组不同;但配伍组间差别无统计学意义,即各窝小白鼠对肉瘤生长的反映相同。现在学习的是第42页,共45页方差齐性检验方差齐性检验 两个方差的齐性检验 多个方差的齐性检验 现在学习的是第43页,共45页方差分析的正确应用方差分析的正确应用 要求资料满足独立性、正态性和方差齐性 变量变换 对数转换对数转换 平方根转换平方根转换 平方根反正弦转换平方根反正弦转换现在学习的是第44页,共45页感谢大家观看现在学习的是第45页,共45页