方差分析与协方差分析.ppt
《方差分析与协方差分析.ppt》由会员分享,可在线阅读,更多相关《方差分析与协方差分析.ppt(56页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、关于方差分析与协方差分析现在学习的是第1页,共56页在针对连续变量的统计推断方法中,最常用的有t 检验和方差分析两种四种不同的颜色包装对饮料销售量的影响(四个水平,分类变量)两两t 检验?现在学习的是第2页,共56页不能做t 检验如果有K(K3)个平均数,若用两两比较的方法来检验,则需作K(K-1)/2次检验,不但程序繁琐,而且相当于从t 分布中随机抽取多个t 值,其落在大于临界值的范围内的概率大大增加,犯类错误的概率大大增加:如6次检验H0的概率是0.95时的误差为:1-0.956=0.265。现在学习的是第3页,共56页 方差分析概念第一类因素:可以控制的控制因素第二类因素:不能控制的随机
2、因素受前两类因素影响的事物为观察变量方差分析目的:分析控制变量的不同水平是否对观察变量产生了显著影响,检验各个水平下观察变量的均值是否相等现在学习的是第4页,共56页 方差分析分类之一单变量方差分析:一个观察变量单因方差分析中的控制变量只有一个多因素方差分析中的控制变量有多个多变量方差分析:多个观察变量现在学习的是第5页,共56页 方差分析分类之二一般方差分析:因变量是定量变量,自变量是定类数据协方差分析:将很难控制的因素作为协变量,在排除协变量影响的条件下,分析控制变量对观察变量的影响,从而更加准确地对控制变量进行评价。协变量一定要是连续数值型。非定量方差分析:因变量为定序变量现在学习的是第
3、6页,共56页 统计技术分类图定量因变量一个自变量多个自变量二分变量多分变量T检验单因子方差分析定类定类和定距定距N因子方差分析协方差分析回归分析一个因变量多个因变量多变量方差分析因变量非定量因变量非定量方差分析现在学习的是第7页,共56页 方差分析原理目的:通过方差的比较来检验各个水平下的观察值的均值是否相等观察值差异:观察值存在差异,差异的产生来自两个方面。系统性差异:由控制变量的不同水平造成的,例如饮料的不同颜色带来不同的销售量 随机性差异:由于抽选样本的随机性而产生的差异,例如,相同颜色的饮料在不同的商场销售量也不相同。现在学习的是第8页,共56页9方差分析的基本思想(单因素)组间变异
4、总变异组内变异组内只包含随机误差组间既包括随机误差,也包括系统误差现在学习的是第9页,共56页 组间变异组内变异AB现在学习的是第10页,共56页 组间变异组内变异 AB现在学习的是第11页,共56页单因素方差分析逻辑与步骤(One-Way ANOVA)前提假设模型与假设平方和的分解与F 检验多重比较(事后检验)关联强度与效应值现在学习的是第12页,共56页方差分析的前提条件(1)每个水平下的因变量应当服从正态分布。方差分析对分布假设有稳健性(robust),即正态性不满足时,统计结果变化不大,因此一般并不要求检验总体的正态性。(2)变异可加性。各因素对离差平方和的影响可以分割成几个可以加在一
5、起的部分。(多因素)(3)独立性。观察对象是来自所研究因素的各个水平之下的独立随机抽样现在学习的是第13页,共56页(4)方差齐性(homogeneity of variance),也称变异的同质性,各个水平下的总体具有相同的方差。这是方差分析一个很重要的前提,因此在进行方差分析之前,应当进行方差齐性检验。Bartlett检验法Levene F 检验最大方差与最小方差之比3,初步认为方差齐同。现在学习的是第14页,共56页方差不齐若方差齐性的假定不满足,可考虑如下策略:a.检查某些表现“特殊”的观测值,看能否将其剔除,用剩下的数据进行方差分析。b.使用无方差齐性假设的多重比较方法。c.数据变换
6、,用变换(平方根变换、对数变换等)后的数据进行方差分析。正态性转换。d.非参数检验现在学习的是第15页,共56页模型与假设模型表达式(单因素)Y=+a+e建立假设,确定检验水准 k组总体均数不全相等。现在学习的是第16页,共56页方差分析表 组间变异体现了因素A的效应,组内变异则被视作误差。来源平方和 自由度均方F 值P 值组间组内总和确定P 值,做出统计推断现在学习的是第17页,共56页如果均值相等,如果均值相等,如果均值相等,如果均值相等,如果均值相等,如果均值相等,F FF=MSAMSAMSA/MSEMSEMSE1 1 1 F 分布分布F(k-1,n-k)0 0拒绝拒绝拒绝拒绝HH0 0
7、不能拒绝不能拒绝不能拒绝不能拒绝H H H H0 0 0 0F F现在学习的是第18页,共56页事后比较(posteriori/post hoc comparison)F 检验显著说明各组均值并不相同(至少两组不同),但不能回答到底哪几组不同。通过对各组均值之间的配对比较来进一步检验到底哪些均值之间存在差异。方法众多,不下20种。现在学习的是第19页,共56页LSD法:最灵敏,会犯假阳性错误;Sidak法:比LSD法保守;Bonferroni法:比Sidak法更为保守一些;常用Scheffe法:多用于进行比较的两组间样本含量不等时;Dunnet法:常用于多个试验组与一个对照组的比较;S-N-K
8、法:寻找同质亚组的方法;Turkey法:最迟钝,要求各组样本含量相同;Duncan法:与Sidak法类似。均数两两比较方法现在学习的是第20页,共56页关联强度(strength of association)与效应值(effect size)的度量实验处理引致的效应的大小或者数据的变异有多少部分是由实验处理造成的。Eta平方净(偏)Eta平方Omega平方Cohens f(具体内容见附录)现在学习的是第21页,共56页双因素(无交互作用)试验的方差分析表方差来源因素A总和平方和 自由度均方和F 值F 值临介值因素B误差注意 各因素离差平方和的自由度为水平数减一,总平方和的自由度为试验总次数减
9、一。现在学习的是第22页,共56页双因素(有重复)试验方差分析表方差来源因素A总和平方和 自由度均方和F 值F 值临介值因素B误差这里现在学习的是第23页,共56页方差分析的应用范围:(一)单因素多个样本均数的比较:1.完全随机设计:只安排一种处理因素,不安排任何配伍因素。2.随机化区组设计:只安排一种处理因素,安排一种配伍因素。3.拉丁方设计:只安排一种处理因素,安排两种配伍因素。现在学习的是第24页,共56页(二)多因素样本均数间的比较:1.析因设计:安排两种或两种以上处理因素,分析处理因素间的交互作用2.裂区设计:安排两种或两种以上处理因素,分析处理因素间的交互作用3.交叉设计:安排两种
10、或两种以上处理因素,分析处理因素间的交互作用(三)多个样本均数向量间的比较 多元方差分析:结果变量有两个以上,需要综合评价。(四)回归方程的假设检验 现在学习的是第25页,共56页协方差分析现在学习的是第26页,共56页27概念:将方差分析和回归分析结合起来的一种统计分析方法 当试验指标(Y)的变异既受一个或几个分类变量,也受一个或几个连续变量的影响,可采用协方差分析方差分析:一个或几个因子(分类变量)对变量Y(连续变量)的影响回归分析:一个或几个变量(连续变量)对变量Y(连续变量)的影响 现在学习的是第27页,共56页28目的消除连续变量对Y的影响,使方差分析的检验功效更高,结果更可靠连续变
11、量可能会增大 Y 的组间差异,导致错误结论连续变量可能会增大 Y 的组内变异,降低检验功效消除分类变量的影响,使回归分析的结果更可靠现在学习的是第28页,共56页 20名男性篮球运动员和20名大学生的肺活量(cm3)比较篮球运动员肺活量Y大学生肺活量Y4700345052004100 48004000协方差分析基本思想现在学习的是第29页,共56页协方差分析基本思想篮球运动员大学生身高X肺活量Y身高X肺活量Y1854700168345017552001704100 17448001694000 20名男性篮球运动员和20名大学生的肺活量(cm3)比较协变量现在学习的是第30页,共56页协方差分
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 方差分析 协方差分析
限制150内