方差分析-SPSS操作流程(PPT77页)bejb.ppt
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_05.gif)
《方差分析-SPSS操作流程(PPT77页)bejb.ppt》由会员分享,可在线阅读,更多相关《方差分析-SPSS操作流程(PPT77页)bejb.ppt(78页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、SPSS操作方差分析 方差分析由英国统计学家R.A.Fisher在1923年提出,为纪念Fisher,以F命名,故方差分析又称 F 检验。三种变异 总变异:全部观察值大小各不相等,其变异就称为总变异(total variation)。用SST表示 组间变异:由于各组处理不同所引起的变异称为组间变异(variation between groups)。它反应了处理因素对不同组的影响,同时也包括了随机误差。用SS组间表示 组内变异:每个处理组内部的各个观察值也大小不等,与每组的样本均数也不相同,这种变异称为组内变异(variation within groups)。组内变异只反映随机误差的大小,如
2、个体差异、随机测量误差等。因此,又称为误差变异。用SS组内表示方差分析中的多重比较 目的:如果方差分析判断总体均值间存在显著差异,接下来可通过多重比较对每个水平的均值逐对进行比较,以判断具体是哪些水平间存在显著差异。常用方法备选:LSD法:t检验的变形,在变异和自由度的计算上利用了整个样本信息。Duncan 新复极差测验法Tukey 固定极差测验法Dunnett最小显著差数测验法 等 实现手段:方差分析菜单中的“Post hoc test”按钮实例-多重比较步骤一:步骤一:同 同one-way one-way ANOVA ANOVA步骤二:步骤二:选 选“Post hoc Post hoc t
3、est test”勾选多重比较的 勾选多重比较的方法 方法(如 如LSD LSD、duncan duncan法 法 确定显著性水平 确定显著性水平continue continuePost Hoc Test方差分析的思路:将全部观测值的总变异按影响结果的诸因素分解为相应的若干部分变异,构造出反映各部分变异作用的统计量,在此基础上,构建假设检验统计量,以实现对总体参数的推断。检验假设:H0:三个组的总体均数相同;H1:三个组的总体均数不全相同;方差分析步骤单因素方差分析 也称有一维方差分析,对二组以上的均值加以比较。检验由单一因素影响的一个(或几个相互独立的)分析变量由因素各水平分组的均值之间的
4、差异是否有统计意义。并可以进行两两组间均值的比较,称作组间均值的多重比较,还可以对该因素的若干水平分组中哪些组均值不具有显著性差异进行分析,即一致性子集检验。步骤AnalyzeCompare means One-way ANOVAOne-Way过程 One-Way过程:单因素简单方差分析过程。在Compare Means菜单项中,可以进行单因素方差分析(完全随机设计资料的多个样本均数比较和样本均数间的多重比较,也可进行多个处理组与一个对照组的比较)、均值多重比较和相对比较,用于。One-Way ANOVA过程要求:n 因(分析)变量属于正态分布总体,若因(分析)变量的分布明显的是非正态,应该用
5、非参数分析过程。n 对被观测对象的实验不是随机分组的,而是进行的重复测量形成几个彼此不独立的变量,应该用Repeated Measure菜单项,进行重复测量方差分析,条件满足时,还可以进行趋势分析。analyzecompare meansone-way ANVOA响应变量 响应变量因素 因素Contrasts:线性组合比较。是参数或统计量的线性函数,用于检验均数间的关系,除了比较差异外,还包括线性趋势检验Contrasts可以表达为:a1u1+a2u2+akuk=0;满足a1+a2+ak=0。式中ai为线性组合系数,ui为总体均数,k为分类变量的水平数 Polynomial(多项式比较):均值
6、趋势的检验有5种多项式:Linear线性、Quadratic二次、Cubic三次、4th四次、5th五次多项式 Coefficients:为多项式指定各组均值的系数。因素变量分为几组,输入几个系数,多出的无意义。如果多项式中只包括第一组与第四组的均值的系数,必须把第二个、第三个系数输入为0值。如果只包括第一组与第二组的均值,则只需要输入前两个系数,第三、四个系数可以不输入。多项式的系数需要由根据研究的需要输入。如果进行先验对比检验,则应在Coefficients后依次输入系数ci,并确保ci0。应注意系数输入的顺序,它将分别与控制变量的水平值相对应。例如,当k4时,即有A、B、C、D 4个处理
7、组,如果只将B组和D组比较,则线性组合系数依次为0、-1、0、-1;如果C组与其他3组的平均水平比较,则线性组合系数依次为-1、-1、3、-1,余类推。线性组合系数要按照分类变量水平的顺序依次填入Coefficients框中。均值的多项式比较 可以同时建立多个多项式。一个多项式的一级系数输入结束,激活Next按钮,单击该按钮后Coefficients 框中清空,准备接受下一组系数数据。如果认为输入的几组系数中有错误,可以分别单击Previous或Next按钮前后翻找出错误的一组数据。单击出错的系数,该系数显示在编辑框中,可以在此进行修改,修改后击Change按钮,在系数显示框中出现正确的系数值
8、。当在系数显示框中选中一个系数时,同时激活Remove按钮;单击该按钮将选中的系数清除。Post Hoc(均数的多重比较选项)进行多重比较是对每两个组的均值进行如下比较:MEAN(i)-MEAN(j)4.6625RANGESQRT(1/N(i)+1/N(j);其中i、j分别为组序号,MEAN(i)、MEAN(j)分别为第i、j组均值,N(i)、N(j)分别为第i、j组中的观测数。各组均值的多重比较方法的算法不同RANGE值也不同。方差相等时可选择的比较方法方差不等时可选择的比较方法与对照组的配对比较用t检验完成各组均值的配对比较 LSD(最小显著差异法):用 t检验完成各组均值间的配对比较。在
9、变异和自由度的计算上利用了整个样本信息。对多重比较误差率不进行调整;(此法最敏感)Bonferroni(修正最小显著差异法):用 t检验完成各组均值间的配对比较,但通过设置每个检验的误差率来控制整个误差;(应用较多)Sidak(斯达克法):计算t统计量进行多重配对比较,可以调整显著性水平,比Bonferroni法的界限要小 Scheffe(谢弗检验法):对所有可能的组合进行同步进入的配对比较,这些选择可以同时选择若干个,以便比较各种均数比较方法的结果;R-E-G-W F(赖安艾耶盖F法):用F检验进行多重比较检验,显示一致性子集表;R-E-G-W Q(赖安艾耶盖Q法):正态分布范围进行多重配对
10、比较;显示一致性子集表;S-N-K(SNK法):用student range分布进行所有各组均值间的比较;(应用较多)Tukey(图基法):固定极差测验法,用student-range统计量进行所有组间均值的配对比较,将所有配对比较误差率作为实验误差率;Tukeys-b(图基s-b法):用student range分布进行组间均值的配对比较。其精确值为前两种检验相应值的平均值;Duncan(邓肯法):新复极差测验法,指定一系列的的Range值,逐步进行计算比较得出结论;Hochbergs GT2(霍耶比GT2法):用正态最大系数进行多重比较 Gabriet(盖比理法):用正态标准系数进行配对比
11、较,在单元数较大时,这种方法较自由;Waller-Duncan(瓦尔-邓肯法):用t统计量进行多重比较检验。使用贝耶斯接近;Dunnett(邓尼特法):最小显著差数测验法,进行各组与对照组的均值,默认的对照组是最后一组;选定此方法后,激活下面的Control Catetory参数框,展开小菜单,选择对照组 Tamhanes T2(塔海尼T2法):t检验进行配对比较;Dunnetts T3(邓尼特T3法):正态分布下的配对比较;Games-Howell(盖门-霍威尔法):各组均值的配对比较,该方法较灵活;DunnettC(邓尼特C法):正态分布下的配对比较。常用的多重比较方法的适用性 LSD(L
12、east significant Difference):存在明确对照组,进行验证性研究;两均数间的比较是独立的 T(Tukey)方法:如果事先未计划未计划多重比较,在方差分析得到由统计学意义的F值之后,有需要进行任意两组之间的比较,且各组样本数相同 S(Scheffe)方法:多个均值间的比较,且各组样本数不相同 SNK(Student-Newman-Keul)方法:两两比较次数不多常用的方法有LSD,Scheffe 法,SNK 法,Turky 法,Duncan 法和Bonferroni 法等。其中LSD 法最敏感,Scheffe 法不敏感,SNK 法和Bonferroni 法应用较多。Opt
13、ions(输出统计量的选择)Descriptive复选项,要求输出描述统计量。选择此项,会计算并输出:观测量数目、均值、标准差、标准误、最小值、最大值、各组中每个因变量的95可信区间;Fix and random effects:输出固定效应模型的标准差、标准误和95%可信区间与随机效应模型的标准误和95%可信区间;Homogeneity of variance复选项,要求进行方差齐次性检验,并输出检验结果。Brown-Forsythe:检验各组均数相等,当不能确定方差齐性检验时,该统计量优于F统计量。Welch:检验各组均数相等,当不能确定方差齐性检验时,该统计量优于F统计量。Mean pl
14、ot复选项,即均数分布图,横轴为分类变量,纵轴为反应变量的均数线图;Missing Values栏中,选择缺失值处理方法。Exclude cases analysis by analysis选项,对含有缺失值的观测量根据缺失值是因变量还是自变量从有关的分析中剔除。Exclude cases listwise选项对含有缺失值的观测量从所有分析中剔除 饲料A B C D133.8 151.2 193.4 225.8125.3 149.0 185.3 224.6143.1 162.7 182.8 220.4128.9 143.8 188.5 212.3135.7 153.5 198.6实例-单因素方
15、差分析各处理重复数不等的方差分析用四种饲料喂养19头猪比较,四种饲料是否不同。实例-单因素方差分析 第一栏:方差来源 第二栏:离均差平方和 第三栏:自由度 第四栏:均方(第二栏与第三栏之比)第五栏:F值(组间均方与组内均方之比)第六栏:F值对应的概率即P值实例-单因素方差分析(结果输出)存在问题与解决方法 本例只考虑了猪体重的增加量,对其均值进行了比较。但实际工作中的问题往往不是这样简单,例如是否应该考虑每头猪的进食量对体重增加的影响,去除这个影响比较猪体重的增加会对饲料比较得出更切合生产实际的结论。这个问题应该使用ANOVA过程的协方差分析功能去解决。使用系统默认值进行单因素方差分析只能得出
16、是否有显著性差异的结论,本例数据量少,哪两组之间差别最大,哪种饲料使猪体重增加更快,几乎是可以看出来的。实际工作中往往需要两两的组间均值比较。这就需要使用 One-way ANOVA进行单因素方差分析时使用选择项从而获得更丰富的信息,使分析更深入。例题进一步分析 用4种饲料喂猪,共19头猪分为四组,每组用一种饲料。一段时间后称重。猪体重增加数据如下。比较四种饲料对猪体重增加的作用有无不同;并比较A、C饲料效应和与B、D效应和之间是否有显著性差异。饲 料A B C D133.8 151.2 193.4 225.8125.3 149.0 185.3 224.6143.1 162.7 182.8 2
17、20.4128.9 143.8 188.5 212.3135.7 153.5 198.6指定多项式系数 1.0mean11.0mean21.0mean31.0mean4检验饲料对使猪体重增加的效应,A、D饲料效应和与B、C饲料效应和之间是否有显著性差异;1.0mean11.0mean21.0mean31.0mean4检验 A、C饲料效应和与B、D效应和之间是否有显著性差异。结果分析(1)描述统计量结果 给出了四种饲料分组的样本含量N、平均数Mean、标准差 Std Deviation、标准误 Std Error、95的置信区间、最小值和最大值;结果分析(2)方差齐次性检验结果方差齐性检验由于方
18、差分析的前提是各水平下的总体服从正态分布并且方差相等,因此有必要对方差齐性进行检验,即对控制变量不同水平下各观测变量不同总体方差是否相等进行分析。SPSS单因素方差分析中,方差齐性检验采用了方差同质性(Homogeneity of Variance)的检验方法,其零假设是各水平下观测变量总体方差无显著性差异,实现思路同SPSS两独立样本t检验中的方差齐性检验。从显著性概率看,P0.9950.05,说明各组的方差在=0.05水平上没有显著性差异,即方差具有齐次性。这个结论在选择多重比较方法时作为一个条件。结果分析(3)方差分析结果 与未使用选择项的输出结果一样给出了组间、组内的偏差平方和、均方、
19、F值和概率P值。P0.05,各组间均值在0.05水平上有显著性差异。另外。表中还给出了未加权、加权的线性项以及加权的线性项与组间偏差平方和之差351.7660,以及由此派生出的均方、F值、P值。结果分析(4)对比系数表 列出两组多项式比较的系数 结果分析(5)多项式比较结果 第一栏:按方差齐性和非齐性划分。第二栏:多项式的值。第三栏:标准误。第四栏:计算的t值,是第2栏与第3栏之比。第五栏:自由度。第六栏:t值的概率。从概率值可以看出:Contrast1,p0.05;Contrast2,p0.05,因此饲料对猪体重增加的效应,A、D 效应之和与B、C 效应之和在=0.05 水平上没有显著性差异
20、;而A、C 效应之和与B、D 效应之和有显著性差异。结果分析(6)均值多重比较的结果LSDLSD法法 对饲料间均值差两两比较,用”*”表示差异显著结果分析(7)多重比较下的齐性子集结果Duncan Duncan法 法 第一栏列出A、B、C、D各组,第二栏列出DUNCAN取渐渐增大的Range值进行比较而分的子集。由于各组样本含量不等,计算均数用的是调和平均数的样本量是4.706。从概率值看,p0.05;说明各组方差具有齐次性。对饲料间均值差两两比较,处在同一竖栏为差异不显著,反之则差异显著结果分析(8)均数图形 以因素变量fodder为横轴,以独立变量Weight为纵轴而绘制的均数散点图。可看
21、出各组均数的水平分布。特别说明 应该特别说明的是,选取哪些选择项是根据研究需要进行的。本例中希望比较各种饲料对猪体重增加的效应,因此选择多重比较的选择项。相对比较在此例中无实际意义,只是为了说明选择项的使用方法才选择了Contrast 选择项。ANOVAWEIGHT Sum of Squaresdf Mean Square F Sig.Between Groups20538.698 3 6846.233 157.467.000Within Groups 652.159 15 43.477 Total 21190.858 18 n=19,p=4Sum of Squares(平方和)df自由度Me
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 方差分析 SPSS 操作 流程 PPT77 bejb
![提示](https://www.taowenge.com/images/bang_tan.gif)
限制150内