SPSS统计分析_第五章__方差分析.ppt
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_05.gif)
《SPSS统计分析_第五章__方差分析.ppt》由会员分享,可在线阅读,更多相关《SPSS统计分析_第五章__方差分析.ppt(81页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、 第五章第五章 方差分析方差分析 一、方差分析的概念一、方差分析的概念 在科学实验中常常要探讨不同实验条件或处在科学实验中常常要探讨不同实验条件或处理方法对实验结果的影响。通常是比较不同理方法对实验结果的影响。通常是比较不同实验条件下样本均值间差异。实验条件下样本均值间差异。方差分析是检验两个或多个样本均数间差异方差分析是检验两个或多个样本均数间差异是否具有统计意义的一种统计学方法。是否具有统计意义的一种统计学方法。方差分析主要用于均数差别的显著性检验、分离各有关因素并估计其对总变异的作用、分析因素间的交互作用和方差齐性检验;举例:几种药物对某疾病的疗效;不同饲料对牲畜体重增长的效果;1方差分
2、析原理方差分析原理 随机误差,例如测量误差造成的差异,称为组内差异。用变量在各组的均值与该组内变量值之偏(离均)差平方和的总和表示。记作SS组内。实验条件,即不同的处理造成的差异,称为组间差异。用变量在各组的均值与总均值之偏(离均)差平方和的总和表示。记作SS组间。SS组间、SS组内除以各自的自由度得到其均方值即组间均方和组内均方。一种情况是处理没有作用,即各样本均来自同一总体。MS组间/MS组内1。考虑抽样误差的存在,则有MS组间/MS组内1。另一种情况是处理因素确实有作用。组间均方是由于误差与不同处理共同导致的结果,即各样本来自不同总体。那么,组间均方会远远大于组内均方。MS组间MS组内。
3、MS组间/MS组内比值构成F分布。用F值与其临界值比较,推断各样本是否来自相同的总体。2方差分析的假设检验方差分析的假设检验 假设有m个样本,如果原假设H0:样本均数都相同1=2=3=m=,m个样本有共同的方差2。则m个样本来自具有共同的方差2和相同的均数的总体。如果经过计算结果组间均方远远大于组内均方的FF0.05(f组间,f组内),(括号中的两个f是自由度)则p0.05,推翻原假设,说明样本来自不同的正态总体,说明处理造成均值的差异,有统计意义。否则,FF0.05(f组间,f组内),P0.05承认原假设,样本来自相同总体,处理无作用。二、方差分析中的术语二、方差分析中的术语因素与处理(Fa
4、ctor and Treament)水平(Level)单元(Cell)因素的主效应和因素间的交互效应均值比较协方差分析1因素与处理因素与处理因素(Factor)是影响因变量变化的客观条件客观条件;例如影响农作物产量的因素有气温、降雨量、日照时间等;处理(Treatments)是影响因变量变化的人为条件人为条件。也可以通通称为因素称为因素。如研究不同肥料对不同种系农作物产量的影响时农作物的不同种系可称为因素,所施肥料可视为不同的处理。一般情况下一般情况下Factors与与Treatments在方差分析中可作相同理在方差分析中可作相同理解解。在要求进行方差分析的数据文件中均作为分类变量出现。在要求
5、进行方差分析的数据文件中均作为分类变量出现。即它们的值只有有限个取值。即使是气温、降雨量等平常看作是连续变量的,在方差分析中如果作为影响产量的因素进行研究,就应该将其数值用分组定义水平的方法事先变为具有有限个取值的离散变量2水平水平因素的不同等级称作水平。例如,性别因素在一般情况下只研究两个水平:男、女。化学实验或生物实验中的“剂量”必须离散化为几个有限的水平数。如:1ml、2ml、4ml三个水平。应该特别注意的是在SPSS数据文件中,作为因素出现的变量不能是字符型变量,必须是数值型变量。例如性别变量SEX,定义为数值型,取值为0、1。换句话说,因素变量的值实际上是该变量实际值的代码,代码必须
6、是数值型的。可以定义值标签F、M(或Fema1e、ma1e)来表明0、1两个值的实际含义,以便在打印方差分析结果时使用。使结果更加具有可读性。3.单元(单元(Ce11)在方差分析中Cell指各因素的水平之间的每个组合。例如研究问题中的因素有性别Sex,取值为1、2;有年龄,分三个水平1(10岁)、2(11岁)、3(12岁)。两个变量的组合共可形成六个单元:1,1、1,2、1,3、2,1、2,2、2,3,代表两种性别与三种年龄的六种组合。4因素的主效应和因素间的交互效应因素的主效应和因素间的交互效应有A、B两种药物治疗缺铁性贫血,患者12例,分为4组。实验方案是:第一组用一般疗法;第二组在一般疗
7、法基础上加用A药;第三组在一般疗法基础上加用B药,第四组在一般疗法基础上A、B两药同时使用。一个月后观察红细胞增加数。要求分析两种药物的疗效(数据下表)。实验数据实验数据这是个双因素方差分析的问题,因素A与因素B。每个因素均有用该药与不用该药两个水平,研究药物A和B是否对红细胞的增加有显著影响是对红细胞增加数的均值作以下比较:红细胞增加数(百万/m3)第一组第二组第三组第四组0.81.30.92.10.91.21.12.20.71.11.02.0各组平均值0.81.21.02.1比较第二组的均值与第一组的均值是否有显著性差异。比较第三组的均值与第一组的均值是否有显著性差异。前两项研究的是A、B
8、两因素的主效应。除了比较第四组的均值与第一组的均值是否有显著性差异外还要研究A药对B药的疗效是否有影响。若A药对B药疗效无影响,那么除抽样误差外,第四组与第二组均值之差应该等于第三组均值减去第一组均值。但是实际上(2.11.2)=0.9;(1.00.8)=0.2。竞相差0.7,该差值几乎与第一组均值相同。0.7的差值包括抽样误差和A、B药的相互作用。因素之间的相互作用在统计学上称之为交互效应。如果交互效应存在,说明两个因素不是相互独立的。5均值比较均值比较均值的相对比较是比较各因素对因变量的效应的大小的相对比较。例如研究A、B效应之和是否等于它们的交互效应。或者研究A、B对红细胞增加数的效应是
9、否相等,等。均值的多重比较是研究因素单元对因变量的影响之间是否存在显著性差异,例如例题中研究A、B药物对红细胞增加数的疗效是否存在显著性差异。6协方差分析协方差分析在一般进行方差分析时,要求除研究的因素外应该保证其他条件的一致。作动物实验往往采用同一胎动物分组给予不同的处理,研究各种处理对研究对象的影响就是这个道理。例如研究身高与体重的关系时要求按性别分别进行分析。这样消除性别因素的影响。不同年龄的身高对体重的关系也是有区别的,被测对象往往是不同年龄的。要消除年龄的影响,应该采用协方差分析。三、方差分析过程SPSS提供的方差分析过程有:One-way过程(One-way ANOVA)Gener
10、al Linear Model(简称GLM,一般线性模型)过程(一)(一)One-way过程过程One-way过程就是单因素简单方差分析过程,它在Analyze菜单中的Compare Means过程组中,用 One-way ANOVA菜单项调用,可以进行单因素方差分析单因素方差分析、均值多重比较均值多重比较和和相相对比较对比较。1、单因素方差分析、单因素方差分析单因素方差分析也称作一维(元)方差分析。它检验由单一因素单一因素影响的一个(或几个相互独立的)因变量按因素各水平分组各水平分组的均值之间的差异是否具有统计意义。还可以对该因素的若干水平分组中哪一组与其他各组均值间具有显著性差异进行分析即
11、进行均值的多重比较。One-way ANOVA过程适用情况过程适用情况One-way ANOVA过程要求因变量属于正态分布总体;如果因变量的分布明显的是非正态,不能使用该过程,而应该使用非参数分析过程;如果几个因变量之间彼此不独立,应该用GLM过程。例例 题题用4种饲料喂猪,共19头猪分为四组,每组用一种饲料。一段时间后称重。猪体重增加数据如下。比较四种饲料对猪体重增加的作用有无不同。饲 料ABCD133.8151.2193.4225.8125.3149.0185.3224.6143.1162.7182.8220.4128.9143.8188.5212.3135.7153.5198.6步步 骤
12、骤1、建立数据库Fodder变量:数值型,取值1、2、3、4分别代表A、B、C、D四种饲料。Weight变量:数值型,其值为猪体重的增加数。应该特别注意,不能把A、B、C、D定义为四个变量。2、调用One-way过程进行单因素方差分析第一栏:方差来源第二栏:离均差平方和第三栏:自由度第四栏:均方差(第二栏与第三栏之比)第五栏:F值(组间均方与组内均方之比)第六栏:F值对应的概率即P值3、结果说明4、结果分析根据输出的p值为0.000可以看出,无论临界值取0.05,还是取0.01,P值均小于临界值。因此否定H0假设,四种饲料对猪体重均数有显著性意义,结论是四种饲料对猪体重的增加明显作用不同。根据
13、该结论选择饲料,犯错误的概率几乎为0。存在问题与解决方法 本例只考虑了猪体重的增加量,对其均值进行了比较但实际工作中的问题往往不是这样简单,例如是否应该考虑每头猪的进食量对体重增加的影响,去除这个影响比较猪体重的增加会对饲料比较得出更切合生产实际的结论。这个问题应该使用ANOVA过程的协方差分析功能去解决。使用系统默认值进行单因素方差分析只能得出是否有显著性差异的结论,本例数据量少,哪两组之间差别最大,哪种饲料使猪体重增加更快,几乎是可以看出来的。实际工作中往往需要两两的组间均值比较。这就需要使用 One-way ANOVA进行单因素方差分析时使用选择项从而获得更丰富的信息,使分析更深入。单因
14、素方差分析的选择项单因素方差分析的选择项Contrasts:可以指定一种要用t检验来检验的Priori对比,即进行均值的多项式比较选项;Post Hoc:可以指定一种多重比较检验;Option:可以指定要输出的统计量,指定处理缺失值的方法。Contrasts(均值的多项式选项)(均值的多项式选项)Polynomial(多项式比较):均值的多项式比较是包括两个或更多个均值的比较。单因素方差分析的One-way ANOVA过程允许进行高达5次的均值多项式比较。Linear线性、Quadratic二次、Cubic三次、4th四次、5th五次多项式 Coefficients:为多项式指定各组均值的系数
15、。因素变量分为几组,输入几个系数,多出的无意义。如果多项式中只包括第一组与第四组的均值的系数,必须把第二个、第三个系数输入为0值。如果只包括第一组与第二组的均值,则只需要输入前两个系数,第三、四个系数可以不输入。多项式的系数需要由读者自己根据研究的需要输入。可以同时建立多个多项式。一个多项式的一级系数输入结束,激活Next按钮,单击该按钮后Coefficients 框中清空,准备接受下一组系数数据。如果认为输入的几组系数中有错误,可以分别单击Previous或Next按钮前后翻找出错误的一组数据。单击出错的系数,该系数显示在编辑框中,可以在此进行修改,修改后年击Change按钮,在系数显示框中
16、出现正确的系数值。当在系数显示框中选中一个系数时,同时激活Remove按钮;单击该按钮将选中的系数清除。左图是要求计算:1.7mean11mean4的值。检验的假设H0:第一组值的的1.7倍与第四组的均值相等。Post Hoc(均数的多重比较选项)(均数的多重比较选项)进行多重比较是对每两个组的均值进行如下比较:MEAN(i)-MEAN(j)4.6625RANGESQRT(1/N(i)+1/N(j);其中i、j分别为组序号,MEAN(i)、MEAN(j)分别为第i、j组均值,N(i)、N(j)分别为第i、j组中的观测数。各组均值的多重比较方法的算法不同RANGE值也不同。LSD(最小显著差异法
17、):用 t检验完成各组均值间的配对比较。对多重比较误差率不进行调整;Bonferroni(修正最小显著差异法):用 t检验完成各组均值间的配对比较,但通过设置每个检验的误差率来控制整个误差;Sidak(斯达克法):计算t统计量进行多重配对比较,可以调整显著性水平,比Bonferroni法的界限要小Scheffe(谢弗检验法):对所有可能的组合进行同步进入的配对比较,这些选择可以同时选择若干个,以便比较各种均数比较方法的结果;R-E-G-W F(赖安艾耶盖F法):用F检验进行多重比较检验;R-E-G-W Q(赖安艾耶盖F法):正态分布范围进行多重配对比较;S-N-K(SNK法):用student
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- SPSS 统计分析 第五 _ 方差分析
![提示](https://www.taowenge.com/images/bang_tan.gif)
限制150内