【教学课件】第9章方差分析.ppt
《【教学课件】第9章方差分析.ppt》由会员分享,可在线阅读,更多相关《【教学课件】第9章方差分析.ppt(33页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、第9章 方差分析 介绍介绍w 1、方差分析的概念、方差分析的概念w 2、方差分析的过程、方差分析的过程本章内容9.1 方差分析的概念与方差分析的过程方差分析的概念与方差分析的过程9.2 单因素方差分析单因素方差分析9.3 单因变量多因素方差分析过程单因变量多因素方差分析过程9.4 多因变量线性模型的方差分析多因变量线性模型的方差分析9.5 重复测量设计的方差分析重复测量设计的方差分析9.6 方差成分分析方差成分分析9.7 正交实验设计正交实验设计练习题(对银行数据进行方差分析)练习题(对银行数据进行方差分析)9.1.1方差分析的概念在科学实验中常常要探讨不同实验条件或在科学实验中常常要探讨不同
2、实验条件或处理方法对实验结果的影响。通常是比较处理方法对实验结果的影响。通常是比较不同实验条件下样本均值间的差异不同实验条件下样本均值间的差异方差分析是检验多组样本均值间的差异是方差分析是检验多组样本均值间的差异是否具有统计意义的一种方法。例如否具有统计意义的一种方法。例如n医学界研究几种药物对某种疾病的疗效;医学界研究几种药物对某种疾病的疗效;n农业研究土壤、肥料、日照时间等因素对某农业研究土壤、肥料、日照时间等因素对某种农作物产量的影响种农作物产量的影响n不同饲料对牲畜体重增长的效果等不同饲料对牲畜体重增长的效果等都可以使用方差分析方法去解决都可以使用方差分析方法去解决方差分析基本原理认为
3、不同处理组的均值间的差别基本来源认为不同处理组的均值间的差别基本来源有两个有两个:n(1)随机误差,如测量误差造成的差异或个)随机误差,如测量误差造成的差异或个体间的差异,称为组内差异,用变量在各组的体间的差异,称为组内差异,用变量在各组的均值与该组内变量值之偏差平方和的总和表示,均值与该组内变量值之偏差平方和的总和表示,记作记作SSw,组内自由度,组内自由度dfwn(2)实验条件,即不同的处理造成的差异,)实验条件,即不同的处理造成的差异,称为组间差异。用变量在各组的均值与总均值称为组间差异。用变量在各组的均值与总均值之偏差平方和表示,记作之偏差平方和表示,记作SSb,组间自由度,组间自由度
4、dfbn总偏差平方和总偏差平方和SSt、SSb、SSw的公式的公式P147方差分析基本原理(续)组内组内SSw、组间组间SSb除以各自的自由度除以各自的自由度(组内组内dfw=n-m,组间,组间dfb=m-1,其中,其中n为样本总为样本总数,数,m为组数为组数),得到其均方,得到其均方MSw和和MSb,一一种情况是处理没有作用,即各组样本均来自种情况是处理没有作用,即各组样本均来自同一总体,同一总体,MSb/MSw1。另一种情况是处理。另一种情况是处理确实有作用,那么,确实有作用,那么,MSbMSw(远远大于远远大于)。MSb/MSw比值构成比值构成F分布,用分布,用F值与其临界值值与其临界值
5、比较,推断各样本是否来自相同的总体比较,推断各样本是否来自相同的总体.方差分析的假设检验零假设零假设H0:m组样本均值都相同,即组样本均值都相同,即1=2=.=m如果经过计算结果组间均方远远大于组内均方如果经过计算结果组间均方远远大于组内均方(MSbMSw),),FF0.05(dfb,dfw),p0.05,拒绝零假设,拒绝零假设,说明样本来自不同的正态总体,说明样本来自不同的正态总体,说明处理造成均值的说明处理造成均值的差异有统计意义差异有统计意义;否则;否则,F0.05不能拒绝零假设不能拒绝零假设,说,说明样本来自相同的正态总体,处理间明样本来自相同的正态总体,处理间无差异无差异。9.1.2
6、 方差分析中的术语1、因素与处理:、因素与处理:因素是影响因变量变化的因素是影响因变量变化的客观条件客观条件;处理是影响因变量变化的;处理是影响因变量变化的人为条件人为条件。也可通称为因素。用分类变量表示,取有限的也可通称为因素。用分类变量表示,取有限的离散值离散值2、水平:、水平:因素的不同等级称作水平。水平值因素的不同等级称作水平。水平值取有限的离散值。如:性别中的取有限的离散值。如:性别中的0,1(男、女)(男、女)等等3、单元、单元(cell):指各因素的水平之间的每指各因素的水平之间的每个组合。如性别个组合。如性别(0,1)和年龄和年龄(10,11,12)的六的六种组合。种组合。9.
7、1.2 方差分析中的术语(续)4、因素的主效应和因素间的交互效应(如药物、因素的主效应和因素间的交互效应(如药物A、B的主效应及的主效应及AB的交互效应)的交互效应)5、均值比较:、均值比较:n均值的相对比较是比较各因素对因变量的效应大小的均值的相对比较是比较各因素对因变量的效应大小的相对比较,如研究相对比较,如研究A、B的单独效应之和是否等于它们的单独效应之和是否等于它们的交互效应,或的交互效应,或A、B的效应是否相等。的效应是否相等。n均值的多重比较是研究因素单元对因变量的影响之间均值的多重比较是研究因素单元对因变量的影响之间是否存在显著性差异。如是否存在显著性差异。如A、B的疗效是否存在
8、显著性的疗效是否存在显著性差异。差异。6、单元均值、边际均值:、单元均值、边际均值:n在多因素方差分析中,每种因素水平组合的因变量均在多因素方差分析中,每种因素水平组合的因变量均值称为单元均值。一个因素水平的因变量均值称为边值称为单元均值。一个因素水平的因变量均值称为边际均值(际均值(Marginal Means)方差分析中的术语(续)7、协方差分析:、协方差分析:在一般进行方差分析时,要求除研究的在一般进行方差分析时,要求除研究的因素外应该保证其他条件的一致。作动物实验往往采用同一胎动因素外应该保证其他条件的一致。作动物实验往往采用同一胎动物分组给予不同的处理,研究不同处理对研究对象的影响就
9、是这物分组给予不同的处理,研究不同处理对研究对象的影响就是这个道理。如研究身高与体重的关系时要求按性别分别进行分析,个道理。如研究身高与体重的关系时要求按性别分别进行分析,以消除性别因素的影响。要消除其他因素的影响,应采用协方差以消除性别因素的影响。要消除其他因素的影响,应采用协方差分析。分析。8、重复测量:、重复测量:组内变异的主要的原因是实验对象之间的个组内变异的主要的原因是实验对象之间的个体差异。由于个体差异存在,即使实验对象受到相同的处理,他体差异。由于个体差异存在,即使实验对象受到相同的处理,他们的因变量值也可能相当不同。重复测量设计的方差分析也是像们的因变量值也可能相当不同。重复测
10、量设计的方差分析也是像协方差分析一样,是在研究中减少个体差异带来的误差方差的一协方差分析一样,是在研究中减少个体差异带来的误差方差的一种有效方法,而且由于对相同个体进行重复测量,在一定程度上种有效方法,而且由于对相同个体进行重复测量,在一定程度上降低了人力、物力、财力的消耗。降低了人力、物力、财力的消耗。如果重复测量是在一段时间内或一个温度间隔内进行的,还可以如果重复测量是在一段时间内或一个温度间隔内进行的,还可以研究因变量对时间、温度等自变量的变化趋势,这种重复测研究因变量对时间、温度等自变量的变化趋势,这种重复测量研究称为趋势研究量研究称为趋势研究。9.1.3 方差分析过程1、One-Wa
11、y过程:单因素简单方差分析过程:单因素简单方差分析过程。在过程。在Compare Means菜单项中,可菜单项中,可以进行单因素方差分析、均值多重比较和以进行单因素方差分析、均值多重比较和相对比较。相对比较。2、General Linear Model(简称简称GLM)过程:过程:GLM过程由过程由Analyze菜单直接调用。菜单直接调用。这些过程可以完成简单的多因素方差分析这些过程可以完成简单的多因素方差分析和协方差分析,不但可以分析各因素的主和协方差分析,不但可以分析各因素的主效应,还可以分析各因素间的交互效应。效应,还可以分析各因素间的交互效应。General Linear Model(
12、简称GLM)过程n在在General Linear Model菜单项下有菜单项下有四项:四项:nUnivariateUnivariate:提供回归分析和一个因变量和一提供回归分析和一个因变量和一个或几个因素变量的方差分析。个或几个因素变量的方差分析。nMultivariate:Multivariate:可进行多可进行多因变量的多因素分析因变量的多因素分析nRepeated Measure:Repeated Measure:可进行重复测量方差分析可进行重复测量方差分析nVariance ComponentVariance Component:可进行方差成分分析。可进行方差成分分析。通过计算方差估
13、计值,可以帮助我们分析如何通过计算方差估计值,可以帮助我们分析如何减小方差。减小方差。9.单因素方差分析也称有一维方差分析,对二组以上的均值加以比较。也称有一维方差分析,对二组以上的均值加以比较。检验由单一因素影响的一个(或几个相互独立的)分检验由单一因素影响的一个(或几个相互独立的)分析变量由因素各水平分组的均值之间的差异是否有统析变量由因素各水平分组的均值之间的差异是否有统计意义。计意义。并可以进行两两组间均值的比较,称作组间均值的多并可以进行两两组间均值的比较,称作组间均值的多重比较,还可以对该因素的若干水平分组中哪些组均重比较,还可以对该因素的若干水平分组中哪些组均值不具有显著性差异进
14、行分析,即一致性子集检验。值不具有显著性差异进行分析,即一致性子集检验。One-Way ANOVAOne-Way ANOVA过程要求:过程要求:1.因(分析)变量属于正态分布总体,若因(分析)变量的分因(分析)变量属于正态分布总体,若因(分析)变量的分布明显的是非正态,应该用非参数分析过程。布明显的是非正态,应该用非参数分析过程。2.对被观测对象的实验不是随机分组的,而是进行的重复测量对被观测对象的实验不是随机分组的,而是进行的重复测量形成几个彼此不独立的变量,应该用形成几个彼此不独立的变量,应该用Repeated Measure菜菜单项,单项,进行重复测量方差分析,条件满足时,还可以进行趋进
15、行重复测量方差分析,条件满足时,还可以进行趋势分析。势分析。9.1 简单的一维方差分析使用系统默认值进行一维方差分析:使用系统默认值进行一维方差分析:nP151 比较四种饲料对猪体重增加的作用有无不同比较四种饲料对猪体重增加的作用有无不同(注意:分组变量的定义)(注意:分组变量的定义)data09-01nAnalyze-Compare Means-One-Way ANOVAnDependent List:weightnFactor:foddern结果只有方差分析表结果只有方差分析表n结果中比较有用的值:结果中比较有用的值:Sig显著性概率值。显著性概率值。n结论:四种饲料对猪体重增加的作用有显
16、著性差异结论:四种饲料对猪体重增加的作用有显著性差异。n零假设零假设H0:组间均值无显著性差异(即四种饲料对猪组间均值无显著性差异(即四种饲料对猪体重增加的平均值无显著性差异);体重增加的平均值无显著性差异);9.2-9.3 单因素方差分析的选择项和例子使用选择项的单因素方差分析:使用选择项的单因素方差分析:nP155 比较四种饲料对猪体重增加的作用比较四种饲料对猪体重增加的作用data09-01nAnalyze-Compare Means-One-Way ANOVAnDependent List:weightnFactor:foddernContrasts选项选项:多项式比较(多项式比较(A
17、D与与BC比较和比较和AC与与BD比较)比较)nPost Hoc选项选项:均值多重比较均值多重比较LSD和和Tamhanes T2,一致性子集一致性子集检验检验Duncan(各种方法的使用条件方差齐或不齐)各种方法的使用条件方差齐或不齐)nOptions选项选项:Descriptive描述统计量,描述统计量,Homogeneity-of-variance方差齐次性检验,方差齐次性检验,Means plot均值分布图均值分布图n结果除了方差分析表,还有很多选项相应的结果结果除了方差分析表,还有很多选项相应的结果n结论:四种饲料对猪体重增加的作用有显著性差异,还可得知结论:四种饲料对猪体重增加的作
18、用有显著性差异,还可得知ABCD四种饲料对猪平均体重增加多少(越来越多)四种饲料对猪平均体重增加多少(越来越多)。nP159 同种三叶草被接种上不同的菌种,其含氮量情况同种三叶草被接种上不同的菌种,其含氮量情况data09-02(注意注意Post Hoc各种方法结果的使用条件方差齐或不齐)各种方法结果的使用条件方差齐或不齐).9.3 单因变量多因素方差分析过程(多因素,2)1、单因变量多因素方差分析概述、单因变量多因素方差分析概述2、单因变量多因素方差分析的菜单和选择项、单因变量多因素方差分析的菜单和选择项3、使用系统默认值进行随机区组设计资料的方、使用系统默认值进行随机区组设计资料的方差分析
19、差分析4、22析因实验方差分析实例析因实验方差分析实例5、拉丁方区组设计的方差分析实例、拉丁方区组设计的方差分析实例6、协方差分析实例、协方差分析实例7、多维交互效应方差分析实例、多维交互效应方差分析实例9.3.1单因变量多因素方差分析概述1、概述、概述n是对一个独立变量是否受多个因素或变量影响而进行的方差分析。是对一个独立变量是否受多个因素或变量影响而进行的方差分析。nSPSS调用调用UNIANOVA过程,检验不同水平组合之间因(分析)变量过程,检验不同水平组合之间因(分析)变量均值由于受不同因素影响是否有差异的问题。均值由于受不同因素影响是否有差异的问题。nUNIANOVA过程可以分析每一
20、个因素的作用(主效应),也可以分析过程可以分析每一个因素的作用(主效应),也可以分析因素之间的交互作用(交互效应)。可以进行协方差分析,以及各因因素之间的交互作用(交互效应)。可以进行协方差分析,以及各因素变量与协变量之间的交互作用。素变量与协变量之间的交互作用。nUNIANOVA过程过程要求因变量是从多元正态总体随机采样得来,且总体要求因变量是从多元正态总体随机采样得来,且总体中各单元的方差相同,也可以通过方差齐次性检验选择均值比较结果。中各单元的方差相同,也可以通过方差齐次性检验选择均值比较结果。n因变量和协变量必须是数值型变量,协变量与因变量彼此不独立。因因变量和协变量必须是数值型变量,
21、协变量与因变量彼此不独立。因素变量是分类变量,可以是数值型和字符型。素变量是分类变量,可以是数值型和字符型。n固定因素变量(固定因素变量(Fixed FactorFixed Factor)是反应处理的因素。随机因素是随机)是反应处理的因素。随机因素是随机设置的因素,是在确定模型时需要考虑会对实验有影响的因素,对实设置的因素,是在确定模型时需要考虑会对实验有影响的因素,对实验结果影响的大小可以通过方差成分分析确定。验结果影响的大小可以通过方差成分分析确定。2 2、关于模型:、关于模型:GLM UnivariateGLM Univariate功能很强,可以建立包括各种主效应、交功能很强,可以建立包
22、括各种主效应、交互效应的模型。必须认真分析因素变量的具体情况,来确定自己的模型,互效应的模型。必须认真分析因素变量的具体情况,来确定自己的模型,否则会产生不可解释的输出结果。否则会产生不可解释的输出结果。9.3.2 单因变量多因素方差分析的菜单和选择项菜单:菜单:Analyze-General Linear Model-Univariate Analyze-General Linear Model-Univariate 选项:选项:n选择分析模型选择分析模型Model:Model:w默认全模型默认全模型Full FactorialFull Factorial:包括所有因素变量的主效应、所有协:
23、包括所有因素变量的主效应、所有协变量的主效应、所有因素与因素的交互效应,不包括协变量与其他变量的主效应、所有因素与因素的交互效应,不包括协变量与其他因素的交互效应。因素的交互效应。w自定义模型自定义模型CustomCustom:主效应(:主效应(Main effectsMain effects及其因素变量)、交互及其因素变量)、交互变量(有交互效应维数之分)变量(有交互效应维数之分)w选择分解平方和的方法(默认为选择分解平方和的方法(默认为TYPE IIITYPE III)wInclude Intercept in modelInclude Intercept in model:系统默认截距包
24、括在回归模型中。:系统默认截距包括在回归模型中。n选择对照方法选择对照方法ContrastsContrastsn选择分布图形选择分布图形PlotsPlotsn选择多重比较分析选择多重比较分析Post HocPost Hocn保存运算结果的选择项保存运算结果的选择项SaveSaven选择输出项选择输出项OptionsOptions9.3.3 使用系统默认值进行随机区组设计资料的方差分析P168 比较不同种系、剂量的雌性大白鼠子宫重量,看比较不同种系、剂量的雌性大白鼠子宫重量,看不同种系、不同剂量对雌性大白鼠子宫重量是否有显著不同种系、不同剂量对雌性大白鼠子宫重量是否有显著性作用性作用data09
25、-03nAnalyze-General Linear Model-Univariate nDependent:wuterinFixed Factor(s):):mouse、etrogennModel选项选项:Custom(Main effect,mouse和和etrogen)n主效应方差分析检验结果主效应方差分析检验结果(截距,主效应,误差截距,主效应,误差Error)n结果中比较有用的值:结果中比较有用的值:Sig显著性概率值(各自主效应,截显著性概率值(各自主效应,截距距-线性回归关系)线性回归关系)n结论:不同种系、不同剂量对雌性大白鼠子宫重量均有有显结论:不同种系、不同剂量对雌性大白鼠
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 教学课件 教学 课件 方差分析
限制150内