(精品)第5章方差分析.ppt
《(精品)第5章方差分析.ppt》由会员分享,可在线阅读,更多相关《(精品)第5章方差分析.ppt(72页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、统计学统计学主编:费宇,石磊主编:费宇,石磊第五章第五章 方差分析方差分析2023/4/10统计学第5章方差分析5-3 方差分析是统计检验的一方差分析是统计检验的一种。由英国著名统计学家:种。由英国著名统计学家:R.A.FISHER推导出来的,推导出来的,也叫也叫F F 检验。检验。用于分析试用于分析试验数据中各个因素对试验验数据中各个因素对试验指标值影响显著程度的一指标值影响显著程度的一种统计方法。种统计方法。2023/4/10统计学第5章方差分析5-4主要内容主要内容F1.1 1.1 方差分析的思想及基本概念方差分析的思想及基本概念F1.2 1.2 单因素方差分析单因素方差分析F1.3 1
2、.3 双因素方差分析双因素方差分析2023/4/10统计学第5章方差分析5-55.1 5.1 方差分析的方差分析的思想及思想及基本概念基本概念 方差分析方差分析(analysis of variance,analysis of variance,简记为简记为ANOVAANOVA)的主要思想是将影响指)的主要思想是将影响指标值的一个或几个因素取不同的水平,标值的一个或几个因素取不同的水平,然后建立相应的方差分析模型,由此给然后建立相应的方差分析模型,由此给出检验因素的不同水平对指标值是否有出检验因素的不同水平对指标值是否有显著影响的统计分析过程。显著影响的统计分析过程。2023/4/10统计学第
3、5章方差分析5-6方差分析的基本概念方差分析的基本概念 因变量因变量(dependent variable):也称为响应变量:也称为响应变量(response variable)或指标值,它是指在我们在研或指标值,它是指在我们在研究问题中最感兴趣的测量指标。究问题中最感兴趣的测量指标。因素因素(factor):也称为自变量,是指那些可能对:也称为自变量,是指那些可能对指标值产生影响的变量指标值产生影响的变量。水平水平(level):因素的不同取值也称为因素的不同取值也称为“处理处理”(treatment)。2023/4/10统计学第5章方差分析5-75.2 5.2 单因素方差分析单因素方差分析
4、5.2.1 5.2.1 单因素方差分析的数据结构单因素方差分析的数据结构 在单因素方差分析中,记因素为在单因素方差分析中,记因素为 ,其有其有个水平,指标值在因素个水平,指标值在因素 的第的第 水平上等重复水平上等重复的取的取 个数值,个数值,第第个重复观测值为个重复观测值为 ,则数据结构可写为:,则数据结构可写为:2023/4/10统计学第5章方差分析5-8表表5.1 5.1 单因素方差分析数据单因素方差分析数据2023/4/10统计学第5章方差分析5-95.2.2 5.2.2 单因素方差分析的统计模型单因素方差分析的统计模型 在表在表5.1中,假中,假设设不同水平上不同水平上观测观测数据相
5、互独立,数据相互独立,同一水平中,同一水平中,n个重复个重复观测观测数据也相互独立,数据也相互独立,具有具有常数方差常数方差。描述方差分析的。描述方差分析的统计统计模型模型为为:其中,其中,表示因素表示因素表示随机表示随机误误差。且差。且 第第表示表示观测观测指指标值标值的的总总平均,平均,水平上的主效水平上的主效应应,满满足足约约束条件束条件 。(5.1),2023/4/10统计学第5章方差分析5-10 利用最小二乘估计理论,可以得到模型利用最小二乘估计理论,可以得到模型(5.1)参数的估计如下:参数的估计如下:其中其中为为数据的数据的总总平均,平均,为为数据表中的行平均。数据表中的行平均。
6、2023/4/10统计学第5章方差分析5-115.2.3 5.2.3 单因素方差分析检验过程和单因素方差分析检验过程和 方差分析表方差分析表 因素因素对试验结对试验结果果的影响,可以表述的影响,可以表述为为 (5.2)对对如下假如下假设问题设问题的检验,该假设的检验可以通过平方和分解得到。的检验,该假设的检验可以通过平方和分解得到。2023/4/10统计学第5章方差分析5-12总平方和的分解组间平组间平方和方和总平方和总平方和组内平组内平方和方和2023/4/10统计学第5章方差分析5-13 总平方和总平方和:所有测量值之间总的变异所有测量值之间总的变异程度,程度,计算公式计算公式自由度自由度
7、2023/4/10统计学第5章方差分析5-14 组组间间平平方方和和:各各组组均均数数与与总总均均数数的的差差值值的平方和,的平方和,计算公式为计算公式为自由度自由度2023/4/10统计学第5章方差分析5-15 组组内内平平方方和和:用用各各组组内内各各测测量量值值Y Yijij与与其其所所在在组组的的均均数数差差值值的的平平方方和和来来表表示示,反反映映随随机机误差误差的影响。的影响。计算公式为计算公式为自由度自由度2023/4/10统计学第5章方差分析5-16三种三种“平方和平方和”之间的关之间的关系系平方和平方和分解分解:2023/4/10统计学第5章方差分析5-17 由于上述几种平方
8、和的数值受到样本量和水由于上述几种平方和的数值受到样本量和水平数的影响,一种更为科学的方法是将各部分平数的影响,一种更为科学的方法是将各部分平方和除以相应自由度,其比值称为平方和除以相应自由度,其比值称为均方和均方和,简称简称均方均方(mean square,MS),即,即 上式中分母的数值为对应平方和的自由度上式中分母的数值为对应平方和的自由度。2023/4/10统计学第5章方差分析5-18 ,则则拒拒绝绝零假零假设设,即,即认为认为因素因素对对指指标值标值(或(或试验结试验结果)有果)有显显著影响,否著影响,否则认则认统计统计量的数量的数值值大于大于对给对给定置信水平定置信水平 ,没有没有
9、显显著影响。著影响。为因素为因素为了检验为了检验 ,定义,定义F统计量统计量2023/4/10统计学第5章方差分析5-19 接受域 拒绝域2023/4/10统计学第5章方差分析5-20 将上述主要结果总结成一个表格,称为方差分将上述主要结果总结成一个表格,称为方差分析表,可以直观反映方差分析的计算及检验过程。析表,可以直观反映方差分析的计算及检验过程。表表5.2 5.2 单因素方差分析表单因素方差分析表2023/4/10统计学第5章方差分析5-21 【例例5.1】(方差分析,数据文件(方差分析,数据文件example 5.0)在在0.05的置信水平下,研究例的置信水平下,研究例5.0表的试表的
10、试验中咖啡因用量是否对人体神经功能有显著验中咖啡因用量是否对人体神经功能有显著影响,并说明在那些水平上他们有显著差异影响,并说明在那些水平上他们有显著差异?2023/4/10统计学第5章方差分析5-22 解解:用:用SPSS打开数据文件,打开数据文件,选择选择AnalyzeCompare meansOne-way ANOVA,将因,将因变变量量选选入到入到Dependent list中,将因素中,将因素A选选入到入到Factor中,中,点点击进击进入入Option对话对话框,框,在在Statistics下下选择选择Homogeneity of variance test,最后点,最后点击击Co
11、ntinueOk,输输出表出表5.3和表和表5.4两个表格。两个表格。2023/4/10统计学第5章方差分析5-23表表5.3 5.3 咖啡因用量实验的方差一咖啡因用量实验的方差一致性检验致性检验表表5.4 5.4 咖啡因用量实验的方差分析表咖啡因用量实验的方差分析表输出结果输出结果2023/4/10统计学第5章方差分析5-24 表表5.35.3给出了对样本方差齐性的检验,检验的给出了对样本方差齐性的检验,检验的p p-值值(即表中的即表中的Sig.)为为0.749大于置信水平大于置信水平0.05,因,因此不能拒绝方差齐性的假设,即认为各水平样本此不能拒绝方差齐性的假设,即认为各水平样本方式是
12、常数,满足我们的假设。表方式是常数,满足我们的假设。表5.4给出了单因给出了单因素方差分析表,素方差分析表,说明咖啡因服用量对人体神经功说明咖啡因服用量对人体神经功能有显著影响。能有显著影响。2023/4/10统计学第5章方差分析5-255.2.4 5.2.4 多重比较多重比较 1、多个总体的差异性检验多个总体的差异性检验 事实上表事实上表5.15.1中不同水平的观测可以看成是中不同水平的观测可以看成是来自不同总体的观测数据。假设第来自不同总体的观测数据。假设第 个总体有个总体有 个样本个样本(对应于表对应于表5.15.1中的第中的第 个水平的次重复个水平的次重复观测观测),他他们为们为来自第
13、来自第 个个总总体体的独立的独立样样本本。2023/4/10统计学第5章方差分析5-26多个总体是否存在差异的假设问题可以多个总体是否存在差异的假设问题可以 表述为:表述为:,而该检验,而该检验当当统计统计量的数量的数值值大于大于 一节的方差分析法,一节的方差分析法,与(与(5.25.2)中的假设是等价的。)中的假设是等价的。因此,利用上因此,利用上其其临临界界值值 时,我们认为时,我们认为 个总个总体存在显著差异。体存在显著差异。2023/4/10统计学第5章方差分析5-272、多重比较多重比较不拒绝不拒绝H0,表示拒绝总体均值相等的证据不足,表示拒绝总体均值相等的证据不足 分析终止。分析终
14、止。拒绝拒绝H0,接受,接受H1,表示总体均值不全相等表示总体均值不全相等 哪两两均数之间相等?哪两两均数之间相等?哪两两均数之间不等?哪两两均数之间不等?需要进一步作多重比较。需要进一步作多重比较。2023/4/10统计学第5章方差分析5-28 一种使用比较多的是所有成对假设,形成一种使用比较多的是所有成对假设,形成如下的假设问题:如下的假设问题:注意到注意到与与是等价的。因此是等价的。因此 该该假假设设中共有中共有个不同的成个不同的成对对比比较较。(5.75.7)2023/4/10统计学第5章方差分析5-29 多重比较的特点是它同时对多个成对假设进多重比较的特点是它同时对多个成对假设进行比
15、较。多种比较的思想有两种,一是寻找每一行比较。多种比较的思想有两种,一是寻找每一个成对假设的检验统计量,给出检验临界值,通个成对假设的检验统计量,给出检验临界值,通过比较界定显著程度;二是使用同时置信区间过比较界定显著程度;二是使用同时置信区间(simultaneous confidence interval)(simultaneous confidence interval)的概念。的概念。多重比较有许多种方法,使用比较多的包括多重比较有许多种方法,使用比较多的包括FisherFisher的的LSDLSD方法,方法,TurkeyTurkey方法,方法,BonferroniBonferroni
16、方法方法等。我们下面通过实例来说明在等。我们下面通过实例来说明在SPSSSPSS下如何进行下如何进行多重比较。多重比较。2023/4/10统计学第5章方差分析5-30 【例例5.25.2】(多重比较(多重比较,数据文数据文example example 5.05.0)在)在0.050.05的置信水平下,例的置信水平下,例5.05.0的试验的试验中咖啡因用量在那些水平上有显著差异?中咖啡因用量在那些水平上有显著差异?2023/4/10统计学第5章方差分析5-31 解解:用:用SPSS打开数据文件,打开数据文件,选择选择Analyze表表5.5的结果。的结果。选选入到入到Dependent lis
17、t中,将因素中,将因素A选选入到入到Factor中,中,点点击进击进入入Post Hoc,进入后在,进入后在Equal Variance Assumed(假设方差齐性)下选定(假设方差齐性)下选定Turkey,LSD和和Bonferroni选项,点击选项,点击Continue Ok,可以得到可以得到 Compare meansOne-way ANOVA,将因,将因变变量量2023/4/10统计学第5章方差分析5-32表表5.5 5.5 咖啡因用量实验的多重比输出结果咖啡因用量实验的多重比输出结果2023/4/10统计学第5章方差分析5-33 这里我们选用三种方法,输出结果给出了基于这这里我们选
18、用三种方法,输出结果给出了基于这三种方法下的多重比较结果,包括研究统计量及其三种方法下的多重比较结果,包括研究统计量及其p p-值和值和95%95%的同时置信区间。三种方法的结果是一致的同时置信区间。三种方法的结果是一致的。从检验统计量的的。从检验统计量的p p-值可以看出咖啡因剂量在值可以看出咖啡因剂量在0mg水平与水平与200mg水平上有显著差异(水平上有显著差异(p p-值值0.050.05),但),但在在0mg水平与水平与100mg水平和水平和100mg水平与水平与200mg水平水平之间没有显著差异。从同时置信区间也可以发现,成之间没有显著差异。从同时置信区间也可以发现,成对比较差异显
19、著时,其对应的同时置信区间不包含对比较差异显著时,其对应的同时置信区间不包含0 0。此外此外0mg-200mg与与200mg-0mg的比较的检验结果是一的比较的检验结果是一致的,但其同时置信区间的上下限要互换。致的,但其同时置信区间的上下限要互换。2023/4/10统计学第5章方差分析5-345.3 双因素方差分析双因素方差分析5.3.1 5.3.1 双因素方差分析的数据结构双因素方差分析的数据结构 假假设设除了除了5.2节节介介绍绍的因素的因素之外,之外,还还有一有一可能可能对对指指标产标产生影响。假生影响。假设设因素因素有有个水平,个水平,这样这样因素因素就有就有组组合。假合。假设设在每一
20、个水平在每一个水平组组合上合上进进行相等重复行相等重复数的数的观测观测,称之,称之为为等重复等重复试验试验,本,本节节主要研究主要研究等重复等重复试验试验数据的双因素方差分析。双因素方数据的双因素方差分析。双因素方差分析模型的数据差分析模型的数据结结构如下:构如下:个因素个因素和和个水平个水平2023/4/10统计学第5章方差分析5-35表表5.6 5.6 双因素方差分析数据双因素方差分析数据2023/4/10统计学第5章方差分析5-36其中其中表示在因素表示在因素的第的第个水平和因素个水平和因素的第的第个水平上个水平上进进行的第行的第次重复次重复观测结观测结果。果。5.3.2 5.3.2 有
21、可加效应的双因素方差分析有可加效应的双因素方差分析 1.1.模型结构模型结构 假设不同水平上观测数据相互独立,同一假设不同水平上观测数据相互独立,同一水平中,水平中,n个重复观测数据也相互独立,个重复观测数据也相互独立,具有具有 2023/4/10统计学第5章方差分析5-37常数方差常数方差 效应的情况,此时双因素方差分析模型表述为效应的情况,此时双因素方差分析模型表述为:。先考虑可加效应模型,即没有交互。先考虑可加效应模型,即没有交互(5.8)其中,其中,表示表示观观 测测指指标值标值的的总总平均,平均,表示因素表示因素第第水平上水平上的主效的主效应应,表示因素表示因素第第水平上的主效水平上
22、的主效应应,表示随机误差。表示随机误差。且且 ,。2023/4/10统计学第5章方差分析5-38 利用最小二乘估计理论,可以得到模型利用最小二乘估计理论,可以得到模型(5.8)中参数的估计如下:中参数的估计如下:其中其中2023/4/10统计学第5章方差分析5-392.2.方差分解方差分解 对对双因素方差模型,将涉及两个因素主效双因素方差模型,将涉及两个因素主效应应的的检验检验。因素。因素的的显显著性假著性假设为设为:而而对对因素因素,显显著性假著性假设为设为2023/4/10统计学第5章方差分析5-40仿单因素方差分析的方法,考察总平方和仿单因素方差分析的方法,考察总平方和可分解为:可分解为
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 精品 方差分析
限制150内