《协方差分析》PPT课件.ppt
《《协方差分析》PPT课件.ppt》由会员分享,可在线阅读,更多相关《《协方差分析》PPT课件.ppt(84页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、第七章第七章 协方差分析协方差分析 第一节第一节 协方差分析的意义协方差分析的意义下一张下一张 主主 页页 退退 出出 上一张上一张 在科研中,实验效应除了受到处理因在科研中,实验效应除了受到处理因素的作用外,尚受到许多非处理因素的影素的作用外,尚受到许多非处理因素的影响。如在研究临床疗效时,疗效的好坏不响。如在研究临床疗效时,疗效的好坏不仅与治疗措施有关,还受病人的年龄、性仅与治疗措施有关,还受病人的年龄、性别、病情、心理、环境、社会等因素的影别、病情、心理、环境、社会等因素的影响。响。药物临床疗效研究药物临床疗效研究疗效疗效药物药物病情病情心心理理因因素素患者的状况(性别、年龄患者的状况(
2、性别、年龄其他因其他因素素混杂因混杂因素素举举 例例各组间的效应进行比较,必须保持组间的各组间的效应进行比较,必须保持组间的影响因素(混杂因素的比例)相同,组间影响因素(混杂因素的比例)相同,组间才具有可比性。才具有可比性。T+S1 e+s1 (实验组)(实验组)S2 s2 (对照组)(对照组)T e处理因素处理因素混杂因素混杂因素(在设计阶段控制混杂因素的方法)(在设计阶段控制混杂因素的方法)在混杂因素中,有些是在混杂因素中,有些是难以完全控制难以完全控制的,的,如如,天气变化,饲料的进食量;有些是天气变化,饲料的进食量;有些是可以控可以控制制的,如年龄,动物的初始体重。的,如年龄,动物的初
3、始体重。可以控制的混杂因素:可以控制的混杂因素:最好在设计阶段(也可在分析阶段)进行控制。难以控制的混杂因素:难以控制的混杂因素:在分析阶段进行控制。常见的实例常见的实例(1)比较不同施肥量对果树单株产量的影)比较不同施肥量对果树单株产量的影响,果树起始干周是混杂因素。响,果树起始干周是混杂因素。(2)比较两种药物治疗高血压的疗效,年)比较两种药物治疗高血压的疗效,年龄是一个混杂因素。龄是一个混杂因素。(3)研究不同饲料对动物增加体重的作用)研究不同饲料对动物增加体重的作用时,动物的初始体重、进食量等因素。时,动物的初始体重、进食量等因素。(4)在分析阶段控制混杂因素的方法:在分析阶段控制混杂
4、因素的方法:1、采用分层分析:如把年龄分组,再比较、采用分层分析:如把年龄分组,再比较同一年龄组的正常体重与超重组有无差别。同一年龄组的正常体重与超重组有无差别。(适用:(适用:计量、计数资料)计量、计数资料)2、协方差分析(适用:、协方差分析(适用:计量资料)计量资料)3、多因素分析(适用:、多因素分析(适用:计量、计数资料计量、计数资料)协方差分析协方差分析(analysis of covariance,ANCOVA)将线性回归与方差分析结合起来,检将线性回归与方差分析结合起来,检验两组或多组修正均数间有无差异的一种验两组或多组修正均数间有无差异的一种统计方法,用于消除混杂因素对分析指标统
5、计方法,用于消除混杂因素对分析指标的影响。的影响。协变量:协变量:在进行协方差分析时,混杂因素在进行协方差分析时,混杂因素统称为统称为协变量。协变量。协方差分析的基本思想:协方差分析的基本思想:在作两组或多组均数在作两组或多组均数 ,的假的假设检验前,用线性回归分析方法找出协变量设检验前,用线性回归分析方法找出协变量X X与各组与各组Y Y之间的数量关系,求得在假定之间的数量关系,求得在假定X X相相等时修定均数等时修定均数 ,然后用方差分析,然后用方差分析比较修正均数间的差别,这就是协方差分析比较修正均数间的差别,这就是协方差分析的基本思想。的基本思想。协方差分析的应用条件协方差分析的应用条
6、件要求各组资料都来自正态总体,且各组的方要求各组资料都来自正态总体,且各组的方差相等;(差相等;(t t检验或方差分析的条件)检验或方差分析的条件)各组的总体回归系数各组的总体回归系数ii相等,且都不等于相等,且都不等于0 0(回归方程检验)。(回归方程检验)。因此,应用协方差分析前,要对资料进行因此,应用协方差分析前,要对资料进行方差齐性检验方差齐性检验和和回归系数的假设检验(斜率同回归系数的假设检验(斜率同质性检验)质性检验),只有满足上述两个条件之后才能,只有满足上述两个条件之后才能应用,否则不宜使用。应用,否则不宜使用。协方差分析的应用条件协方差分析的应用条件 各比较组协变量各比较组协
7、变量X与分析指标与分析指标Y存在线性存在线性关系(按直线回归分析方法进行判断)。关系(按直线回归分析方法进行判断)。各比较组的总体回归系数各比较组的总体回归系数i相等,即各直相等,即各直线平行线平行(绘出回归直线,看是否平行绘出回归直线,看是否平行)。两条回归直线不平行两条回归直线不平行结论:结论:本资本资料不料不宜做宜做协方协方差分差分析析三条回归直线基本平行三条回归直线基本平行结论:结论:本资本资料可料可以做以做协方协方差分差分析析各回归系数不各回归系数不为零为零不满足条件时的处理方法不满足条件时的处理方法 X与与Y不满足线性关系时,通常情况下是不满足线性关系时,通常情况下是对对X或或Y或
8、两者作适当的变量变换,使之符合或两者作适当的变量变换,使之符合线性关系。线性关系。协方差分析适用的资料协方差分析适用的资料协方差分析可用于:协方差分析可用于:完全随机设计、随机区组设计、拉丁方设计、完全随机设计、随机区组设计、拉丁方设计、析因设计等资料;析因设计等资料;协变量协变量X X可以仅有一个,称一元协方差分析;可以仅有一个,称一元协方差分析;协变量协变量也可以有多个,称多元协方差分析。也可以有多个,称多元协方差分析。协方差分析有二个意义协方差分析有二个意义,一是对试验进行一是对试验进行统计控制,二是对协方差组分进行估计,现分述统计控制,二是对协方差组分进行估计,现分述如下。如下。一、对
9、试验进行统计控制一、对试验进行统计控制 为了提高试验的精确性和准确性为了提高试验的精确性和准确性 ,对处理,对处理以外的一切条件都需要采取有效措施严加控制,以外的一切条件都需要采取有效措施严加控制,使它们在各处理间尽量一致,这叫使它们在各处理间尽量一致,这叫试验控制试验控制。下一张下一张 主主 页页 退退 出出 上一张上一张 但在有些情况下,即使作出很大努力也难以但在有些情况下,即使作出很大努力也难以使试验控制达到预期目的。例如:使试验控制达到预期目的。例如:研究几种配合饲料对猪的增重效果,希望试研究几种配合饲料对猪的增重效果,希望试验仔猪的初始重相同,因为仔猪的初始重不同,验仔猪的初始重相同
10、,因为仔猪的初始重不同,将影响到猪的增重。经研究发现:增重与初始重将影响到猪的增重。经研究发现:增重与初始重之间存在线性回归关系。但是,在实际试验中很之间存在线性回归关系。但是,在实际试验中很难满足试验仔猪初始重相同这一要求。难满足试验仔猪初始重相同这一要求。下一张下一张 主主 页页 退退 出出 上一张上一张 n n这时可利用仔猪的初始重这时可利用仔猪的初始重(记为记为x)与其增重与其增重(记为记为y)的回归关系,的回归关系,将将仔猪增重都矫正仔猪增重都矫正为初始重相同时的增重为初始重相同时的增重,于是初始重不同,于是初始重不同对仔猪增重的影响就消除了。由于矫正后对仔猪增重的影响就消除了。由于
11、矫正后的增重是应用统计方法将初始重控制一致的增重是应用统计方法将初始重控制一致而得到的,故叫而得到的,故叫统计控制统计控制。统计控制是试。统计控制是试验控制的一种辅助手段。经过这种矫正,验控制的一种辅助手段。经过这种矫正,试验误差将减小,对试验处理效应估计更试验误差将减小,对试验处理效应估计更为准确。为准确。若若 y 的变异主要由的变异主要由x的不同造成的不同造成(处理没有显处理没有显著效应著效应),则各矫正后的,则各矫正后的 间将没有显著差异间将没有显著差异(但但原原y间的差异可能是显著的间的差异可能是显著的)。若若 y的变异除掉的变异除掉x不同的影响外,不同的影响外,尚存在不尚存在不同处理
12、的显著效应同处理的显著效应,则可期望各,则可期望各 间将有显著差间将有显著差异异(但原但原y间差异可能是不显著的间差异可能是不显著的)。此外,矫正。此外,矫正后的后的 和原和原y的大小次序也常不一致。的大小次序也常不一致。n n所以,所以,处理平均数的处理平均数的回归矫正回归矫正和和矫正平均矫正平均数数的显著性检验,能够提高试验的准确性的显著性检验,能够提高试验的准确性和精确性,从而更真实地反映试验实际。和精确性,从而更真实地反映试验实际。这种这种将回归分析与方差分析结合在一起,将回归分析与方差分析结合在一起,对试验数据进行分析的方法,叫做对试验数据进行分析的方法,叫做协方差协方差分析分析(a
13、nalysis of covariance)。二、估计协方差组分二、估计协方差组分 在第六章曾介绍过表示两个相关变量线性相在第六章曾介绍过表示两个相关变量线性相关性质与程度的相关系数的计算公式:关性质与程度的相关系数的计算公式:若将公式右端的分子分母同除以自由度若将公式右端的分子分母同除以自由度(n-1),得,得 (10-1)下一张下一张 主主 页页 退退 出出 上一张上一张 其中其中 是是x的均方的均方MSx,它是,它是x的的 方差方差 的无偏估计量;的无偏估计量;是是y的均方的均方MSy,它是,它是y的的 方差方差 的无偏估计量;的无偏估计量;称为称为x与与y的平均的离均差的平均的离均差的
14、乘积和,简称均积,记为的乘积和,简称均积,记为MPxy,即,即(10-2)与与 均均 积积 相相 应应 的的 总总 体参体参 数数 叫叫 协协 方方 差差(covariance),记为),记为COV(x,y)或或 。统。统计学证明了,均积计学证明了,均积MPxy是总体协方差是总体协方差COV(x,y)的无偏估计量,即的无偏估计量,即 EMPxy=COV(x,y)。于是,样本相关系数于是,样本相关系数r可用均方可用均方MSx、MSy,均积均积MPxy表示为:表示为:(10-3)下一张下一张 主主 页页 退退 出出 上一张上一张 相应的总体相关系数相应的总体相关系数可用可用x与与y的总体标的总体标
15、准差准差 、,总体协方差,总体协方差COV(x,y)或或 表表示如下:示如下:(10-4)均积与均方具有相似的形式均积与均方具有相似的形式,也有相似的也有相似的性质。在方差分析中,一个变量的总平方和与自性质。在方差分析中,一个变量的总平方和与自由度可按变异来源进行剖分,从而求得相应的均由度可按变异来源进行剖分,从而求得相应的均方。统计学已证明:两个变量的总乘积和与自由方。统计学已证明:两个变量的总乘积和与自由度也可按变异来源进行剖分而获得相应的均积。度也可按变异来源进行剖分而获得相应的均积。这种这种把两个变量的总乘积和与自由度按变异来源把两个变量的总乘积和与自由度按变异来源进行剖分并获得获得相
16、应均积的方法亦称为协方进行剖分并获得获得相应均积的方法亦称为协方差分析。差分析。下一张下一张 主主 页页 退退 出出 上一张上一张 p协方差分析是将协方差分析是将线性回归线性回归与与方差分析方差分析相结合相结合 的一种分析方法。的一种分析方法。p把对把对反应变量反应变量Y有影响的因素有影响的因素X看作协变量看作协变量,建立建立Y对对X的线性回归,的线性回归,利用回归关系把利用回归关系把X值值 化为相等,再进行各组化为相等,再进行各组Y的修正均数间比较的修正均数间比较。p修正均数修正均数是假设各协变量取值固定在其总是假设各协变量取值固定在其总 均数时的反应变量均数时的反应变量Y的均数。的均数。p
17、其实质是从其实质是从Y的总离均差平方和的总离均差平方和 中中 扣除协变量扣除协变量X对对Y的回归平方和的回归平方和 ,对离回归平方和对离回归平方和 作进一步分解后再进作进一步分解后再进行方差分析。行方差分析。第第i组第组第j个观个观测值测值随机误差随机误差第第i组的组效组的组效应应一般均值一般均值方差分析的前提是除随机误差外,水平变量是影响观测值的唯一变量方差分析的前提是除随机误差外,水平变量是影响观测值的唯一变量n n首先首先,我们看看方差分析数据结构:我们看看方差分析数据结构:观测值观测值观测值观测值=一般均值一般均值一般均值一般均值+水平影响水平影响水平影响水平影响+协变量影响协变量影响
18、协变量影响协变量影响+随机误差随机误差随机误差随机误差回归回归回归回归系数系数系数系数协变量效协变量效应应可见可见,协方差分析将方差分析与回归分析结合了起来协方差分析将方差分析与回归分析结合了起来.方差分析方差分析回归分析回归分析n n下面我们再看协方差分析数据结构(单因下面我们再看协方差分析数据结构(单因素完全随机设计试验资料的协方差分析):素完全随机设计试验资料的协方差分析):第二节第二节 单因素试验资料的协方差分析单因素试验资料的协方差分析 设有设有k个处理、个处理、n次重复的双变量试验资料,次重复的双变量试验资料,每处理组内皆有每处理组内皆有n对观测值对观测值x、y,则该资料为,则该资
19、料为具具kn对对x、y观测值的单向分组资料,其数据观测值的单向分组资料,其数据一般模式如表一般模式如表101所示。所示。下一张下一张 主主 页页 退退 出出 上一张上一张 表表101 kn对观测值对观测值x、y的单向分组资料的的单向分组资料的 一般形式一般形式 表表表表101101的的的的x x和和和和y y变量的自由度和平方和的剖分参变量的自由度和平方和的剖分参变量的自由度和平方和的剖分参变量的自由度和平方和的剖分参见单因素试验资料的方差分析方法一节。其乘积和的剖见单因素试验资料的方差分析方法一节。其乘积和的剖见单因素试验资料的方差分析方法一节。其乘积和的剖见单因素试验资料的方差分析方法一节
20、。其乘积和的剖分则为:分则为:分则为:分则为:总变异的乘积和总变异的乘积和总变异的乘积和总变异的乘积和SPSPT T是是是是x xjiji与与与与 和和和和y yjiji与与与与 的离均的离均的离均的离均差乘积之和,即:差乘积之和,即:差乘积之和,即:差乘积之和,即:(10-5)(10-5)=knkn-1 -1 下一张下一张 主主 页页 退退 出出 上一张上一张 其中,其中,处理间的乘积和处理间的乘积和SPt是是 与与 和和 与与 的的离均差乘积之和乘以离均差乘积之和乘以n,即:,即:(10-6)处理内的乘积和处理内的乘积和SPe是是 与与 和和 与与 的的离均差乘积之和,即:离均差乘积之和,
21、即:(10-7)=k(n-1)以上是各处理重复数以上是各处理重复数n相等时的计算公式,相等时的计算公式,若各处理重复数若各处理重复数n不相等,分别为不相等,分别为n1、n2、nk,其和为,其和为 ,则各项乘积和与自由度的计,则各项乘积和与自由度的计算公式为:算公式为:(10-8)下一张下一张 主主 页页 退退 出出 上一张上一张 =SPT-SPt =-k=dfT-dft (10-9)有了上述有了上述SP和和df,再加上,再加上x和和y的相应的相应SS,就可进行协方差分析。,就可进行协方差分析。【例【例10.1】为了寻找一种较好的哺乳仔猪为了寻找一种较好的哺乳仔猪食欲增进剂,以增进食欲,提高断奶
22、重,对哺乳食欲增进剂,以增进食欲,提高断奶重,对哺乳仔猪做了以下试验:仔猪做了以下试验:试验设对照、配方试验设对照、配方1、配方、配方2、配方、配方3共四个处理,重复共四个处理,重复12 次,选择初始次,选择初始条件尽量相近的长白种母猪的哺乳仔猪条件尽量相近的长白种母猪的哺乳仔猪48头头,完全随机分为完全随机分为4组进行试验,结果见表组进行试验,结果见表102,试作分析。试作分析。下一张下一张 主主 页页 退退 出出 上一张上一张 表表102 不同食欲增进剂仔猪生长情况表不同食欲增进剂仔猪生长情况表 (单位:(单位:(单位:(单位:kgkg)下一张下一张 主主 页页 退退 出出 上一张上一张
23、此例,此例,此例,此例,=18.25+15.40+15.65+13.85=63.15 =18.25+15.40+15.65+13.85=63.15 =141.80+130.10+144.80+133.80 =141.80+130.10+144.80+133.80 =550.50 =550.50 k k=4=4,n=n=1212,knkn=412=48=412=48 协方差分析的计算步骤如下:协方差分析的计算步骤如下:(一一)求求x变量的各项平方和与自由度变量的各项平方和与自由度 1、总平方和与自由度、总平方和与自由度 dfT(x)=kn-1=412-1=47 2、处理间平方和与自由度、处理间平
24、方和与自由度 =k k-1=4-1=3-1=4-1=3 3、处理内平方和与自由度、处理内平方和与自由度 (二二)求求y变量各项平方和与自由度变量各项平方和与自由度 1、总平方和与自由度、总平方和与自由度下一张下一张 主主 页页 退退 出出 上一张上一张 2、处理间平方和与自由度、处理间平方和与自由度 3、处理内平方和与自由度、处理内平方和与自由度(三三)求求x和和y两变量的各项离均差乘积和与自由度两变量的各项离均差乘积和与自由度 1、总乘积和与自由度、总乘积和与自由度 =kn-1=412-1=47 2、处理间乘积和与自由度、处理间乘积和与自由度 =1.64下一张下一张 主主 页页 退退 出出
25、上一张上一张 =k-1=4-1=3 3、处理内乘积和与自由度、处理内乘积和与自由度 平方和、乘积和与自由度的计算结果列于表平方和、乘积和与自由度的计算结果列于表103。表表103 x与与y的平方和与乘积和表的平方和与乘积和表 (四四)对对x和和y各作方差分析各作方差分析(表表104)表表104 初生重与初生重与50日龄重的方差分析表日龄重的方差分析表下一张下一张 主主 页页 退退 出出 上一张上一张 分析结果表明,分析结果表明,4种处理的供试仔猪平均初种处理的供试仔猪平均初生重间存在着极显著的差异,其生重间存在着极显著的差异,其50 日龄平均重日龄平均重差异不显著。须进行协方差分析,以消除初生
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 协方差分析 PPT 课件
限制150内