多个样本均数比较的方差分析讲稿.ppt
《多个样本均数比较的方差分析讲稿.ppt》由会员分享,可在线阅读,更多相关《多个样本均数比较的方差分析讲稿.ppt(117页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、关于多个样本均数比较的方差分析1第一页,讲稿共一百一十七页哦2方差分析方差分析方差分析方差分析的基本思想的基本思想完全随机设计的单因素完全随机设计的单因素 随机区组设计的两因素随机区组设计的两因素方差分析方差分析交叉设计的方差分析交叉设计的方差分析多个样本均数间的多重比较多个样本均数间的多重比较第二页,讲稿共一百一十七页哦3第一节第一节 方差分析的方差分析的基本思想基本思想用途:用途:检验检验3组及以上组及以上总体均数是否相等。总体均数是否相等。通过分析处理组均通过分析处理组均数之间的差别,推数之间的差别,推论它们所代表的论它们所代表的k个个总体均数间是否存在总体均数间是否存在差别,或差别,或
2、k个处理组间个处理组间的差别是否具有统计学的差别是否具有统计学意义。意义。第三页,讲稿共一百一十七页哦4总变异总变异 =组间变异组间变异 +组内变异组内变异表 糖尿病患者、IGT异常及正常人的载脂蛋白测定结果糖尿病IGT正常人85.7096.00144.00105.20124.50117.00111.0099.00159.00106.50120.00115.00均数105.45(11)102.39(9)122.80(10)X=110.3X=110.3第四页,讲稿共一百一十七页哦5全部实验结果存在三种不同的变异全部实验结果存在三种不同的变异总变异总变异:全部实验数据大小不等。变异的:全部实验数据
3、大小不等。变异的大小用观察值与总均数的离均差平方和表大小用观察值与总均数的离均差平方和表示,记为示,记为SS总总组间变异:组间变异:各处理组的样本均数也大小不等,各处理组的样本均数也大小不等,变异的大小用各组均数与总体均数的离均差平变异的大小用各组均数与总体均数的离均差平方和表示,记为方和表示,记为SS组间组间。组内变异:组内变异:各处理组内部观察值也大小不等,可各处理组内部观察值也大小不等,可用各处理组内部每个观察值与组均数的离均差平方用各处理组内部每个观察值与组均数的离均差平方和表示。记为和表示。记为SSSS组内组内。第五页,讲稿共一百一十七页哦6总变异总变异=组间变异组间变异+组内变异组
4、内变异总变异:总变异:组间变异:组间变异:组内变异组内变异:总总=N-1 组间组间=k-1 组内组内=N-k第六页,讲稿共一百一十七页哦7F=MS组间组间 /MS组内组内如果:如果:各样本均数来自同一总体(各样本均数来自同一总体(0:m m1 1=m m2 2 =m mk k),即各组均数之间无差别。),即各组均数之间无差别。则:则:组间变异与组内变异均只能反映随机误组间变异与组内变异均只能反映随机误差,差,此时:此时:F 值应接近值应接近1。反之,若各样本均数不是来自同一总体,组反之,若各样本均数不是来自同一总体,组间变异应较大,间变异应较大,F 值将明显大于值将明显大于1,则不能,则不能认
5、为组间的变异仅反映随机误差,也就是认认为组间的变异仅反映随机误差,也就是认为处理因素有作用。为处理因素有作用。第七页,讲稿共一百一十七页哦8F值要到多大才有统计学意义呢?在各样本来自正态总体,各样本所来自在各样本来自正态总体,各样本所来自的总体方差相等的假定之下,当的总体方差相等的假定之下,当H0成立成立时,检验统计量时,检验统计量F 服从自由度服从自由度 组间组间=k-1,组内组内=N-k的的F 分布,表示为分布,表示为:F F(组间组间,组内组内)可由可由F界值表查出在某一界值表查出在某一 水准下水准下F分布分布的单尾界值的单尾界值F 。当。当F 。F F第八页,讲稿共一百一十七页哦9方差
6、分析的基本思想方差分析的基本思想根据资料的设计类型,将全部观察值总的离均差平根据资料的设计类型,将全部观察值总的离均差平方和及自由度分解为两个或多个部分,方和及自由度分解为两个或多个部分,除随机误差(如除随机误差(如SS组内组内)外,其余每个部分的变)外,其余每个部分的变异(如异(如SS组间组间)可由某个因素的作用(或某几个因素)可由某个因素的作用(或某几个因素的交互作用,如的交互作用,如A因素因素B因素)加以解释。因素)加以解释。通过比较不同变异来源的均方,借助通过比较不同变异来源的均方,借助F分布作出统计分布作出统计推断,从而了解该因素对观测指标有无影响。推断,从而了解该因素对观测指标有无
7、影响。第九页,讲稿共一百一十七页哦10方差分析对数据的基本假设方差分析对数据的基本假设(方差分析的应用条件)(方差分析的应用条件)任何两个观察值之间均不相关任何两个观察值之间均不相关每一水平下的观察值均来自正态总体每一水平下的观察值均来自正态总体各总体方差相等,即方差齐性各总体方差相等,即方差齐性(homogeneity of variance)第十页,讲稿共一百一十七页哦11第二节第二节 完全随机设计资料的完全随机设计资料的单因素方差分析单因素方差分析在实验研究中,将受试对象随机分配到一个在实验研究中,将受试对象随机分配到一个研究因素的多个水平中去,然后观察实验效研究因素的多个水平中去,然后
8、观察实验效应。应。在观察研究中,按某个因素的不同水平分组,在观察研究中,按某个因素的不同水平分组,比较该因素的效应。如比较糖尿病患者,比较该因素的效应。如比较糖尿病患者,IGTIGT异常和正常人的载脂蛋白有无差别(人群这异常和正常人的载脂蛋白有无差别(人群这个研究因素分为个研究因素分为3 3个水平)。个水平)。如将如将3030名乙型脑炎患者随机分为三组,分别用单克隆抗体、胸名乙型脑炎患者随机分为三组,分别用单克隆抗体、胸腺肽和利巴韦林三种药物治疗(药物这个研究因素分为腺肽和利巴韦林三种药物治疗(药物这个研究因素分为3 3个水个水平),观察治疗后的退热时间。平),观察治疗后的退热时间。第十一页,
9、讲稿共一百一十七页哦12一、完全随机设计一、完全随机设计如何随机分组?如何随机分组?如欲将如欲将24只小白鼠随机分只小白鼠随机分为为3组。组。方法如下:方法如下:首先,将小白鼠首先,将小白鼠124编号编号利用随机数字表(附表利用随机数字表(附表15,p832)依次读取两位数作为一个随机数字录于编号依次读取两位数作为一个随机数字录于编号下,下,将全部随机数从小到大编序号将全部随机数从小到大编序号规定序号:规定序号:18 甲组;甲组;916 乙组;乙组;1724为丙组为丙组第十二页,讲稿共一百一十七页哦13二、变异分解二、变异分解 :例:例:某社区随机抽取了某社区随机抽取了3030名糖尿病患者名糖
10、尿病患者(1111例),例),IGTIGT异常(异常(9 9例)和正常人(例)和正常人(1010例)进行载脂蛋白(例)进行载脂蛋白(mg/dLmg/dL)测定,问三)测定,问三种人的载脂蛋白有无差别?种人的载脂蛋白有无差别?第十三页,讲稿共一百一十七页哦141.1.完全随机设计方差分析中变异的分解完全随机设计方差分析中变异的分解 总变异总变异 =组间变异组间变异 +组内变异组内变异表 糖尿病患者、IGT异常及正常人的载脂蛋白测定结果糖尿病IGT正常人85.7096.00144.00105.20124.50117.00111.0099.00159.00106.50120.00115.00均数10
11、5.45(11)102.39(9)122.80(10)X=110.3X=110.3第十四页,讲稿共一百一十七页哦152.分析计算步骤分析计算步骤建立检验假设和确定检验水准建立检验假设和确定检验水准H0:三种人载脂蛋白的总体均数相等,即三种人载脂蛋白的总体均数相等,即 m m1 1=m m2 2=m m3 3H1:三种人载脂蛋白的总体均数不全相等三种人载脂蛋白的总体均数不全相等=0.05计算检验统计量计算检验统计量F值值第十五页,讲稿共一百一十七页哦16表 糖尿病患者、IGT异常及正常人的载脂蛋白测定结果糖尿病IGT正常人85.7096.00144.00105.20124.50117.00111
12、.0099.00159.00106.50120.00115.00Xij 116011105.45123509.5912.59102.3996045.41228 3309.510 30122.80 110.3153420 372974.9niX Xij2第十六页,讲稿共一百一十七页哦17表 糖尿病患者、IGT异常及正常人的载脂蛋白测定结果糖尿病IGT正常人Xij 116011105.45123509.5912.59102.3996045.41228 3309.510 30122.80 110.3153420 372974.9niX Xij2 C=3309.52/30=365093 (校正数)(校
13、正数)SS总=372974.87-365093=7881.87 SS组间=11602/11+921.52/9+12282/10-365093 =2384.03SS组内=SS总-SS组间=7881.87-2384.03=5497.84第十七页,讲稿共一百一十七页哦18表表 完全随机设计资料的方差分析表完全随机设计资料的方差分析表第十八页,讲稿共一百一十七页哦19确定确定P P值和作出推断结论值和作出推断结论查附表查附表3 F3 F界值表(界值表(P806P806),1 1=2,2,2 2=27 27F F0.05(2,27)0.05(2,27)=3.35,F=3.35,F0.01(2,27)0.
14、01(2,27)=5.49=5.49本例本例F=5.85 FF=5.85 F0.01(2,27)0.01(2,27),故故P0.01P0.01。可认为三种人的载脂蛋白不同。可认为三种人的载脂蛋白不同。方差分析计算表变异来源SSMSFP组间2384.0321192.015.850.05区组间2376.387339.48 13.96 0.05P0.05。尚不能认为三。尚不能认为三种营养素喂养的小白鼠体重增量有差别。种营养素喂养的小白鼠体重增量有差别。F F0.010.01(7 7,1414)=4.28=4.28,P0.01P0.01。可认为。可认为8 8个区个区组的小白鼠体重增量有差别,即遗传因素
15、组的小白鼠体重增量有差别,即遗传因素对小白鼠体重增量有影响(但一般更关注对小白鼠体重增量有影响(但一般更关注处理组间差别的假设检验)。处理组间差别的假设检验)。第三十九页,讲稿共一百一十七页哦40 一般而言,随机区组设计较成组设计一般而言,随机区组设计较成组设计更容易检验出处理组间的差别,提高了研更容易检验出处理组间的差别,提高了研究效率。但不是在任何情况下都能提高研究效率。但不是在任何情况下都能提高研究效率。究效率。区组效应是否具有统计学意义是区组效应是否具有统计学意义是 重要的,它表明区重要的,它表明区组的划分是否成功,即达到:区组内各实验单位很组的划分是否成功,即达到:区组内各实验单位很
16、均匀,而不同区组内的实验单位具有很大差异。均匀,而不同区组内的实验单位具有很大差异。如果区组效应无统计学意义,则并不能提高研究效率,如果区组效应无统计学意义,则并不能提高研究效率,甚至会降低研究效率。甚至会降低研究效率。(如果(如果MS区组区组 MS误差误差)若没有足够理由显示不同区组间的差别确有统计学若没有足够理由显示不同区组间的差别确有统计学意义,则宁可不分区组。意义,则宁可不分区组。第四十页,讲稿共一百一十七页哦41SPSS操作与结果解释操作与结果解释随机区组设计的两因素方差分析随机区组设计的两因素方差分析第四十一页,讲稿共一百一十七页哦42二、随机区组设计的两因素方差分析二、随机区组设
17、计的两因素方差分析例题例题在不同的室温下测定家兔的血糖浓度。室温在不同的室温下测定家兔的血糖浓度。室温分七组,家兔分四个种属,每一种属七只。分七组,家兔分四个种属,每一种属七只。问不同温度的血糖浓度有无差别及不同水平问不同温度的血糖浓度有无差别及不同水平血糖浓度均数的变化趋势?血糖浓度均数的变化趋势?第四十二页,讲稿共一百一十七页哦431.1.建立建立SPSSSPSS数据工作表数据工作表家兔种属 室温51015202530351301108282110120140120130110831001401601501401001101201201601201007482100110130第四十三页,
18、讲稿共一百一十七页哦441.1.选用选用SPSSSPSS过程:过程:Analyze General Linear Model Univariate第四十四页,讲稿共一百一十七页哦45在在Univariate对话框,对话框,将血糖浓度选入将血糖浓度选入Dependent Variable栏栏;将室温选入将室温选入 Fix factors栏栏;将将家兔种属家兔种属选入选入Random factors栏栏第四十五页,讲稿共一百一十七页哦46单击单击Model按钮按钮第四十六页,讲稿共一百一十七页哦47选择选择Custom第四十七页,讲稿共一百一十七页哦48将室温和家兔种属选入将室温和家兔种属选入Mo
19、delModel栏,从下拉栏,从下拉菜单选择菜单选择Main effentsMain effents(因不能分析交互因不能分析交互作用作用)。单击。单击ContinueContinue返回。返回。第四十八页,讲稿共一百一十七页哦493.SPSS3.SPSS结果解释:结果解释:第四十九页,讲稿共一百一十七页哦50经随机区组设计的两因素方差分析:经随机区组设计的两因素方差分析:经随机区组设计的两因素方差分析:经随机区组设计的两因素方差分析:不同室温血糖浓度的差别有统计学意义(F=19.12,P=0.000)不同家兔种属血糖浓度的差别也有统计学意义(F=10.02,P=0.000)第五十页,讲稿共一
20、百一十七页哦51第四节第四节交叉设计资料的方差分析交叉设计资料的方差分析在医学研究中,将A、B两种处理先后施加于同一批受试对象,先随机的将一半的受试对象接受A后接受B,而另外一半则相反,先接受B再接受A,将两种处理因素在全部试验过程中交叉进行,故称之为交叉设计(crossover design)。第五十一页,讲稿共一百一十七页哦52交叉设计交叉设计是一种特殊的自身对照设计是一种特殊的自身对照设计克服了试验前后自身对照由于观察期间各克服了试验前后自身对照由于观察期间各种非试验因素对试验结果的影响所造成的种非试验因素对试验结果的影响所造成的偏移。偏移。第五十二页,讲稿共一百一十七页哦53交叉设计的
21、优点:交叉设计的优点:1.节约样本含量节约样本含量2.控制了时间因素以及个体差异对处理方控制了时间因素以及个体差异对处理方式的影响式的影响3.每一个试验对象同时接受试验因素和对每一个试验对象同时接受试验因素和对照,从医德的观点出发,均等考虑了每一照,从医德的观点出发,均等考虑了每一个患者的利益个患者的利益第五十三页,讲稿共一百一十七页哦54交叉设计的缺点:交叉设计的缺点:不允许有病人失访,否则会造成该个体已不允许有病人失访,否则会造成该个体已有的数据完全浪费有的数据完全浪费不适用于病程较短的急性病治疗效果的研不适用于病程较短的急性病治疗效果的研究究第五十四页,讲稿共一百一十七页哦55交叉设计的
22、限制条件交叉设计的限制条件前一个试验阶段的处理效应不能持续作用前一个试验阶段的处理效应不能持续作用到下一个试验阶段到下一个试验阶段洗脱时间(洗脱时间(washout time):目的是消):目的是消除残留效应(除残留效应(carry-over effect)第五十五页,讲稿共一百一十七页哦56例题为了研究为了研究12名高血压病人用名高血压病人用A、B两种治两种治疗方案疗效的差别,随机的让其中疗方案疗效的差别,随机的让其中6名病名病人先以人先以A法治疗,后以法治疗,后以B法治疗,而另外法治疗,而另外一半的一半的6名病人则先用名病人则先用B法,后用法,后用A法,记法,记录治疗后血压的下降值(录治疗
23、后血压的下降值(KPa),请分析),请分析A、B两方案疗效有无差别。两方案疗效有无差别。第五十六页,讲稿共一百一十七页哦57二阶段交叉设计变异的来源:1.1.处理(药物)效应处理(药物)效应2.2.阶段效应阶段效应3.3.顺序效应和个体差异顺序效应和个体差异 其中处理效应是希望研究的因素,而顺序效应则在目其中处理效应是希望研究的因素,而顺序效应则在目前常用的统计分析中被忽略,因为这是交叉设计能够前常用的统计分析中被忽略,因为这是交叉设计能够实施的前提条件。实施的前提条件。保证顺序效应忽略的办法,就是消除残留效应。保证顺序效应忽略的办法,就是消除残留效应。4.4.误差误差第五十七页,讲稿共一百一
24、十七页哦58例:例:12例高血压病人交叉设计资料阶段12345678910 11 12IBBABAAAABBBA3.071.334.441.873.20 3.73 4.13 1.07 1.07 2.27 3.47 2.40IIAABABBBBAAAB2.801.473.733.602.67 1.60 2.67 1.73 1.47 1.87 3.47 1.73第五十八页,讲稿共一百一十七页哦59第五节第五节 拉丁方设计拉丁方设计(latin square design)拉丁方设计是将三个因素(一个处理因素拉丁方设计是将三个因素(一个处理因素两个控制因素)按水平数两个控制因素)按水平数r排列成一个
25、排列成一个rr的随机方阵。如的随机方阵。如33、44拉丁方。拉丁方。第五十九页,讲稿共一百一十七页哦60常用拉丁方表常用拉丁方表ABCCABBCAABCDBADCCDBADCAB将两个控制因素分别安排在拉丁方设计的行将两个控制因素分别安排在拉丁方设计的行和列上,需对基本拉丁方表作行列变换。和列上,需对基本拉丁方表作行列变换。第六十页,讲稿共一百一十七页哦61拉丁方设计的优点:拉丁方设计的优点:与随机区组相比较,可以多安排一个控制与随机区组相比较,可以多安排一个控制因素,因素,增加了均衡性,减少了误差,提高了效率。增加了均衡性,减少了误差,提高了效率。第六十一页,讲稿共一百一十七页哦62例4-5
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 样本 比较 方差分析 讲稿
限制150内