《方差分析检验讲稿.ppt》由会员分享,可在线阅读,更多相关《方差分析检验讲稿.ppt(28页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、医学统计学医学统计学关于方差分析检验9/7/20221第一页,讲稿共二十八页哦医学统计学医学统计学9/7/20222一、方差分析的概念一、方差分析的概念 方差分析(方差分析(ANOVAANOVA)又称变异数分析或)又称变异数分析或F F检验,检验,其目的是推断两组或多组资料的总体均数是否相同,其目的是推断两组或多组资料的总体均数是否相同,检验两个或多个样本均数的差异是否有统计学意义。检验两个或多个样本均数的差异是否有统计学意义。离均差平方和又称为变异数。离均差平方和又称为变异数。2)(xx11)(2)(222nxnxxSnx方差的概念:方差即为标准差的平方,又称为平均离方差的概念:方差即为标准
2、差的平方,又称为平均离均差平方和,简称均差平方和,简称“均方均方”。第二页,讲稿共二十八页哦医学统计学医学统计学9/7/20223二、方差分析的用途二、方差分析的用途1 1、对两组或多组计量资料的均数差异进行显著、对两组或多组计量资料的均数差异进行显著性检验。性检验。2 2、可用于完全随机设计(单因素)、随机区、可用于完全随机设计(单因素)、随机区组设计(双因素)、析因设计、拉丁方设组设计(双因素)、析因设计、拉丁方设计和正交设计等资料的统计处理。计和正交设计等资料的统计处理。3 3、可对两因素间交互作用差异进行显著性检验。、可对两因素间交互作用差异进行显著性检验。4 4、进行方差齐性检验。、
3、进行方差齐性检验。第三页,讲稿共二十八页哦医学统计学医学统计学9/7/20224三、方差分析的条件三、方差分析的条件1 1、被比较的资料要有可比性。、被比较的资料要有可比性。2 2、被比较的资料要有实际意义。、被比较的资料要有实际意义。3 3、被比较的资料要呈正态分布。、被比较的资料要呈正态分布。4 4、被比较的资料各组方差齐同。、被比较的资料各组方差齐同。第四页,讲稿共二十八页哦医学统计学医学统计学9/7/20225四、方差分析的基本思想四、方差分析的基本思想 例例 1 1 某医院用三种不同疗法治疗同种疾病,以体温降至正常所需要的天数某医院用三种不同疗法治疗同种疾病,以体温降至正常所需要的天
4、数为指标,为指标,1515例患者体温降至正常所需要的天数资料如下:例患者体温降至正常所需要的天数资料如下:1515例患者体温降至正常所需要的天数例患者体温降至正常所需要的天数 甲法甲法 乙法乙法 丙法丙法 5 5 75 5 7 5 5 9 5 5 9 5 7 9 5 7 9 7 7 9 7 7 9 7 7 9 7 7 9 29 33 43 29 33 43 5 5 5 n=15 5 5 5 n=15 5.8 6.6 8.6 x=7 5.8 6.6 8.6 x=7 173.0 229.0 373.0 173.0 229.0 373.0 ixin2ix7752x105xx第五页,讲稿共二十八页哦医
5、学统计学医学统计学9/7/2022615例患者体温降至正常所需要的天数甲法 乙法 丙法 5 5 7 5 5 9 5 7 9 7 7 9 7 7 9 1515例患者体温降至正例患者体温降至正常所需要的天数不尽相同常所需要的天数不尽相同,如果把每个患者所需的,如果把每个患者所需的天数与总均数的差异之和天数与总均数的差异之和称为总变异,总变异用离称为总变异,总变异用离均差平方和(均差平方和(SS)来描述)来描述。2)(xxSS总第六页,讲稿共二十八页哦医学统计学医学统计学9/7/20227 答案答案 1 1 造成总变异的造成总变异的原因有两种可能:原因有两种可能:1 1、由于个体差异的存在而引、由于
6、个体差异的存在而引起,即起,即组内变异组内变异引起。引起。组内变异,即由于随机误差组内变异,即由于随机误差的原因使得各组内部患者体温降的原因使得各组内部患者体温降至正常所需要的天数各不相等。至正常所需要的天数各不相等。2)(iixxSS组内 问题问题 11造成总变异的原造成总变异的原因是什么?因是什么?15例患者体温降至正常所需要的天数甲法 乙法 丙法 5 5 7 5 5 9 5 7 9 7 7 9 7 7 9第七页,讲稿共二十八页哦医学统计学医学统计学9/7/202282 2、由于治疗方法不同而引起,即、由于治疗方法不同而引起,即组间变异组间变异引起。引起。组间变异,即由于各组治组间变异,即
7、由于各组治疗方法(处理因素)不同使得疗方法(处理因素)不同使得各组均数大小不等。各组均数大小不等。2)(xxnSSii组间15例患者体温降至正常所需要的天数甲法 乙法 丙法 5 5 7 5 5 9 5 7 9 7 7 9 7 7 9第八页,讲稿共二十八页哦医学统计学医学统计学9/7/20229SS总总=SS组间组间+SS组内组内 v总总=v组间组间+v组内组内总变异与组间变异和组内变异的关系为:总变异与组间变异和组内变异的关系为:总变异总变异=组间变异组间变异 +组内变异组内变异第九页,讲稿共二十八页哦医学统计学医学统计学9/7/202210处理因素治疗方法抽样误差个体差异组 间 变 异组 内
8、 变 异总 变 异总变异来源分析总变异来源分析第十页,讲稿共二十八页哦医学统计学医学统计学9/7/202211 因组间变异数大小与组数(组间自由度因组间变异数大小与组数(组间自由度K-1)有关,故用组间变异数)有关,故用组间变异数除以自由度所得组间均方来表示组间变异除以自由度所得组间均方来表示组间变异。1kssms组间组间 k=组数 因组内变异数大小与各样本含量大小即组内自由度因组内变异数大小与各样本含量大小即组内自由度(ni 1)有有关,故用组内变异数除以组内自由度所得组内均方来表示组内变异。关,故用组内变异数除以组内自由度所得组内均方来表示组内变异。)1(inssms组内组内各样本含量in
9、第十一页,讲稿共二十八页哦医学统计学医学统计学9/7/202212 问题问题 2 2 当处理因素不起作用时,从理论上来说当处理因素不起作用时,从理论上来说 F F 值是多大?值是多大?答案答案 2 2 当处理因素不起作用时,从理论上来当处理因素不起作用时,从理论上来说说T=0,T+E=E,MST=0,T+E=E,MS 组间组间=MS=MS组内,组内,F=1F=1。当处理因素起作用时,从理论上来说当处理因素起作用时,从理论上来说T0,T+E T0,T+E E,F 1,E,F 1,多大的多大的F F值才认为均数间的差异在统计学上值才认为均数间的差异在统计学上有显著性意义,可根据自由度查有显著性意义
10、,可根据自由度查F F值表,确定值表,确定P P值后作出值后作出推断。推断。EETF组内组间msmsF第十二页,讲稿共二十八页哦医学统计学医学统计学9/7/202213五、方差分析的方法五、方差分析的方法 根据实验设计方法不同,完全随机设计(单因素)、根据实验设计方法不同,完全随机设计(单因素)、随机区组设计(双因素)、析因设计、拉丁方设计和随机区组设计(双因素)、析因设计、拉丁方设计和正交设计等资料应选用不同的方差分析方法。正交设计等资料应选用不同的方差分析方法。第十三页,讲稿共二十八页哦医学统计学医学统计学9/7/202214 问题问题 1 1 右边右边 资料资料是用何种实验设计方法进是用
11、何种实验设计方法进行实验所得资料?行实验所得资料?答案答案 1 1 用完用完全随机设计(单因素)全随机设计(单因素)方法进行实验所得资料。方法进行实验所得资料。15例患者体温降至正常所需要的天数 甲法 乙法 丙法 5 5 7 5 5 9 5 7 9 7 7 9 7 7 9第十四页,讲稿共二十八页哦医学统计学医学统计学9/7/2022151、完全随机设计(单因素)资料的方差分析H0:H1:321或不完全相等32105.073515105)(22Nxc40735775)(22cxxxss总cnxXxnssiii22)()(组间8.207355435335292222.198.2040组间总组内ss
12、ssss 15例患者体温降至正常 所需要的天数 甲法 乙法 丙法 5 5 7 5 5 9 5 7 9 7 7 9 7 7 9 29 31 43 29 31 43 5 5 5 n=15 5 5 5 n=15 5.8 6.6 8.6 x=7 5.8 6.6 8.6 x=7 173.0 229.0 373 173.0 229.0 373ixinix2ix7752x105x第十五页,讲稿共二十八页哦医学统计学医学统计学9/7/202216完全随机设计多个样本均数比较的方差分析公式 变异来源 SS MS F总 N1组间 k1 组内 Nk Cji2IijijCnx2)(组间总SSSS组间组间SS组内组内S
13、S组内组间MSMS第十六页,讲稿共二十八页哦医学统计学医学统计学9/7/202217 方差分析表变异来源 SS v MS F组 间 20.8 2 10.4 6.5组 内 19.2 12 1.6 确定P值:查F值表,F0.05(2,12)=3.88,F0.01(2,12)=6.93,本例F=6.5,3.886.5P0.01。为组间自由度1为组内自由度2第十七页,讲稿共二十八页哦医学统计学医学统计学9/7/202218 放置不同时间的血糖浓度 受试者号 放置时间(分)(区组)0 45 90 135 1 5.27 5.27 4.94 4.61 2 5.27 5.22 4.88 4.66 3 5.88
14、 5.83 5.38 5.00 4 5.44 5.38 5.27 5.00 5 5.66 5.44 5.38 4.88 6 6.22 6.22 5.61 5.22 7 5.83 5.72 5.38 4.88 8 5.27 5.11 5.00 4.44 随机区组设计资料随机区组设计资料 方差分析方差分析 研究酵解作用对血糖浓度的影响,从8名健康人中抽取了血液并制备成血滤液,每个受试者的血滤液分成四份,再随机把4份血液分别放置0、45、90、135分钟后测定其血糖浓度,试分析放置不同时间的血糖浓度有无变化。第十八页,讲稿共二十八页哦医学统计学医学统计学9/7/202219 放置不同时间的血糖浓度
15、受试者号 放置时间(分)(区组)0 45 90 135 1 5.27 5.27 4.94 4.61 2 5.27 5.22 4.88 4.66 3 5.88 5.83 5.38 5.00 4 5.44 5.38 5.27 5.00 5 5.66 5.44 5.38 4.88 6 6.22 6.22 5.61 5.22 7 5.83 5.72 5.38 4.88 8 5.27 5.11 5.00 4.44随机区组设计资料的类型随机区组设计资料的类型 1、单因素多水平多组配对设计资料。、单因素多水平多组配对设计资料。2、多因素单水平多组配对设计资、多因素单水平多组配对设计资料料 3、双因素多水平设
16、计资料。、双因素多水平设计资料。配对的方配对的方法:法:1、同体配对研究、同体配对研究 (1)处理前后配对研究)处理前后配对研究 (2)同体左右配对研究)同体左右配对研究 2、异体配对研究、异体配对研究 (1)动物)动物:种系、性别、胎次相同,:种系、性别、胎次相同,体重体重10%。(2)人群:种族、性别、病种相同,)人群:种族、性别、病种相同,病情或并发症相似,年龄病情或并发症相似,年龄5岁。岁。第十九页,讲稿共二十八页哦医学统计学医学统计学9/7/202220随机区组设计资料变异来源分析随机区组设计资料变异来源分析总变异=处理组间变异+区组间变异+误差变异SS总=SS处理组间+SS区组间+
17、SS误差第二十页,讲稿共二十八页哦医学统计学医学统计学9/7/202221 不同治疗方法大鼠体重增重变化不同治疗方法大鼠体重增重变化 常规疗法 甲 法 乙 法区组号 治疗前 治疗后 治疗前 治疗后 治疗前 治疗后 1 160 240 160 264 165 290 2 178 253 176 306 172 317 3 156 262 158 258 158 288 4 164 272 164 284 164 298 5 172 265 172 290 174 320 6 168 277 168 286 170 305 7 165 282 168 290 168 310 8 170 290 1
18、72 300 168 312 9 164 276 162 280 162 290 10 174 268 176 296 174 300第二十一页,讲稿共二十八页哦医学统计学医学统计学9/7/202222 四种大鼠注射不同剂量雌激素(mg/Kg)后子宫重量如下表,试进行分析。鼠 种 剂 量 0.1 0.2 0.4 0.8 A 98 106 116 145 B 40 42 68 115 C 56 70 111 133 D 38 42 63 87第二十二页,讲稿共二十八页哦医学统计学医学统计学9/7/202223 案例案例 2 2 现有8 名贫血患儿治疗前后血红蛋白含量资料如下:8 名贫血患儿治疗前
19、后血红蛋白含量(g/L)患者编号 治疗前 1个月 3个月 b 1 115 104 120 339 2 107 110 130 347 3 98 109 125 332 4 110 115 130 355 5 90 109 125 324 6 117 115 115 347 7 115 120 135 370 8 115 123 127 365 ni 8 8 8 N=24 867.0 905.0 1007.0 x 108.4 113.1 125.9 94617.0 102657.0 127029.0 3243032X 2779XIX2X第二十三页,讲稿共二十八页哦医学统计学医学统计学9/7/20
20、22241515例患者体温降至正常例患者体温降至正常 所需要的天数所需要的天数 甲法甲法 乙法乙法 丙法丙法 5 5 75 5 7 5 5 9 5 5 9 5 7 9 5 7 9 7 7 9 7 7 9 7 7 9 7 7 9 现有现有8 8 名贫血患儿治疗前后血红蛋白含量资料如下:名贫血患儿治疗前后血红蛋白含量资料如下:8 8 名贫血患儿治疗前后血红蛋白含量(名贫血患儿治疗前后血红蛋白含量(g/Lg/L)患者编号患者编号 治疗前治疗前 1 1个月个月 3 3个月个月 b 1 b 1 115 104 120 339 115 104 120 339 2 107 110 130 347 2 107
21、 110 130 347 3 98 109 125 332 3 98 109 125 332 4 110 115 130 355 4 110 115 130 355 5 90 109 125 324 5 90 109 125 324 6 117 115 115 347 6 117 115 115 347 7 115 120 135 370 7 115 120 135 370 8 115 123 127 3658 115 123 127 365 问题问题 2 2 例例2 2的总变异来源与例的总变异来源与例1 1有何异同点?有何异同点?答案答案 2 2 共同点是其总变异来源都是来自于处理因素共同点
22、是其总变异来源都是来自于处理因素变异和抽样误差变异,这不仅是它们的共同点,而且是变异和抽样误差变异,这不仅是它们的共同点,而且是所有方差分析资料总变异来源的共同点。所有方差分析资料总变异来源的共同点。不同点是例不同点是例1 1只有一个只有一个处理因素,例处理因素,例2 2有两个处理因有两个处理因素,因此总的变异来源可分素,因此总的变异来源可分解为:解为:SSSS总总=SS=SS因素因素1 1+SS+SS因素因素2 2+SS+SS误差误差例1例2第二十四页,讲稿共二十八页哦医学统计学医学统计学9/7/202225随机区组设计(双因素)资料的方差分析方法为:随机区组设计(双因素)资料的方差分析方法
23、为:HoHo:不同时间:不同时间HBHB含量相同,含量相同,H H1 1:不同时间:不同时间HBHB含量不同或部分不同。含量不同或部分不同。H H0 0:不同的受试者:不同的受试者HBHB含量相同,含量相同,H H1 1:不同的受试者:不同的受试者HBHB含量不同或部分不同。含量不同或部分不同。第二十五页,讲稿共二十八页哦医学统计学医学统计学9/7/202226 例例 2 2 现有现有8 8 名贫血患儿治疗前后名贫血患儿治疗前后血红蛋白含量资料如下:血红蛋白含量资料如下:8 8 名贫血患儿治疗前后血红蛋白含量(名贫血患儿治疗前后血红蛋白含量(g/Lg/L)编号编号 治疗前治疗前 1 1个月个月
24、 3 3个月个月 b b 1 115 104 120 339 1 115 104 120 339 2 107 110 130 347 2 107 110 130 347 3 98 109 125 332 3 98 109 125 332 4 110 115 130 355 4 110 115 130 355 5 90 109 125 324 5 90 109 125 324 6 117 115 115 347 6 117 115 115 347 7 115 120 135 370 7 115 120 135 370 8 115 123 127 365 8 115 123 127 365 n n
25、i i 8 8 8 N=24 8 8 8 N=24 867.0 905.0 1007.0 867.0 905.0 1007.0 x 108.4 113.1 125.9 x 108.4 113.1 125.9 94617 102657 127029 94617 102657 127029 05.032178524)2779()(22Nxc25183217853243032cxss总cbxssi2)(处13103217858)1007()905()867(222ckxssb2)(区5783217853)365()347()339(222 69057813102518区处总误ssssssss第二十六页,讲稿共二十八页哦医学统计学医学统计学9/7/202227配伍组方差分析的计算公式 变异来源 SS MS F总 N1 处理间 k1 配伍间 b1 误差 SS总SS处理SS配伍 总-处理-配伍 CX2ijijCbX2)(处理处理SS误差处理MSMSjiijCkX2)(处理配伍SS误差配伍MSMS误差误差SS第二十七页,讲稿共二十八页哦医学统计学医学统计学9/7/2022感谢大家观看感谢大家观看第二十八页,讲稿共二十八页哦
限制150内