《研究生医学统计学-两样本定量资料的比较.ppt》由会员分享,可在线阅读,更多相关《研究生医学统计学-两样本定量资料的比较.ppt(64页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、 第六章 两样本定量资料的比较 第一节 配对设计定量资料的比较第二节 两组独立样本的比较第三节 两组二项分布资料的比较第四节 两组Possion分布资料的比较青岛大学医学院流行病与卫生统计教研室吴义丽 讲师 第六章 两样本定量资料的比较 第一节 配对设计定量资料的比较第二节 两组独立样本的比较第三节 两组二项分布资料的比较第四节 两组Possion分布资料的比较一、配对资料的t检验配对设计是研究者为了控制可能存在的主要非处理因素而采用的一种试验设计方法。形式:1、将受试对象配成特征相近的对子,同对的两个受试对象随机分别接受不同处理;2、同一样品分成两份,随机分别接受不同处理(或测量);3、同一
2、受试对象处理前后,数据作对比。基本思想:理论上,若两种处理无差别时,差值d的总体均数d应为0。适用条件:差值服从正态分布例6-1 某儿科采用静脉注射人血丙种球蛋白治疗小儿急性毛细支气管炎。用药前后患儿血清中免疫球蛋白IgG(mg/dl)含量如表所示。试问用药前后IgG有无变化?序号 用药前 用药后 差值d1 1206.44 1678.44 472.002 921.69 1293.36 371.673 1294.08 1711.66 417.584 945.36 1416.70 471.345 721.36 1204.55 483.196 692.32 1147.30 454.977 980.0
3、1 1379.59 399.588 691.01 1091.46 400.459 910.39 1360.34 449.9510 568.56 1091.83 523.2711 1105.52 1728.03 622.5112 757.43 1398.86 641.44表 表6-1 6-1 用药前后患儿血清中免疫球蛋白 用药前后患儿血清中免疫球蛋白IgG(mg/dl)IgG(mg/dl)含量 含量 2、计算统计量:根据资料类型和检验方法选择1、建立检验假设,确立检验水准3、确定P值,做出统计推断 P值的意义:如果总体状况和H0一致,统计量获得现有数值以及更不利于H0的数值的可能性(概率)有多大
4、。查t临界值表:t0.05/2,11=2.201,tt0.05/2,11,得P0.05,按=0.05水准拒绝H0,接受H1。认为用药后小儿IgG增高。二、配对资料的符号秩和检验 基本思想:假定两种处理效应相同,则差值的总体分布是对称的,总体中位数为0。对于样本的正秩和与负秩和之间的差异是一些随机因素造成的抽样误差,这些差异一般不会太大。如果差别太大,超出了规定的范围,就拒绝H0,接受H1,认为差值的总体中位数不等于0。适用条件:差值不服从正态分布或分布型未知。例6-2 某研究欲研究保健食品对小鼠抗疲劳作用,将同种属的小鼠按性别和年龄相同、体重相近配成对子,共10对,并将每对中的两只小鼠随机分到
5、保健食品两个不同的剂量组,过一定时期将小鼠杀死,测得其肝中糖原含量(mg/100g),结果见表10-1,问不同剂量组的小鼠肝糖 原含量有无差别?表 表6-2 6-2不同剂量组的小鼠肝糖 不同剂量组的小鼠肝糖 原含量 原含量(mg/100g)(mg/100g)小鼠号 中剂量组 高剂量组差值d差值为正 差值为负(1)(2)(3)(4)秩次(5)秩次(6)1 620.16 958.47 338.31 102 866.50 838.42-28.08-53 641.22 788.90 147.68 84 812.91 815.20 2.29 1.55 738.96 783.17 44.21 66 899
6、.38 910.92 11.54 3.57 760.78 758.49-2.29-1.58 694.95 870.80 175.85 99 749.92 862.26 112.34 710 793.94 805.48 11.54 3.5检验步骤:1 建立假设 H0:差值总体中位数Md=0 H1:Md0=0.052 根据差值编秩:按差值的绝对值由小到大编秩,并按差值的正负给秩次加上正负号。编秩时,若差值为0,舍去不计;若差值的绝对值相等时取平均秩次。3 求秩和并确定检验统计量:分别求出正、负差 值秩次之和,以T+和 T-表示,单侧检验时任取其一为统计量T;双侧检验时,以绝对值较小者为统计量T。本
7、题取T=min(T+,T-)=6.54 确定P值作结论:5n25 查表法 n 25 正态近似法/校正若n25超过附表C8的范围,可用Z 检验。若多次出现相持现象,用下式计算:式中tj:第j个相同差值的个数,假定差值中有2个4,5 个6,3个7则t1=2,t2=5,t3=3,第六章 两样本定量资料的比较 第一节 配对设计定量资料的比较第二节 两组独立样本的比较第三节 两组二项分布资料的比较第四节 两组Possion分布资料的比较一、两组独立样本资料的t检验条件:两小样本均来自正态总体且方差齐正态性检验方差齐性检验例6-3 为研究某种新药治疗贫血患者的疗效,将20名贫血患者随机分成两组,一组用新药
8、治疗,另一组用常规药物治疗,测得的血红蛋白增加量(g/L)见表6-3。问新药与常规药治疗贫血患者后的血红蛋白平均增加量有无差别?治疗药物血红蛋白增加量/gL-1新药组30.5 21.4 25.0 34.5 33.0 32.5 29.5 25.5 24.4 23.6常规药组19.5 19.0 13.0 24.7 21.5 22.0 19.0 15.5 24.5 23.4表6-3 两种药物治疗贫血患者结果 2、计算统计量:根据资料类型和检验方法选择1、建立检验假设,确立检验水准3、确定P值,做出统计推断 P值的意义:如果总体状况和H0一致,统计量获得现有数值以及更不利于H0的数值的可能性(概率)有
9、多大。查 t 值表:按=0.05水准,拒绝H0,接受H1,差别有统计学意义,可以认为新药和常规药治疗贫血患者后血红蛋白增加量不同,根据样本均数的信息,认为1 2,即服用新药后血红蛋白含量平均增加量高于常规药。正态性检验图示法:P-P图W检验:3n50D检验:50n1000矩法检验K-S检验所观察数据的实际累计概率假设数据服从正态分布时累计概率的期望值直线上则正态分布直线上方则负偏态直线下方则正偏态 2、计算统计量:1、建立检验假设,确立检验水准3、确定P值,做出统计推断 P值的意义:如果总体状况和H0一致,统计量获得现有数值以及更不利于H0的数值的可能性(概率)有多大。按=0.10水准,不拒绝
10、H0,可以认为该数据服从正态分布。方差齐性检验两组正态分布随机样本判断其总体方差是否齐同:当H0成立时,检验统计量 2、计算统计量:1、建立检验假设,确立检验水准3、确定P值,做出统计推断 P值的意义:如果总体状况和H0一致,统计量获得现有数值以及更不利于H0的数值的可能性(概率)有多大。查 F 值表:按=0.1水准,不拒绝H0,可以认为两总体方差相等,符合两小样本t检验的方差齐性要求。方差齐性检验的另一个方面是比较两组观测数据的测量精度。(两个总体的变异程度是否相同)例6-4 将同一瓶液样分成20份。将此20份样品随机分成两组,每组10份。用不同的方法分别检测液样中某物质的含量(mmol/L
11、)。结果两种方法测得样本均数相同,样本标准差分别为1.02与0.56。试问两法检测精度是否相同?查F 临界值表3.2:F0.05,(9,9)=4.03,F 0.05 按=0.05水准不拒绝H0,故还不能认为两法检测结果精度不同。二、两组独立样本资料的t检验近似t检验-t检验 样本来自正态总体,方差不齐时,两小样本均数的比较,可选择以下方法:1)采用适当的变量变换,使达到方差齐的要求。2)采用秩和检验。3)采用近似法检验(包括对临界值和自由度校正两种)。当所两小样本均数的比较时,其总体分布不呈正态分布时,可选择的方法有两种即变量变换和秩和检验。当H0成立时,检验统计量(Satterthwaite
12、近似法)例6-5 为探讨硫酸氧钒对糖尿病性白内障的防治作用,研究人员将已诱导糖尿病模型的20只大鼠随机分为两组。一组用硫酸氧钒治疗(DV组),另一组作对照观察(D组),12周后测大鼠血糖含量(mmol/L)。结果为DV组12只,样本均数为6.5mmol/L,标准差为1.34 mmol/L;D组8只,样本均数为13.7mmol/L,标准差为4.21 mmol/L。试问两组动物血糖含量的总体均数是否相同?2、计算统计量:1、建立检验假设,确立检验水准3、确定P值,做出统计推断 P值的意义:如果总体状况和H0一致,统计量获得现有数值以及更不利于H0的数值的可能性(概率)有多大。查F 临界值表3.2:
13、F0.05,(7,11)=3.76,F F0.05,(7,11),得P0.05 按=0.05水准拒绝H0,接受H1,故可认为两个总体方差不相等。1、建立检验假设,确立检验水准 2、计算统计量:查t临界值表:t0.05/2,8=2.306,t t0.05/2,8,得P0.05 按=0.05水准拒绝H0,接受H1,故可认为经硫酸氧钒治疗的大鼠与未治疗大鼠的血糖含量不同。3、确定P值,做出统计推断 P值的意义:如果总体状况和H0一致,统计量获得现有数值以及更不利于H0的数值的可能性(概率)有多大。三、两组独立样本资料的z检验z 检验的应用条件 样本例数n较大,或n虽小但总体标准差已知例6-6 某地对
14、241例正常成年男性面部上颌间隙进行了测定,得其结果如下表,问不同身高正常成年男子其上颌间隙是否不同?表6-4 某地241名正常男性上颌间隙(cm)身高 n S161 116 0.2189 0.2351172 125 0.2280 0.2561(1)建立检验假设,确定检验水准H0:1=2,即不同身高正常成年男性上颌间隙相同H1:12,即不同身高正常成年男性上颌间隙不同 0.05(2)选定检验方法,计算检验统计量因两组样本含量均大于100,故选用两大样本z 检验。(3)确定P值,作出推断结论查 z 界值表,z=0.288t0.05(),P0.05。按=0.05水准,不拒绝H0,无统计学意义。尚不
15、能认为不同身高正常成年男性上颌间隙不同。适用条件:总体的分布型未知,或分布不符合参数检验的条件。基本思想:假设两总体分布相同,两样本可认为是从同一总体中抽取的随机样本;将二者混合后由小到大编秩,然后分别计算两样本组的平均秩和应大致相等,其差别由随机抽样引起;如果按上法计算的两样本平均秩和差别很大,就有理由认为H0不成立。四、两组独立样本秩和检验例6-7 在河流监测断面优化研究中,研究者从某河流甲乙两个断面分别随机抽取10个和15个样品,测得其亚硝酸盐氮(mg/L)的含量如表6-4,问比较甲乙两河流断面亚硝酸盐氮的含量有无差别?表 表6-5 6-5 某河流甲乙断面亚硝酸盐氮含量 某河流甲乙断面亚
16、硝酸盐氮含量(mg/L)(mg/L)的含量 的含量22.5 0.064 6.0 0.022 10.5 0.025n2=15 T2=189.0 n1=10 T1=136.016.0 0.035 25.0 0.10014.0 0.030 22.5 0.06413.0 0.028 20.0 0.04310.5 0.025 19.0 0.0388.5 0.024 15.0 0.03424.0 0.067 7.0 0.023 12.0 0.02721.0 0.055 5.0 0.020 8.5 0.02418.0 0.037 4.0 0.019 2.5 0.01817.0 0.036 2.5 0.018
17、 1.0 0.014秩次 亚硝酸盐氮含量 秩次 亚硝酸盐氮含量 秩次 亚硝酸盐氮含量河流乙断面 河流甲断面1.1.假设:假设:H H0:0:两组总体分布相同 两组总体分布相同 H H1:1:两组总体分布不同 两组总体分布不同=0.05=0.052.2.编秩:编秩:将两组数据由小到大统一编秩 将两组数据由小到大统一编秩,编秩时如遇有相 编秩时如遇有相同数据,取平均秩次。同数据,取平均秩次。3.3.求秩和并确定检验统计量:两组秩次分别相加得出秩 求秩和并确定检验统计量:两组秩次分别相加得出秩和。当样本例数不等时 和。当样本例数不等时,以样本例数小的那个组的秩次之 以样本例数小的那个组的秩次之和为统
18、计量 和为统计量T,T,当两组样本例数相等时 当两组样本例数相等时,可任取一组的秩次 可任取一组的秩次之和为统计量 之和为统计量T.T.本例河流甲断面的样本例数为 本例河流甲断面的样本例数为10,10,河流乙 河流乙断面的样本例数为 断面的样本例数为15,15,检验统计量就为 检验统计量就为136.136.4.4.确定 确定P P值和作出推断结论:查表法 值和作出推断结论:查表法 正态近似法 正态近似法/校正 校正正态近似法 正态近似法如果 如果n n1 1或 或n n2 2-n-n1 1,超出附表范围,可按正态近似计算,超出附表范围,可按正态近似计算u u值 值 第六章 两样本定量资料的比较
19、 第一节 配对设计定量资料的比较第二节 两组独立样本的比较第三节 两组二项分布资料的比较第四节 两组Possion分布资料的比较应用条件:当所比较的两组阳性数与阴性数都大于等于5时检验假设:当H0成立时,检验统计量为:例6-8 用硝苯吡啶治疗高血压急症患者75例,有效者57例,用硝苯吡啶+卡托普利治疗同类患者69例,66例有效。试问两疗法的有效率是否相同?1、建立检验假设,确立检验水准 2、计算统计量:3、确定P值,做出统计推断 P值的意义:如果总体状况和H0一致,统计量获得现有数值以及更不利于H0的数值的可能性(概率)有多大。按=查t临界值表:Z0.001/2,=3.2905Z Z0.001
20、/2,得P0.001按0.05水准拒绝H0,接受H1,可为两种疗法有效率不同。第六章 两样本定量资料的比较 第一节 配对设计定量资料的比较第二节 两组独立样本的比较第三节 两组二项分布资料的比较第四节 两组Possion分布资料的比较当H0成立时,检验统计量为:当两样本观测单位数相等时:当两样本观测单位数不等时:应用条件:当每个样本的观察值之和都大于20例6-8 甲、乙两检验师分别观察15名正常人末梢血嗜碱性白细胞数量。每张血片均观察200个视野。结果甲计数到嗜碱粒细胞26个,乙计数到29个。试问两位检验师检查结果是否一致?1、建立检验假设,确立检验水准 2、计算统计量:3、确定P值,做出统计
21、推断 P值的意义:如果总体状况和H0一致,统计量获得现有数值以及更不利于H0的数值的可能性(概率)有多大。按=查t 临界值表:Z0.5/2,=0.6745 Z 0.5 按=0.05水准不拒绝H0,故尚不能认为两检验师检查结果有差异。例6-9 用放射性核素方法独立地测量两份标本的放射性,标本的制备方法相同,但测量时间不同,第一份标本测量了10min,测得质点数为1500,第二份标本测量了20min,测得质点数为2400。问如果在相同时间长度内测量,两份标本发放质点的总体均数是否相等?1、建立检验假设,确立检验水准 2、计算统计量:3、确定P值,做出统计推断 P值的意义:如果总体状况和H0一致,统
22、计量获得现有数值以及更不利于H0的数值的可能性(概率)有多大。按=查t 临界值表:Z0.05/2,=1.96 Z Z0.05/2,得P0.05 按=0.05水准拒绝H0,接受H1,可以判断在相同观察单位内第一份标本发放的质点数高于第二份。无论是在试验研究还是在调查研究中,如比较组数为k个,当k2时,两组总体均数比较是否相等的假设可采用前面介绍的t检验或z检验(当然也可采用今天所介绍的方差分析);当k2时,即检验两组以上的总体均数是否相等时,如采用 前面所学两样本t检验进行两两比较,而得出结论,会使犯一类错误的概率增大。如从已知正态总体N(10,52)进行随机抽样,共抽取k10组样本,每组样本含
23、量均20,每组样本均数和标准差结果见表65。样本编号k 1 2 3 4 5 6 7 8 9 1012.61 10.85 9.23 9.11 10.90 9.24 9.55 10.28 9.12 8.754.29 5.44 3.93 6.55 4.83 4.86 3.88 3.89 5.38 4.08表65从已知正态总体N(10,52)进行随机抽取10个样本的(ni=20)的结果 如要进行两两比较的t检验,即10个样本每两个进行,其比较的次数为:实验结果表示:若实验结果表示:若0.050.05,则在,则在4545次比较中,发现有次比较中,发现有55次有统计学意义,结果见表次有统计学意义,结果见表9933。从理论上讲。从理论上讲1010个样本均个样本均来自同一正态总体,应当无差别,但我们用两样本比较的来自同一正态总体,应当无差别,但我们用两样本比较的tt检验时,规定检验时,规定0.050.05,其实际犯第一类错误的概率为,其实际犯第一类错误的概率为5/455/450.11,0.11,显然比所要控制的显然比所要控制的0.050.05要大。要大。样本编号k 1与3 1与6 1与7 1与9 1与10 t p2.6010.0132.3290.0252.3720.0232.7270.0292.9180.006表66.45次比较中5次有统计学意义的结果需采用本章介绍的方差分析(ANOVA)
限制150内