《非参数检验(研).ppt》由会员分享,可在线阅读,更多相关《非参数检验(研).ppt(78页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、非参数检验非参数检验(研研)参数检验 parametric test(1)总体分布类型已知,如率服从二项分布、样本均数服从正态分布;(2)由样本统计量推断未知总体参数。这时,对总体参数m、p的假设检验称为参数检验。如 t 检验:F 检验:2 非参数检验(nonparametric test)对数据的总体分布类型不作严格假定,又称任意分布检验(distribution-free test),它直接对总体分布的位置作假设检验。3已知已知已知已知总体分布类型总体分布类型总体分布类型总体分布类型,对,对,对,对未知参数进行统计推断未知参数进行统计推断未知参数进行统计推断未知参数进行统计推断依赖于特定分
2、布类依赖于特定分布类依赖于特定分布类依赖于特定分布类型,型,型,型,比较的是比较的是比较的是比较的是参数参数参数参数 参数检验参数检验 (parametric testparametric test)非参数检验非参数检验 (nonparametric testnonparametric test)对总体的分布类型对总体的分布类型对总体的分布类型对总体的分布类型不作严格要求不作严格要求不作严格要求不作严格要求 不受分布类型的影响,不受分布类型的影响,不受分布类型的影响,不受分布类型的影响,比比比比较的是较的是较的是较的是总体分布位置总体分布位置总体分布位置总体分布位置 优点:优点:优点:优点:方
3、法简便、易学易用,易于推广使用、方法简便、易学易用,易于推广使用、方法简便、易学易用,易于推广使用、方法简便、易学易用,易于推广使用、应用范围广;可用于参数检验难以处理的资料应用范围广;可用于参数检验难以处理的资料应用范围广;可用于参数检验难以处理的资料应用范围广;可用于参数检验难以处理的资料(如等级资料,或含数值如等级资料,或含数值如等级资料,或含数值如等级资料,或含数值“50mg”“50mg”等等等等)缺点:缺点:方法比较粗糙,对于符合参数检验条件者,采用方法比较粗糙,对于符合参数检验条件者,采用非参数检验非参数检验会损失部分信息,其检验效能较低会损失部分信息,其检验效能较低;样本含;样本
4、含量较大时,两者结论常相同量较大时,两者结论常相同应用非参数检验的情况1.不满足正态和方差齐性条件的小样本资料;不满足正态和方差齐性条件的小样本资料;2.总体分布类型不明的小样本资料;总体分布类型不明的小样本资料;3.一一端端或或二二端端是是不不确确定定数数值值(如如0.002、65等)的资料(必选);等)的资料(必选);4.单向有序列联表资料(等级资料);单向有序列联表资料(等级资料);5.各种资料的初步分析。各种资料的初步分析。5秩次(rank)将数值变量值从小到大,或等级变量值从弱到强所排列的序号。例例1 11只大鼠存活天数:只大鼠存活天数:存活天数存活天数 4,10,7,50,3,15
5、,2,9,13,60,60秩次 3 6 4 9 2 8 1 5 7 10 11 10.5 10.5本章介绍的非参数统计方法 均基于秩次秩次秩次相同取平均秩次!秩次相同取平均秩次!6例例2 7名名 肺炎病人的治疗结果:肺炎病人的治疗结果:危险程度危险程度 治愈治愈 治愈治愈 死亡死亡 无效无效 治愈治愈 有效有效 治愈治愈秩次 1 2 7 6 3 5 4平均秩次平均秩次 2.5 2.5 7 6 2.5 5 2.5秩和检验(秩和检验(rank sum test)一类用数据的秩次代替原数据进行假设检验的一类用数据的秩次代替原数据进行假设检验的非参数统计分析方法非参数统计分析方法7第一节 Wilcox
6、on符号秩和检验一、配对设计两样本比较的符号秩和检验【例【例11-1】为观察血浆置换法治疗出凝血功能异常的临床疗效,某医师治疗了11例出凝血功能异常患者,置换前后各患者的凝血酶原时间见表11-1。问:血浆置换治疗前后凝血酶原时间有无差别患者患者编号编号(1)血浆置血浆置换前换前(2)血浆置血浆置换后换后(3)差值差值d(4)=(2)-(3)125.3314.6910.64210.4513.13-2.68330.8712.6818.19424.3113.4510.86515.5015.50 0.00658.2514.2044.05779.2713.3965.88814.3812.05 2.339
7、75.2915.1760.121012.9515.28-2.331111.8512.48-0.638患者编号患者编号(1)血浆置换前血浆置换前(2)血浆置换后血浆置换后(3)差值差值d (4)=(2)-(3)秩次秩次(5)125.3314.6910.64 5210.4513.13-2.68-4330.8712.6818.19 7424.3113.4510.86 6515.5015.50 0.00658.2514.2044.05 8779.2713.3965.8810814.3812.05 2.33 2.5975.2915.1760.12 91012.9515.28-2.33-2.51111.8
8、512.48-0.63-1按照差值的绝对值从小到大编秩按照差值的绝对值从小到大编秩差值为差值为0 0者不参加编秩者不参加编秩绝对值相等,符号相同时顺次编秩绝对值相等,符号相同时顺次编秩绝对值相等,符号相反时取平均秩次绝对值相等,符号相反时取平均秩次91、建立检验假设 2、计算检验统计量 求差值 编秩 求秩和,确定检验统计量 值 (任取 或 为统计量)计算分析步骤103 3、确定、确定P P 值值 查表法:用于有效对子数查表法:用于有效对子数 若若T T值在上、下界值范围内,则值在上、下界值范围内,则P P值大于相应的概率值大于相应的概率 若若T T值值在在上上、下下界界值值上上或或外外,则则P
9、 P值值小小于于等等于于相相应应的的概率概率本例本例n=10n=10,T=7.5T=7.5,查附表,查附表1010(p345p345)得双侧)得双侧p0.05 p0.05 N N 双侧双侧 0.05 0.02 0.05 0.02 10 847 5-5010 847 5-50 114 4、做出推断结论做出推断结论 按按a=0.05水准,拒绝水准,拒绝H0,接受,接受H1,差异有统计,差异有统计学意义,可以认为血浆置换治疗前后出凝血功学意义,可以认为血浆置换治疗前后出凝血功能异常患者的凝血酶原时间有差别。能异常患者的凝血酶原时间有差别。12正态近似法:用于有效对子数 相同秩次的个数不超过n25%时
10、:相同秩次的个数较多,需用下式校正:13秩次秩次 1 2.5 2.5 4 5.5 5.5 8 8 8 101 2.5 2.5 4 5.5 5.5 8 8 8 10 为第为第 个相同秩次的个数个相同秩次的个数 14统计推断逻辑统计推断逻辑 1、差值变换为秩次、差值变换为秩次(dT):d的变异度因分布不同而异,任意分布都可以的变异度因分布不同而异,任意分布都可以将数值变换为秩次(这种变换会损失信息),将数值变换为秩次(这种变换会损失信息),然后用秩次分布的规律来作统计推断。然后用秩次分布的规律来作统计推断。152、秩和、秩和(T)的分布:的分布:假定差值总体的正负值相互抵消,即差值总体假定差值总体
11、的正负值相互抵消,即差值总体中位数中位数 Md=0。当差值。当差值 d 变换为秩次变换为秩次 T后,后,正正负差值的差别负差值的差别就变为就变为正负秩次的差别正负秩次的差别,这种差,这种差别的大小可用平均秩来反映,但其分布规律用别的大小可用平均秩来反映,但其分布规律用秩和来描述比较方便。秩和来描述比较方便。16二、单样本资料的二、单样本资料的WilcoxonWilcoxon符号秩和检验符号秩和检验 与配对设计的与配对设计的Wilcoxon符号秩和检验比较符号秩和检验比较不同点:不同点:差值的计算为差值的计算为相同点:相同点:假设的建立、编秩、统计量的计算、假设的建立、编秩、统计量的计算、值的确
12、定值的确定17【例【例11-2】已知某地正常人尿汞含量的中位数为2.50g/L,某医师从该地某厂从事土法炼金(汞齐法)的汞作业工人中随机抽取10名工人,测得尿汞含量(g/L)为11.01,2.13,2.56,2.79,12.95,3.12,3.56,4.37,5.13,18.90。问:汞作业工人的尿汞含量是不是高于一般正常人?18按照差值的绝对值从小到大编秩按照差值的绝对值从小到大编秩差值为差值为0 0者不参加编秩者不参加编秩绝对值相等,符号相同时顺次编秩绝对值相等,符号相同时顺次编秩绝对值相等,符号相反时取平均秩次绝对值相等,符号相反时取平均秩次19 1 1、建立检验假设、建立检验假设 H
13、H0 0:该厂工人的尿汞含量总体中位数等于该厂工人的尿汞含量总体中位数等于2.5ug/L2.5ug/L H H1 1:该厂工人的尿汞含量总体中位数大于该厂工人的尿汞含量总体中位数大于2.5ug/L2.5ug/L 单侧单侧 a=0.05 a=0.052 2、计算检验统计量、计算检验统计量T T 求差值求差值 编秩次编秩次 求秩和:求秩和:=50.5 =4.5 =50.5 =4.5 计算分析步骤203 3、确定、确定P P 值,做出推断结论值,做出推断结论 本例本例n=10,T=4.5 n=10,T=4.5 查附表查附表1010得单侧得单侧p0.01p0.01 按按a=0.05a=0.05水准拒绝
14、水准拒绝H H0 0,接受接受H H1 1,差别有统计学,差别有统计学 意义意义,可以认为可以认为该厂工人的尿汞含量总体中位数大该厂工人的尿汞含量总体中位数大于于2.5ug/L2.5ug/L。N 单侧单侧 0.01 10 5-5021第二节 两样本比较的秩和检验 完全随机设计的两个样本比较,若不完全随机设计的两个样本比较,若不满足参数检验的条件(如满足参数检验的条件(如t检验),可以用检验),可以用成组设计两样本比较的秩和检验成组设计两样本比较的秩和检验方法,本方法,本法利用法利用两样本观察值的秩和两样本观察值的秩和来推断样本分来推断样本分别代表的别代表的两总体分布是否相同两总体分布是否相同。
15、22一、原始数据的两样本比较一般方法步骤:1、建立检验假设,确定检验水准2、计算检验统计量编秩求秩和,确定检验统计量T值两样本例数不等时两样本例数不等时,以以样本例数小样本例数小的秩和为的秩和为T T两样本例数相等时两样本例数相等时,任取一组的秩和为任取一组的秩和为T T233、确定P值,做出推断结论查表法:用于 且 附表11(P346),左侧找到 ,表上方找到两组例数之差 ,二者交叉处即为T的界值若若T值在上、下界值范围内,则值在上、下界值范围内,则P值大于相应值大于相应的概率的概率若若T值在上、下界值上或外,则值在上、下界值上或外,则P值小于等于值小于等于相应的概率相应的概率24正态近似法
16、:1)相同秩次的个数不超过n25%时2)相同秩次的个数超过n25%时zzz25 【例【例11-3】为探讨转化生长因子】为探讨转化生长因子 (TGF-)在在肾病综合征患者血中的表达及其在发病中的作用肾病综合征患者血中的表达及其在发病中的作用,某医师对,某医师对13例原发性肾病综合征患者和例原发性肾病综合征患者和9例正例正常人采用酶联免疫吸附法测定血中的常人采用酶联免疫吸附法测定血中的TGF-水水平平(pg/ml),得,得TGF-的测量值如下:的测量值如下:26肾病综合征组:肾病综合征组:358.74 398.45 489.48 548.75 599.87 698.98 896.45 975.48
17、 988.61 1234.68 1766.98 2044.87 2897.41正常组:正常组:198.43 199.45 205.99 242.22 246.92 248.24 289.44 298.36 398.4527经正态性检验,经正态性检验,W=0.84,;经方差齐性检验,经方差齐性检验,F=138.97,;不能做两样本均数比较的不能做两样本均数比较的t检验。检验。28完全随机(成组)设计两样本完全随机(成组)设计两样本Wilcoxon秩和检验的目的是推断两独立样本所来秩和检验的目的是推断两独立样本所来自总体的分布是否相同。自总体的分布是否相同。29基本思想:基本思想:假设假设 成立,
18、即两样本来自同一总成立,即两样本来自同一总体,将两样本统一由小到大编秩,然后分别计体,将两样本统一由小到大编秩,然后分别计算两组的秩和算两组的秩和 与与 ,取样本例数较小组的秩,取样本例数较小组的秩和作为检验统计量和作为检验统计量T,此时应与,此时应与 相差相差不大,若不大,若T与之相差过大,则有理由怀疑与之相差过大,则有理由怀疑 的成的成立,从而拒绝它。立,从而拒绝它。301.建立检验假设,确定检验水准建立检验假设,确定检验水准 :两总体分布相同:两总体分布相同 :两总体分布不同:两总体分布不同 312.计算检验统计量计算检验统计量T值值 编秩编秩 求秩和求秩和 确定检验统计量确定检验统计量
19、 32表表11-4 肾病综合征组与正常组血中肾病综合征组与正常组血中TGF-水平水平(pg/ml)测定结果测定结果肾病综合征组肾病综合征组正常组正常组水平水平(1)秩次秩次(2)水平水平(3)秩次秩次(4)358.74 9198.431 398.45 10.5199.452 489.4812205.993 548.7513242.224 599.8714246.925 698.9815248.246 896.4516289.447 975.4817298.368 988.6118398.45 10.51234.68191766.98202044.87212897.4122n2=13T2=206
20、.5n1=9T1=46.5编秩原则:编秩原则:将两组数据混合起来从小到大统一编秩将两组数据混合起来从小到大统一编秩数值相等且数值相等且组别相同时顺次编秩组别相同时顺次编秩数值相等但数值相等但组别不同时取平均秩次组别不同时取平均秩次33 ,按按 水准水准拒绝拒绝H0,接受,接受H1,差异有统计学意义,可认为两组血,差异有统计学意义,可认为两组血中中TGF-水平的总体分布不同,肾病组高于正常组。水平的总体分布不同,肾病组高于正常组。3.确定确定P值,做出统计推断值,做出统计推断 查表法查表法:当当 且且 时,查附表时,查附表11 正态近似法正态近似法:若若 或或 本例,本例,,34【例11-4】某
21、医师为探讨斯康杜尼和利多卡因应用于深牙周袋刮治术的临床局部麻醉效果。将患有牙周病需进行深牙周袋刮治术的患者109人随机分为两组,观察斯康杜尼和利多卡因麻醉后的麻醉效果,结果见表11-5。二、频数表资料的两样本比较35表表11-5 两种药物对各种牙齿麻醉效果比较两种药物对各种牙齿麻醉效果比较组别组别人数人数完全完全良好良好有效有效失败失败斯康杜尼组5647 531利多卡因组5316238636两样本比较的两样本比较的Wilcoxon秩和检验秩和检验【检验步骤】【检验步骤】1.建立检验假设,确定检验水准建立检验假设,确定检验水准 :两种药物麻醉效果的总体分布相同:两种药物麻醉效果的总体分布相同 :
22、两种药物麻醉效果的总体分布不同:两种药物麻醉效果的总体分布不同 37【检验步骤】【检验步骤】2.计算检验统计量计算检验统计量T 值值 编秩编秩 求秩和求秩和 计算计算z 值值 38表表11-6 两种两种药药物物对对各种牙各种牙齿齿麻醉效果比麻醉效果比较较麻醉效果麻醉效果(1)斯斯 康康杜尼杜尼组组(2)利利 多多卡因卡因组组(3)合合计计(4)秩次秩次范范围围(5)平均平均秩次秩次(6)秩和秩和斯康杜尼斯康杜尼(7)=(2)(6)利多卡因利多卡因组组(8)=(3)(6)完全完全471663 163321504 512良好良好 523286491 77.5 387.5 1782.5有效有效 3
23、81192102 97 291 776失失败败 1 6 7103109 106 106 636合合计计56(n2)53(n1)1092288.5(T2)3706.5(T1)39403.确定确定P值,做出统计推断值,做出统计推断 ,按,按 水准,拒绝水准,拒绝 ,接受,接受 ,差异有统计学意义,可以认为斯康,差异有统计学意义,可以认为斯康杜尼和利多卡因应用于深牙周袋刮治术的局部杜尼和利多卡因应用于深牙周袋刮治术的局部麻醉效果的总体分布不同,斯康杜尼的效果好麻醉效果的总体分布不同,斯康杜尼的效果好于利多卡因。于利多卡因。4142A4344454647=90150300(600+1)/2 0.5=9
24、015090150 0.5=0本例,本例,00.05按按a=0.05检验水准,不拒绝检验水准,不拒绝H0,尚不能认为尚不能认为两种治疗方法疗效有区别。两种治疗方法疗效有区别。48第三节 成组设计多个样本比较的秩和检 Kruskal-Wallis法(H检验)49【例【例11-5】为探讨血管紧张素转化酶抑制剂开博通抗动脉粥样硬化的机制,某医师将15只兔随机分为三组,即正常饮食组、高脂饮食组及高脂饮食加开博通组,喂养14周后测量兔血清总胆固醇(TC)水平,结果如下:正常饮食组:0.86 0.78 1.38 0.88 1.70高脂饮食组:40.35 41.79 44.00 40.72 27.05高脂饮
25、食加开博通组:41.20 33.04 40.60 32.05 40.49一、原始数据的多个样本比较5051计算分析步骤 1、建立检验假设,确定检验水准、建立检验假设,确定检验水准 H0:3个总体的分布位置相同 H1:3个总体的分布位置不全相同 2、计算检验统计量、计算检验统计量H (1)编秩 (2)求秩和 (3)计算检验统计量H值52统计量统计量H的计算:的计算:当相同秩次的个数当相同秩次的个数当相同秩次较多时,按下式求校正值当相同秩次较多时,按下式求校正值 C为校正系数为校正系数,tj为第为第j个相同秩次的个数。个相同秩次的个数。53本例:545556二、频数表资料或等级资料的多个样本比较
26、注意事项:编秩方法与前述相同确定秩次范围,求平均秩次,计算各组秩和计算H值后需进行校正Hc值确定P值时,需查自由度为组数-1的卡方界值表5758596061第四节 随机区组设计的秩和检验一、M检验(Friedman 法)查表法用于区组数b15,处理组数k15分析步骤:建立检验假设,确定检验水准计算检验统计量编秩、求各处理组的秩和Ri 求平均秩和求检验统计量M 值 确定P值、作出统计推断结论6263计算分析过程建立检验假设,确定检验水准H0:三组的总体分布相同,即多发伤后三个时间点血清ESM-1的检测结果的总体分布相同H1:三组的总体分布不同或不全相同,即多发伤后三个时间点血清ESM-1的检测结
27、果的总体分布不同或不全相同 6465计算检验统计量编秩、求各处理组的秩和Ri 求平均秩和求检验统计量M 值 66确定P值、作出统计推断结论根据区组数b=12及处理组数k=3查附表13,本例M=276.5M0.05(12,3)=72,概率P值P0.051与3558.66.898.540.0573 随机区组设计资料的两两比较计算步骤:计算各处理组的秩和Ri 计算各对比组秩和之差的绝对值计算Ca界值,是以a为检验水准,以 为自由度的t界值;b为配伍组数,k为处理组数 747576非参数检验秩和检验 Wilcoxon符号秩和检验(配对设计)Wilcoxon两样本(成组设计)Kruskal-Wallis 法(H检验)成组设计多样本 Friedman 法(M检验)(随机区组设计)77数据资料计量资料计数资料非参数检验等级相关分析秩和检验统计描述统计推断参数估计假设检验t 检验方差分析完全随机设计随机区组设计交叉设计析因设计重复测量设计 Wilcoxon符号秩和检验(配对设计)Wilcoxon两样本(成组设计)Kruskal-Wallis 法 成组设计多样本 Friedman 法(随机区组设计)相对数统计推断参数估计假设检验确切概率法卡方检验四格表卡方检验配对四格表卡方检验行列表卡方检验Z检验单样本t 检验配对t 检验两独立样本t 检验t 检验78
限制150内