分类变量资料的假设检验课件.ppt
关于分类变量资料的假设检验现在学习的是第1页,共79页 非参数检验又称为任意分布检验非参数检验又称为任意分布检验(distribution-free testdistribution-free test),),它不考虑研它不考虑研究对象总体分布具体形式,也不对总体参数进究对象总体分布具体形式,也不对总体参数进行统计推断,而是通过检验样本所代表的总体行统计推断,而是通过检验样本所代表的总体分布形式是否一致来得出统计结论。分布形式是否一致来得出统计结论。现在学习的是第2页,共79页 非参数检验的优点:非参数检验的优点:适用范围广,不论样本来自的总适用范围广,不论样本来自的总体分布形式如何,都可适用;体分布形式如何,都可适用;某些非参数检验方法计算简便,某些非参数检验方法计算简便,研究者在急需获得初步统计结果时可采研究者在急需获得初步统计结果时可采用;用;易于理解和掌握;易于理解和掌握;可用于不便精确测量的资料或等可用于不便精确测量的资料或等级资料。级资料。现在学习的是第3页,共79页 非参数检验的缺点:非参数检验的缺点:对符合用参数检验的资料,如用非参对符合用参数检验的资料,如用非参数检验,会丢失信息,导致检验效率下降,数检验,会丢失信息,导致检验效率下降,犯第犯第类错误的可能性比参数检验大。类错误的可能性比参数检验大。虽然许多非参数检验计算简便,但有虽然许多非参数检验计算简便,但有些问题的计算仍显繁冗。些问题的计算仍显繁冗。现在学习的是第4页,共79页配对资料的符号秩和检验配对资料的符号秩和检验(WilcoxonWilcoxon配对法)配对法)现在学习的是第5页,共79页 例例6-1 6-1 某医院对某医院对1212例患者进行例患者进行“巩巩膜瓣下灼烙角膜咬切术膜瓣下灼烙角膜咬切术”,手术前后的,手术前后的视力如表视力如表6-16-1,问手术后视力是否有改善,问手术后视力是否有改善?现在学习的是第6页,共79页现在学习的是第7页,共79页 (1 1)建立检验假设,确定检验水准)建立检验假设,确定检验水准 H H0 0:差值总体中位数差值总体中位数0 0,即手术前,即手术前 后视力无变化;后视力无变化;H H1 1:M Md d00,手术前后视力有变化;手术前后视力有变化;=0.05=0.05现在学习的是第8页,共79页(2 2)求每对观察对象数据的差值,)求每对观察对象数据的差值,如上表第(如上表第(4 4)栏;)栏;现在学习的是第9页,共79页 (3 3)编秩:依差值的绝对值从小到大)编秩:依差值的绝对值从小到大编秩。编秩时,遇差值为编秩。编秩时,遇差值为0 0者,舍去不计,者,舍去不计,同时样本例数相应减去(如本例病人编号同时样本例数相应减去(如本例病人编号为为3 3、5 5、1111的三对数据差值为的三对数据差值为0 0,故编秩时,故编秩时舍去,样本例数舍去,样本例数n=12-3=9n=12-3=9););现在学习的是第10页,共79页 遇绝对值相等差值,若正负号一致,遇绝对值相等差值,若正负号一致,则按顺序编秩即可,若有符号不同者,则则按顺序编秩即可,若有符号不同者,则应取平均秩次(如本例中病人编号为应取平均秩次(如本例中病人编号为4 4、1010、1212的三对数据差值的绝对值均为的三对数据差值的绝对值均为0.10.1,其秩次按顺序编为,其秩次按顺序编为1 1、2 2、3 3,但因差值,但因差值有正有负,故取平均秩次有正有负,故取平均秩次(1+3)/2=2(1+3)/2=2;同;同理,病人编号为理,病人编号为2 2、9 9的两对数据编秩结果的两对数据编秩结果取平均秩次取平均秩次8.58.5)。编秩后,按差值的正)。编秩后,按差值的正负号给秩次添上符号。负号给秩次添上符号。现在学习的是第11页,共79页(4 4)求秩和并确定检验统计量:)求秩和并确定检验统计量:分别求出正负秩次之和,正秩和以分别求出正负秩次之和,正秩和以T T+表示,负秩和的绝对值以表示,负秩和的绝对值以T T-表示。表示。T T+及及T T-之和之和等于等于n(n+1)/2n(n+1)/2。此式可验证此式可验证T T+和和T T-的计算是的计算是否正确。如本例否正确。如本例T T+=19.5=19.5,T T-=25.5=25.5,其和为其和为4545,n=9n=9(因舍去三对差值为因舍去三对差值为0 0的数据),的数据),9(9+1)/2=459(9+1)/2=45。取。取T T+和和T T-中较小者作为检验统中较小者作为检验统计量计量T T,本例取本例取T=19.5T=19.5。现在学习的是第12页,共79页(5 5)确定)确定P P值和作出推断结论:当值和作出推断结论:当n50n50时,查附表时,查附表5 5,配对比较的符号秩和,配对比较的符号秩和检验用检验用T T界值表,按所取检验水准作出推界值表,按所取检验水准作出推断结论(此界值表用下限界值,断结论(此界值表用下限界值,T T值越大,值越大,P P值越大;反之值越大;反之P P值越小)。本例值越小)。本例n=9n=9,T=19.5T=19.5,查附表查附表7 7,T T界值表,得双侧界值表,得双侧P0.10P0.10,按双侧按双侧=0.05=0.05水准,不拒绝水准,不拒绝H H0 0,故不能认为手术后视力有改善。故不能认为手术后视力有改善。现在学习的是第13页,共79页 当当n50n50,超出附表超出附表7 7的范围,查不到的范围,查不到界值时,可采用正态近似法,按下式计算界值时,可采用正态近似法,按下式计算u u值,查值,查u u界值来判断结果。界值来判断结果。现在学习的是第14页,共79页 如果相同秩次较多时,应改用下式作如果相同秩次较多时,应改用下式作校正计算。校正计算。上式中,上式中,t tj j为第为第j j(j=1j=1,2 2,)个相个相同差值的个数,假定差值中有同差值的个数,假定差值中有2 2个个0.10.1,3 3个个0.20.2,5 5个个0.30.3,则,则t t1 1=2=2,t t2 2=3=3,t t3 3=5=5,。现在学习的是第15页,共79页 本法的基本思想:本法的基本思想:假定无效假设假定无效假设H H0 0成立,则配对的差值成立,则配对的差值的总体分布是对称的,总体中位数为的总体分布是对称的,总体中位数为0 0,理,理论上论上T T值分布应近似均数为值分布应近似均数为n(n+1)/4n(n+1)/4,方差方差为为n(n+1)(2n+1)/24n(n+1)(2n+1)/24的正态分布,的正态分布,T T+与与T T-应非常接近;若正、负秩和相差悬殊,应非常接近;若正、负秩和相差悬殊,则无效假设成立的可能性也小。则无效假设成立的可能性也小。现在学习的是第16页,共79页两样本比较的秩和检验两样本比较的秩和检验(WilcoxonWilcoxon两样本比较法)两样本比较法)现在学习的是第17页,共79页一、原始数据的两样本比较的秩和检验一、原始数据的两样本比较的秩和检验现在学习的是第18页,共79页 基本步骤:基本步骤:1 1建立检验假设,确定检验水准建立检验假设,确定检验水准()2 2混合编秩混合编秩 3 3求秩和并确定检验统计量求秩和并确定检验统计量 4 4确定确定P P值和作出推断结论值和作出推断结论现在学习的是第19页,共79页 1 1建立检验假设,确定检验水准建立检验假设,确定检验水准()一般无效假设一般无效假设H H0 0是两总体分布位置相同,是两总体分布位置相同,M M1 1=M=M2 2;备择假设备择假设H H1 1是两总体分布位置不同,是两总体分布位置不同,M M1 1MM2 2。取取0.050.05。现在学习的是第20页,共79页 2 2混合编秩混合编秩 将两样本数据混合,按数值由小到大编将两样本数据混合,按数值由小到大编秩,若有相同值可按以下方法处理:秩,若有相同值可按以下方法处理:相同相同数据在同一组内,则仍按顺序编秩;数据在同一组内,则仍按顺序编秩;相同相同数据在不同组,则取它们的平均秩次。数据在不同组,则取它们的平均秩次。现在学习的是第21页,共79页 3 3求秩和并确定检验统计量求秩和并确定检验统计量 将两组秩次分别相加,求出两组的将两组秩次分别相加,求出两组的秩和秩和R R1 1、R R2 2。当当n n1 1n2020或(或(n n2 2-n-n1 1)1010时,附表时,附表6 6中查不中查不到到P P值,则可采用正态近似法求值,则可采用正态近似法求u u值来确定值来确定P P值,其公式如下:值,其公式如下:现在学习的是第24页,共79页 上式中上式中T T为检验统计量值,为检验统计量值,n n1 1、n2n2分别分别为两样本含量,为两样本含量,N=nN=n1 1+n+n2 2,0.50.5这连续性校这连续性校正数。上式为无相同秩次时使用或作为相正数。上式为无相同秩次时使用或作为相同秩次较少时的近似值。当两样本相同秩同秩次较少时的近似值。当两样本相同秩次较多(超过总样本数的次较多(超过总样本数的25%25%)时,应按下)时,应按下式进行校正,式进行校正,u u经校正后可略增大,经校正后可略增大,P P值则值则相应减小。相应减小。现在学习的是第25页,共79页t tj j意义同前。意义同前。现在学习的是第26页,共79页 例例6-2 6-2 依降钙素具有抑制骨吸收,抑依降钙素具有抑制骨吸收,抑制破骨细胞活性和数量,减少骨钙释放的作制破骨细胞活性和数量,减少骨钙释放的作用。某医生用其治疗绝经后妇女骨质疏松症,用。某医生用其治疗绝经后妇女骨质疏松症,收集了收集了3030名绝经后骨质疏松症妇女名绝经后骨质疏松症妇女,随机分随机分为两组,一组为两组,一组1616名服用依降钙素名服用依降钙素+乳酸钙,乳酸钙,另一组另一组1414名只服乳酸钙,名只服乳酸钙,2424周后观察两组患周后观察两组患者腰椎者腰椎L L2424骨密度的改善率,以了解依降骨密度的改善率,以了解依降钙素治疗绝经后妇女骨质疏松症是否有效。钙素治疗绝经后妇女骨质疏松症是否有效。各组患者腰椎各组患者腰椎L L224 4骨密度的改善率(骨密度的改善率(%)。)。现在学习的是第27页,共79页现在学习的是第28页,共79页 1 1建立检验假设,确定检验水准建立检验假设,确定检验水准()H H0 0:M M1 1=M=M2 2,即两治疗组骨密度改善率即两治疗组骨密度改善率 的总体分布相同;的总体分布相同;H H1 1:M M1 1MM2 2,即两治疗组骨密度改善率即两治疗组骨密度改善率 的总体分布不同。的总体分布不同。=0.05=0.05现在学习的是第29页,共79页 2 2混合编秩混合编秩 依据两组数值由小到大编秩,结果见依据两组数值由小到大编秩,结果见上表。上表。3 3求秩和并确定检验统计量求秩和并确定检验统计量T T 把两组秩次分别相加求出两组的秩把两组秩次分别相加求出两组的秩和值,和值,R R1 1=315.5=315.5,R R2 2=149.5=149.5。因乳酸钙组因乳酸钙组样本含量较小,故样本含量较小,故T=RT=R2 2=149.5=149.5。现在学习的是第30页,共79页 4 4确定确定P P值和作出推断结论值和作出推断结论 以较小样本含量为以较小样本含量为n n1 1,n n1 1=14,n=14,n2 2-n n1 1=2=2,查附表查附表6 6,两样本比较秩和检验用,两样本比较秩和检验用T T界值表(双侧)。界值表(双侧)。现在学习的是第31页,共79页 T T0.05(14,2)0.05(14,2)=(170,264170,264););T T0.01(14,2)0.01(14,2)=(156156,278278)T=149.5 T=149.5,在在T T0.01(14,2)0.01(14,2)界值外,故界值外,故P0.01Pnn1 1,故应求单纯性老故应求单纯性老年支气管炎病人组的秩和作为检验统计量,年支气管炎病人组的秩和作为检验统计量,结果见上表第(结果见上表第(7 7)栏,)栏,T=8780.5T=8780.5。现在学习的是第37页,共79页 4 4确定确定P P值和作出推断结论值和作出推断结论 本例样本含量较多,超出附表本例样本含量较多,超出附表6 6的范围,的范围,需用下式求需用下式求u u值来判断结论。又因频数表资值来判断结论。又因频数表资料相同秩次数较多(超过总样本数料相同秩次数较多(超过总样本数25%25%),),故需用校正公式。故需用校正公式。现在学习的是第38页,共79页现在学习的是第39页,共79页 u u0.050.05=1.96=1.96,故故u uC Cu0.05P0.05,按按=0.05=0.05水准,不能拒绝水准,不能拒绝H H0 0,两种病情病人两种病情病人疗效的总体分布相同,尚不能认为该药对上疗效的总体分布相同,尚不能认为该药对上述两种病情患者疗效不同。述两种病情患者疗效不同。现在学习的是第40页,共79页成组设计多个样本比较的秩和检验成组设计多个样本比较的秩和检验(KruskalWallisKruskalWallis法)法)现在学习的是第41页,共79页一、原始数据的一、原始数据的KWKW检验检验现在学习的是第42页,共79页 基本步骤:基本步骤:1 1建立检验假设,确定检验水准(建立检验假设,确定检验水准()2 2混合编秩混合编秩 3 3求秩和并计算检验统计量求秩和并计算检验统计量H H 4 4确定确定P P值和作出推断结论值和作出推断结论 现在学习的是第43页,共79页 1 1建立检验假设,确定检验水准(建立检验假设,确定检验水准()H H0 0:k:k个总体分布位置相同;个总体分布位置相同;H H1 1:k:k个总体分布位置不同或不全相同;个总体分布位置不同或不全相同;=0.05=0.05。现在学习的是第44页,共79页 2 2混合编秩混合编秩 将各组数据混合,由小到大编秩。将各组数据混合,由小到大编秩。遇有原始数据相同时,若相同数据在同遇有原始数据相同时,若相同数据在同一组内,则仍按顺序编秩;若相同数据一组内,则仍按顺序编秩;若相同数据在不同组,则取它们的平均秩次。在不同组,则取它们的平均秩次。现在学习的是第45页,共79页 3求秩和并计算检验统计求秩和并计算检验统计量量H 将各组秩次分别相加,求出各组的秩和将各组秩次分别相加,求出各组的秩和R Ri i。i i为组序。检验统计量值为组序。检验统计量值H H可按下式计可按下式计算:算:式中,式中,R Ri i为各组的秩和,为各组的秩和,n ni i为各组样为各组样本含量,本含量,N N为总样本含量。为总样本含量。现在学习的是第46页,共79页 当各组相同秩次较多时,可对当各组相同秩次较多时,可对H H值进值进行校正,按下式求值。行校正,按下式求值。现在学习的是第47页,共79页 4 4确定确定P P值和作出推断结论值和作出推断结论 当组数当组数K=3K=3,每组样本含量每组样本含量n ni i55时,时,可查附表可查附表7 7(H H界值表)得到界值表)得到P P值。若值。若k3k3或或n ni i55时,时,H H值的分布近似于自由度为值的分布近似于自由度为k-1k-1的的2 2分布,此时可查附表分布,此时可查附表4 42 2界值表得到界值表得到P P值。最后按值。最后按P P值作出推断结论。值作出推断结论。现在学习的是第48页,共79页 例例6-4 6-4 某研究者测定正常人、单纯性某研究者测定正常人、单纯性肥胖、皮质醇增多症者各肥胖、皮质醇增多症者各1010人的血浆总皮人的血浆总皮质醇含量见下表,问这三组人的血浆总皮质醇含量见下表,问这三组人的血浆总皮质醇含量有无差别?质醇含量有无差别?现在学习的是第49页,共79页现在学习的是第50页,共79页 1 1建立检验假设,确定检验水准(建立检验假设,确定检验水准()H H0 0:三组人的血浆总皮质醇含量总三组人的血浆总皮质醇含量总 体分布相同;体分布相同;H H1 1:三组人的血浆总皮质醇含量总三组人的血浆总皮质醇含量总 体分布不同或不全相同。体分布不同或不全相同。=0.05=0.05。现在学习的是第51页,共79页 2 2混合编秩混合编秩 将三组人的血浆总皮质醇含量值混将三组人的血浆总皮质醇含量值混合,由小到大编秩。本例有两个合,由小到大编秩。本例有两个3.13.1,分,分别在正常人和单纯性肥胖组,其平均秩别在正常人和单纯性肥胖组,其平均秩次为次为(10+11)/2=10.5(10+11)/2=10.5;另有两个;另有两个15.615.6,但都在皮质醇增多症组,故其秩次按位但都在皮质醇增多症组,故其秩次按位置顺序记为置顺序记为2727、2828。现在学习的是第52页,共79页 3 3求秩和并计算检验统计量求秩和并计算检验统计量H H 将各组秩次分别相加,求出各组的秩将各组秩次分别相加,求出各组的秩和和R Ri i,见上表见上表6-46-4。i i为组序。检验统计量为组序。检验统计量值值H H可按上式计算:可按上式计算:现在学习的是第53页,共79页 4 4确定确定P P值和作出推断结论值和作出推断结论 本例本例n ni i均为均为1010,自由度,自由度=K-1=3-1=2=K-1=3-1=2,查查2 2界值表,界值表,p0.005p0.005,按按=0.05=0.05水准水准拒绝拒绝H H0 0,接受接受H H1 1,故可认为三组人的血浆故可认为三组人的血浆总皮质醇测定值有差别。总皮质醇测定值有差别。现在学习的是第54页,共79页 二、频数表资料(或等级资料)的二、频数表资料(或等级资料)的KWKW检验检验现在学习的是第55页,共79页 例例6-5 6-5 四种疾病患者痰液内嗜酸性粒四种疾病患者痰液内嗜酸性粒细胞的检查结果见表细胞的检查结果见表6-56-5。问四种疾病患者。问四种疾病患者痰液内嗜酸性粒细胞有无差别?痰液内嗜酸性粒细胞有无差别?现在学习的是第56页,共79页现在学习的是第57页,共79页 1 1建立检验假设,确定检验水准(建立检验假设,确定检验水准()H H0 0:四种疾病患者的痰液内嗜酸性粒细胞四种疾病患者的痰液内嗜酸性粒细胞 总体分布位置相同;总体分布位置相同;H H1 1:四种疾病患者的痰液内嗜酸性粒细胞四种疾病患者的痰液内嗜酸性粒细胞 总体分布位置不同或不全相同。总体分布位置不同或不全相同。=0.05=0.05。现在学习的是第58页,共79页 2 2混合编秩混合编秩 先计算各等级的合计,见上表中第先计算各等级的合计,见上表中第(6 6)栏,再确定秩次范围,如第()栏,再确定秩次范围,如第(7 7)栏所)栏所示,然后计算平均秩次,见第(示,然后计算平均秩次,见第(8 8)栏。)栏。现在学习的是第59页,共79页 3 3求秩和并计算检验统计量求秩和并计算检验统计量 将每组各等级的例数乘相应的平均将每组各等级的例数乘相应的平均秩次再相加,求出各组的秩和秩次再相加,求出各组的秩和R Ri i,如本例如本例支气管扩张组的秩和支气管扩张组的秩和R R1 1=06=06221221940.5940.5655.5=739.5655.5=739.5,同理:同理:R R2 2=436.5=436.5,R R3 3=409.5=409.5,R R4 4=244.5=244.5。现在学习的是第60页,共79页 4 4确定确定P P值和作出推断结论值和作出推断结论 本例本例n ni i均为均为1010,自由度,自由度=k-1=4-1=3=k-1=4-1=3,查查2 2界值表,界值表,p0.005p0.05P0.05,正常人与皮正常人与皮质醇增多症组、单纯性肥胖组与皮质醇质醇增多症组、单纯性肥胖组与皮质醇增多症组比较均增多症组比较均P0.01P0.01,按按=0.05=0.05水准,水准,可认为正常人与单纯性肥胖者血浆总皮质可认为正常人与单纯性肥胖者血浆总皮质醇含量无差别;正常人与皮质醇增多症者、醇含量无差别;正常人与皮质醇增多症者、单纯性肥胖与皮质醇增多症者间血浆总皮单纯性肥胖与皮质醇增多症者间血浆总皮质醇含量有差别,皮质醇增多症者血浆总质醇含量有差别,皮质醇增多症者血浆总皮质醇含量高于正常人及单纯性肥胖者。皮质醇含量高于正常人及单纯性肥胖者。现在学习的是第68页,共79页二、各样本例数不同或不全相同的两两比二、各样本例数不同或不全相同的两两比较的秩和检验较的秩和检验现在学习的是第69页,共79页 基本步骤:基本步骤:1 1建立检验假设,确定检验水准(建立检验假设,确定检验水准()H H0 0:四种疾病患者的痰液内嗜酸性粒细胞四种疾病患者的痰液内嗜酸性粒细胞 任意两总体分布位置均相同;任意两总体分布位置均相同;H H1 1:任意两总体分布位置不同或不全相同。任意两总体分布位置不同或不全相同。=0.05=0.05。现在学习的是第70页,共79页 2 2计算统计量值计算统计量值 先用下式计算先用下式计算2 2值值:式中式中 和和 为两两比较组中任两个比较组为两两比较组中任两个比较组的平均秩和,如的平均秩和,如 =R RA A/n/nA A ,=R RB B/n/nB B,C=1-C=1-,为相同秩次的校正为相同秩次的校正值;值;N N为各处理组的总例数。为各处理组的总例数。现在学习的是第71页,共79页 3 3判断结果判断结果 以计算出的以计算出的2 2值按值按=k-1=k-1,查查2 2界界值表,得值表,得P P值,按所取检验水准作出推断值,按所取检验水准作出推断结论。结论。现在学习的是第72页,共79页 例例6-7 6-7 对例对例6-56-5资料做资料做3 3个样本间的两个样本间的两两比较。两比较。现在学习的是第73页,共79页 1 1建立检验假设,确定检验水准(建立检验假设,确定检验水准()H H0 0:四种疾病患者的痰液内嗜酸性粒细四种疾病患者的痰液内嗜酸性粒细 胞任意两总体分布位置均相同;胞任意两总体分布位置均相同;H H1 1:任意两总体分布位置不同或不全相任意两总体分布位置不同或不全相 同。同。=0.05=0.05。现在学习的是第74页,共79页 2 2计算统计量值计算统计量值 设支气管扩张组为一组,肺水肿组设支气管扩张组为一组,肺水肿组为二组,肺癌组为三组,病毒性呼吸道为二组,肺癌组为三组,病毒性呼吸道感染组为四组。列出两两比较的计算表,感染组为四组。列出两两比较的计算表,如表(如表(6-76-7)。第()。第(2 2)、()、(3 3)栏为两比)栏为两比较组的样本例数,第(较组的样本例数,第(4 4)栏为两比较组)栏为两比较组平均秩和之差的绝对值。第(平均秩和之差的绝对值。第(5 5)栏是按)栏是按上式计算的上式计算的2 2值。如一组与二组比较时,值。如一组与二组比较时,=14.40=14.40,n nA A=17=17,n nB B=15=15,C=0.92C=0.92(见例见例6-6-5 5),),N=60N=60,代入下式得:代入下式得:现在学习的是第75页,共79页现在学习的是第76页,共79页现在学习的是第77页,共79页 3 3判断结果判断结果 以表以表6-76-7中第(中第(5 5)栏的)栏的2 2值按值按=k-1=4-1=3=k-1=4-1=3,查查2 2界值表,得界值表,得P P值,见值,见上表中第(上表中第(6 6)栏,按)栏,按=0.05=0.05水准,可认水准,可认为支气管扩张组与肺癌组、支气管扩张组为支气管扩张组与肺癌组、支气管扩张组与病毒性呼吸道感染组的患者痰液内嗜酸与病毒性呼吸道感染组的患者痰液内嗜酸性粒细胞有差别,其余两两比较结果无差性粒细胞有差别,其余两两比较结果无差别。别。现在学习的是第78页,共79页感感谢谢大大家家观观看看3/31/2023现在学习的是第79页,共79页