《秩转换非参数检验.pptx》由会员分享,可在线阅读,更多相关《秩转换非参数检验.pptx(82页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、主要内容第一节 配对样本资料的Wilcoxon符号秩检验第二节 两个独立样本比较的Wilcoxon秩和检验第三节 完全随机设计多个样本比较的Kruskal-Wallis H检验第四节 随机区组设计多个样本的Friedman M检验第1页/共82页参数检验参数检验方法:t 检验,方差分析;总体分布假定:各组样本所来自的总体为正态分布(已知的分布形式),各组样本所来自的总体方差齐性。第2页/共82页非参数检验定义:不依赖于总体的分布类型,对样本所来自总体的分布不作严格假定的统计推断方法,称为非参数检验(nonparametric test)。直接对总体分布做假设检验。又称为任意分布检验(distr
2、ibution-free test)。第3页/共82页要求:要求:要求:要求:样本来自给定分样本来自给定分样本来自给定分样本来自给定分布的总体,该总体分布布的总体,该总体分布布的总体,该总体分布布的总体,该总体分布依赖于若干参数:依赖于若干参数:依赖于若干参数:依赖于若干参数:统计分析:统计分析:统计分析:统计分析:参数估计参数估计参数估计参数估计假设检假设检假设检假设检验:参数验:参数验:参数验:参数 参数检验参数检验 parametric testparametric test 非参数检验非参数检验Non-parametric testNon-parametric test要求:要求:要求
3、:要求:对对对对总体的分布总体的分布总体的分布总体的分布类型不作任何要求类型不作任何要求类型不作任何要求类型不作任何要求 统计分析:统计分析:统计分析:统计分析:假设检验:假设检验:假设检验:假设检验:总体的分布位置总体的分布位置总体的分布位置总体的分布位置 第4页/共82页 注意:如果已知其计量资料满足(或近似满足)检验或 检验条件,当然选 检验或 检验,因为这时若选秩转换的非参数检验,会降低检验效能。第5页/共82页 非参数检验是一类统计学方法的总称,基于秩转换(rank transformation)的非参数检验只是其中的一种。秩转换的非参数检验秩转换的非参数检验第6页/共82页秩次(r
4、ank):某种测量值按照从小到大的顺序排序后,每一测量值所对应的序号。秩转换:将某一变量值从小到大排序后,获得每一变量值的秩次,并用此秩次代替原有变量值的过程。秩转换的非参数检验秩转换的非参数检验第7页/共82页 秩和检验的方法-秩转换秩和检验的基本计算步骤:1.将数据(x)按大小转化为秩次(i),用秩次的大小反映变量值的大小。2.对各组”秩次”求和,称为秩和(T=i)。3.对各组秩和(T)做检验的方法称为秩和检验。第8页/共82页 例:秩转换的基本方法 将两组比较原始数据(X)混合按大小编秩,如x相同取平均秩,分别对各组的秩求和(T).甲组(x)3 5 10 20 22 秩和秩号(i)1 3
5、 5 7 8 T1=24乙组(x)4 9 15 25 35秩号(i)2 4 6 9 10 T2=31 总秩和T=10(10+1)/2=55第9页/共82页例:两组比较的等级数据编秩 A组 :、+、+、+、+秩(i):1 2 4.5 4.5 4.5 8.5秩和 :TA25 (组间相同,求平均秩)B组 :+、+、+、+、+、+秩(i):4.5 8.5 8.5 8.5 11 12 秩和 :TB53 (组内相同,不影响求秩和)总秩和:TA+TB=12(12+1)/2=78第10页/共82页秩次:在一定程度上反映了原始数据大小(等级)的信息。秩和:反映了一组数据在分布上的范围位置。平均秩次:反映一组数据
6、平均水平 A组平均秩次=23.5/6=3.92 B组平均秩次=54.5/6=9.08A组(x)3,5,7,9 11 14 (i)1 2 3 4 5 8.5 T=23.5B组(x)12 13 14 16 20 22 (i)6 7 8.5 10 11 12 T=54.5第11页/共82页非参数检验的应用场合非参数检验的应用场合计量资料:不满足参数检验的条件,且无适当的变量变换方法解决此问题时;分布类型无法获知的小样本计量资料;一端或两端存在不确定数值(如1000IU)的计量资料;等级资料:比较各组间等级强度的差别。第12页/共82页非参数检验的优缺点:优点:适用范围广 对数据要求不严 方法简便、易
7、于理解和掌握缺点:损失信息、检验效能低符合条件符合条件首选参数检验首选参数检验不符合条件不符合条件非参数检验非参数检验第13页/共82页第一节 配对样本比较的Wilcoxon符号秩检验第14页/共82页Wilcoxon符号秩检验简介符号秩检验简介符号秩检验由Wilcoxon于1945年提出;应用:配对样本差值的中位数与0比较;单个样本中位数与总体中位数(给定值)的比较。第15页/共82页符号秩检验的基本思想符号秩检验的基本思想在H0成立(两配对样本差值的总体中位数为0)的条件下,两配对样本的差值的正负及其绝对值的相对大小是随机的;在此情况下,正秩和与负秩和之间应当相近,差别不会太大;如果正秩和
8、与负秩和之间相差足够大,则可认为H0成立的可能性很小,从而加以拒绝。第16页/共82页1.1.配对样本差值的中位数与0 0比较 配对设计两组处理效应的比较配对设计两组处理效应的比较一般采用配对一般采用配对t t 检验,如果差数检验,如果差数严重偏离正态分布,可采用严重偏离正态分布,可采用Wilcoxon符号秩检验。符号秩检验。第17页/共82页例例8-1:两种方法测量:两种方法测量12份血清份血清ALT测量结果测量结果编号编号(1)原法原法(2)新法新法(3)差值差值d(4)=(3)-(2)16076162142152103195243484808225242240-2622022007190
9、205158253813919824345103844611236190-4612951005合计合计第18页/共82页例例8-1:两种方法测量:两种方法测量12份血清份血清ALT测量结果测量结果编号编号(1)原法原法(2)新法新法(3)差值差值d(4)=(3)-(2)正秩正秩(5)负秩负秩(6)160761682142152105319524348114808221.55242240-21.56220220071902051578253813691982434591038446411236190-4610129510053合计合计54.511.5第19页/共82页 第20页/共82页 第21
10、页/共82页例例8-1分析结果分析结果取负秩和为T,则T=11.5;查T界值表得0.05P25时,T分布近似正态分布可用正态近似法作u检验:第23页/共82页相同秩次较多时的校正值:注意注意:仍为非参数检验第24页/共82页2.2.配对设计等级资料的符号秩检验配对设计等级资料的符号秩检验1.把等级从弱到强转换成秩,如某指标的检测结果为-,+,+,+,可转化为相应的秩次1,2,3,4;2.求各对秩次的差值,省略所有差值为0的对子数,令余下的有效对子数为n;3.按n个差值编正秩与负秩,求正秩和与负秩和 注意:由于等级资料相同秩多,此时小样本的检验结果会存在偏性,最好用大样本。第25页/共82页3.
11、单个样本中位数和指定的单个样本中位数和指定的总体中位数比较总体中位数比较第26页/共82页例例8-2:12名工人尿氟含量与名工人尿氟含量与45.3比较比较尿氟含量尿氟含量(1)(1)-45.3(2)正秩正秩(3)负秩负秩(4)44.21-1.091.545.30046.391.091.549.474.17351.055.75453.167.86553.267.96654.379.07757.1611.86867.3722.07971.0525.751087.3742.0711合计合计64.51.5第27页/共82页假设检验过程假设检验过程u与配对资料符号秩检验基本相同。u此处先计算每一测量值与
12、给定的值的差数;u然后对此差数进行秩转换,进行与配对资料符号秩检验完全相同的操作过程。u此例得T=1.5,查表得P0.005;u拒绝H0,认为该厂工人的尿氟含量高于当地正常人的水平。第28页/共82页第二节 两个独立样本比较的 Wilcoxon秩和检验第29页/共82页Wilcoxon秩和检验秩和检验Wilcoxon秩和检验(rank sum test)用于推断计量资料或等级资料的两个独立样本所来自总体的分布位置是否有差别。对分布的形状不加考虑,因此应注意分布位置和分布(包括位置和形状)的区别。分布形状相同或类似的两个总体分布位置比较,可以简化地理解为两总体中位数的比较。第30页/共82页1.
13、1.计量资料两样本比较第31页/共82页例例8-3 两类肺病患者两类肺病患者RD值比较值比较肺癌病人肺癌病人矽肺矽肺0期工人期工人RD值值秩次秩次RD值值秩次秩次2.7813.232.53.232.53.5044.2074.0454.87144.1565.12174.2886.21184.3497.18194.47108.05204.64118.56214.75129.60224.82134.95155.1016n1=10T1=141.5n2=12T2=111.5第32页/共82页(1)建立检验假设,确定检验水)建立检验假设,确定检验水准准H0:两组患者RD值总体分布位置相同H1:肺癌病人RD
14、值高于矽肺0期工人RD值=0.05第33页/共82页(2)混合编秩,求统计量)混合编秩,求统计量Tu将两样本数据混合,从小到大排序;u对混合数据进行秩转换,获得每一观察值对应的秩次;u观察值相等者取平均秩次;u分别计算两样本的秩和;u取样本量较小者为n1,其秩和作为统计量T;u两样本量相等者任取其中一个作为统计量T(通常取秩和较小者)。第34页/共82页 若若H0成立,成立,T值应接近值应接近 ,若,若T值严重偏离值严重偏离 ,则提示,则提示H0可能是不正确的。小样本时,可能是不正确的。小样本时,查查T界值表。界值表。较小例数组的平均秩和为:较小例数组的平均秩和为:第35页/共82页(3)确定
15、)确定P值,作出结论值,作出结论若n110且n2-n110,可通过查阅T界值表(附表10)确定P值;若两样本量不满足上述条件,则可采用正态近似法作u检验,按公式(8-2)计算u值。第36页/共82页正态近似法正态近似法第37页/共82页例例8-3分析结果分析结果本例n1=10,n2-n1=2,T=T1=141.5,满足查T界值表的条件;查表得单侧0.025P0.05;拒绝H0,认为肺癌病人的RD值高于矽肺0期病人的RD值。第38页/共82页2.等级资料两样本比较等级资料两样本比较第39页/共82页例例8-4 吸烟和不吸烟工人吸烟和不吸烟工人HbCO含量比含量比较较含量含量吸烟吸烟不吸烟不吸烟合
16、计合计秩范围秩范围平均秩平均秩秩和秩和(1)(2)(3)(4)(5)(6)吸烟吸烟(7)=(2)(6)不吸烟不吸烟(8)=(3)(6)很低很低12313224低低8233143419152437中中161127356148768528偏高偏高10414627568.5685274高高404767977.53100合计合计39(n1)40(n2)791917(T1)1243(T2)第40页/共82页(1)建立检验假设,确定检验水)建立检验假设,确定检验水准准H0:两组工人HbCO含量总体分布位置相同H1:吸烟工人HbCO含量高于不吸烟工人=0.05第41页/共82页(2)混合编秩,求统计量)混合
17、编秩,求统计量Tu确定各等级的合计人数;u根据各等级的合计人数确定其秩次范围和平均秩;u分别计算两样本的秩和;u取样本量较小者为n1,其秩和(T1)作为统计量T;u根据公式(8-2)计算u值,执行u检验过程。第42页/共82页例例8-4分析结果分析结果本例n1=39,n2=40,T=T1=1917;计算得u=3.7023,查表得单侧P5或g3时,则H或Hc近似服从=g-1的卡方分布,可通过查阅卡方界值表确定P值。第51页/共82页例例8-5分析结果分析结果本例n1=n2=n3=5,N=15,满足查H界值表的条件;计算得H=9.74,查表得双侧P3,通过查卡方界值表(附表8)确定P值;第57页/
18、共82页例例8-7分析结果分析结果本例计算得H=14.28,Hc=15.52,查卡方界值表得双侧P0.005;拒绝H0,认为四种疾病患者痰液内噬酸粒细胞有差别。第58页/共82页秩和检验的两两比较方法有:1、Nemenyi法检验2、扩展的t检验3、q检验几种方法理论上仍存在争议,故几种方法理论上仍存在争议,故SASSAS、SPSSSPSS等软件没有提供这方面的分析等软件没有提供这方面的分析第59页/共82页3.多个独立样本两两比较的多个独立样本两两比较的Nemenyi检验检验第60页/共82页Nemenyi检验方法简介检验方法简介类似于多组样本比较方差分析的情形,当经过多个独立样本比较的Kru
19、skal-Wallis H检验拒绝H0之后,可进一步进行组间两两比较;Nemenyi检验即为执行此类统计学比较的方法之一。第61页/共82页例例8-8 小白鼠接种三种伤寒菌的存活小白鼠接种三种伤寒菌的存活日数日数9D11CDSC1存活日数存活日数秩次秩次存活日数存活日数秩次秩次存活日数存活日数秩次秩次22510.534.522510.5510.522615.5615.534.5615.5615.5Ri84169212ni10911Ri8.4018.7819.27第62页/共82页三组样本所来自的总体分布位置比较三组样本所来自的总体分布位置比较三组样本所来自的总体分布位置比较的操作过程与例8-5
20、完全相同;本例得Hc=9.97,P0.01,拒绝H0;认为接种三种伤寒杆菌的存活日数有差别;为进一步观察不同伤寒杆菌之间的差别,可进一步进行三组间的两两比较。第63页/共82页任意两组间分布位置的比较任意两组间分布位置的比较计算各组的平均秩和,根据公式(8-6)计算任意两组之间比较的卡方值;自由度取组数减一,即=g-1;查表确定相应的P值,进行统计推断。第64页/共82页例例8-8分析结果分析结果 ,0.025P0.05 ,0.01P0.025 ,0.99P15或处理组数g15时,则通过公式(8-8)进行近似卡方检验,确定P值。实际上当g4,或者g=4且n5,或者g=3且n9,即可采用近似卡方
21、检验方法。第72页/共82页例8-98-9分析结果本例计算得M=199.5,查M界值表得双侧P0.05;拒绝H0,认为四种频率声音刺激的反应率有差别。第73页/共82页2.多个相关样本两两比较的多个相关样本两两比较的q检验检验第74页/共82页q检验方法简介检验方法简介当经过多个相关样本比较的Friedman M检验拒绝H0之后,可进一步执行组间两两比较的操作;q检验可用以执行多个相关样本的两两比较过程。第75页/共82页q检验方法操作过程检验方法操作过程操作过程类似于方差分析组间两两比较的SNK-q检验;任意两组间比较的q值通过公式(8-9)和公式(8-10)计算;自由度=(n-1)(g-1
22、),样本跨度a是指g个样本秩和从小到大排序后所比较的两个秩和间所涵盖的秩和个数(包括二者本身);根据计算结果查阅q界值表(附表4),获得P值第76页/共82页例例8-9数据的两两比较结果数据的两两比较结果qaP频率频率A与频率与频率D比较比较7.872140.01频率频率A与频率与频率C比较比较5.322130.05频率频率B与频率与频率D比较比较5.752130.05第77页/共82页秩转换非参数检验小结秩转换非参数检验小结第78页/共82页1.参数检验与非参数检验的对比参数检验与非参数检验的对比参数检验参数检验秩转换的非参数检验秩转换的非参数检验针对原始数据进行分析针对原始数据进行分析针对
23、原始数据对应的秩次进行针对原始数据对应的秩次进行分析分析对总体参数进行估计对总体参数进行估计不估计总体参数不估计总体参数对总体参数进行假设检验对总体参数进行假设检验对总体分布位置进行假设检验对总体分布位置进行假设检验资料满足参数检验条件时,参资料满足参数检验条件时,参数检验效能较高数检验效能较高资料满足参数检验条件时,使资料满足参数检验条件时,使用非参数检验会导致检验用非参数检验会导致检验效能下降效能下降第79页/共82页2.参数检验和非参数检验的对应关系参数检验和非参数检验的对应关系比较类型比较类型参数检验参数检验非参数检验非参数检验单组样本与给定值比较单组样本与给定值比较单组样本单组样本t检验检验Wilcoxon符号秩检验符号秩检验配对样本比较配对样本比较配对配对t检验检验Wilcoxon符号秩检验符号秩检验两组独立样本比较两组独立样本比较成组成组t检验检验Wilcoxon秩和检验秩和检验多组独立样本比较多组独立样本比较单因素方差分析单因素方差分析Kruskal-Wallis秩和检验秩和检验随机区组设计多样本比较随机区组设计多样本比较两因素方差分析两因素方差分析Friedman M检验检验多组独立样本两两比较多组独立样本两两比较SNK-q检验等检验等Nemenyi检验检验第80页/共82页第81页/共82页感谢您的观看!第82页/共82页
限制150内