《08-等级资料分析.ppt》由会员分享,可在线阅读,更多相关《08-等级资料分析.ppt(46页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、八八 等级资料的分析等级资料的分析流行病与卫生统计学教研室流行病与卫生统计学教研室 赵华硕赵华硕Analysis of Ranked Data 1医学研究中的等级资料医学研究中的等级资料n疗疗 效:痊愈、显效、有效、无效、恶化效:痊愈、显效、有效、无效、恶化n化验结果:、化验结果:、+、+n体格发育:下等、中下、中等、中上、上等体格发育:下等、中下、中等、中上、上等n心功能分级:心功能分级:I、II、IIIn文化程度:小学、中学、大学、研究生文化程度:小学、中学、大学、研究生n营养水平:差、一般、好营养水平:差、一般、好2等级资料的特点等级资料的特点n既非呈连续分布的定量资料,也非仅按性既非呈
2、连续分布的定量资料,也非仅按性质归属于独立的若干类的定性资料;质归属于独立的若干类的定性资料;n比比“定量定量”粗,而比一般的粗,而比一般的“定性定性”细;细;n等级间既非等距,亦不能度量。等级间既非等距,亦不能度量。3内容内容n秩次与秩和秩次与秩和n两样本比较的秩和检验两样本比较的秩和检验n多组比较的秩和检验多组比较的秩和检验n配对符号秩和检验配对符号秩和检验n配伍设计的秩和检验配伍设计的秩和检验n多重比较多重比较n秩和检验的正确应用秩和检验的正确应用48.1 秩次与秩和秩次与秩和 n秩次秩次(rank),秩统计量秩统计量 是指全部观察值按某种顺序排列的位序是指全部观察值按某种顺序排列的位序
3、n秩和秩和(rank sum)同组秩次之和。同组秩次之和。5例8.1 编秩 A组:组:、+、+、+、+B组:组:+、+、+、+、+、+A组:组:-+B组:组:+1 2 3 4 5 76 8 9 10 11 12 1 2 4.5 4.5 4.5 8.54.5 8.5 8.5 8.5 11.5 11.56 秩和n A组:组:、+、+、+、+秩和:秩和:1 2 4.5 4.5 4.5 8.5 TA25 n B组:组:+、+、+、+、+、+秩和:秩和:4.5 8.5 8.5 8.5 11.5 11.5 TB53 TA+TB=N(N+1)/2=787n秩次:在一定程度上反映了等级的高低秩次:在一定程度上
4、反映了等级的高低n秩和:在一定程度上反映了等级的分布位置秩和:在一定程度上反映了等级的分布位置n对等级的分析,转化为对秩次的分析。秩和检验对等级的分析,转化为对秩次的分析。秩和检验就是通过秩次的排列求出秩和,进行假设检验就是通过秩次的排列求出秩和,进行假设检验n 秩变换秩变换:将等级变成秩次的方法将等级变成秩次的方法rank transformation8 8.2 两样本比较的秩和检验n检验假设检验假设 H0:A、B两组等级分布相同;两组等级分布相同;H1:A、B两组等级分布不同两组等级分布不同(相互偏离相互偏离)。=0.05。9基本思想n如果如果H0 成立,即两组分布位置相同,成立,即两组分
5、布位置相同,则则A组的实组的实际秩和应接近理论秩和际秩和应接近理论秩和n1(N+1)/2;(B组的实际秩和应接近理论秩和组的实际秩和应接近理论秩和n2(N+1)/2)。或相差不大。或相差不大。n如果相差较大,超出了预定的界值,则可认为如果相差较大,超出了预定的界值,则可认为H0不成立。不成立。10 A组组 B组组 和和 n实际秩和实际秩和 25 53 78 n理论秩和理论秩和 n1(N+1)/2 n2(N+1)/2 N(N+1)/2 39 39 78n差值差值 14 14 0 抽样误差?抽样误差?n如果如果H0成立,则理论秩和与实际秩和之差纯粹成立,则理论秩和与实际秩和之差纯粹由抽样误差造成。
6、由抽样误差造成。11 检验结果检验结果n如果如果H0成立,则按成立,则按0.05水准,水准,A 组秩和之界值为组秩和之界值为2652。n现现A组组的的实实际际秩秩和和为为25,在在界界值值之之外外,故故拒拒绝绝H0,接受接受H1,认为两组的分布位置不同。认为两组的分布位置不同。12 秩和检验的结论判断秩和检验的结论判断nA组的实际秩在界值之外,则拒绝组的实际秩在界值之外,则拒绝H0,接受接受H1。(小于小于或等于或等于下界,大于下界,大于或等于或等于上界上界)nA组的实际秩在界值之内,则不拒绝组的实际秩在界值之内,则不拒绝H0。(大于下界且小于上界大于下界且小于上界)13某药对两种病情的慢性支
7、气管炎病人的疗效比较某药对两种病情的慢性支气管炎病人的疗效比较14检验步骤检验步骤(一一)nH0:两型老慢支疗效分布相同;两型老慢支疗效分布相同;nH1:两型老慢支两型老慢支疗疗效分布不同。效分布不同。n =0.05。n编秩编秩 15n求秩和求秩和 T1 、T2n确定检验统计量确定检验统计量T n110或或n2-n110时时,正态近似法正态近似法 检验步骤检验步骤(三三)17正态近似法正态近似法18P20.005,2,P0.005 按按 =0.05水准拒绝水准拒绝H0,接受接受H1,认为三药疗效有差别。认为三药疗效有差别。258.4 配对符号秩和检验配对符号秩和检验nWilcoxon符号秩和检
8、验符号秩和检验n计算等级之差值,对差值计算等级之差值,对差值绝对值绝对值进行编秩,并进行编秩,并冠以差值的符号。冠以差值的符号。n查查 T 界值表,或用近似界值表,或用近似 u 检验,计算检验,计算 P 值;值;n界定界定 P 值,作出结论。值,作出结论。26符号秩和检验的假设符号秩和检验的假设H0:差值的总体中位数为差值的总体中位数为0;H1:差值的总体中位数不为差值的总体中位数不为0。=0.05。当当n50时,查界值表时,查界值表(附表附表10)当当n50时,用时,用u近似近似27扁平足疗效例扁平足疗效例 用配对设计观察两种方法治疗扁平足效果记录如下,问那种方法好。用配对设计观察两种方法治
9、疗扁平足效果记录如下,问那种方法好。病例号病例号 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 A法法 好好 好好 好好 好好 差差 中中 好好 好好 中中 差差 好好 差差 好好 中中 好好 中中 B法法 差差 好好 差差 中中 中中 差差 中中 差差 中中 差差 好好 差差 中中 差差 中中 差差2829检验步骤检验步骤(一)n建立假设建立假设nH0:两法疗效差值的总体中位数为0;nH1:差值的总体中位数不为0。n建立检验水准建立检验水准n=0.05 30n计算检验统计量计算检验统计量n编秩:n求秩和:T=61.5,T=4.5 n确定检验统计量T:T或T作为
10、统计量T 检验步骤检验步骤(二)31n界定界定P 值值n本例T=61.5,T=4.5,已超出附表10中双侧P0.01相对应的界值561,故得P 0.01。n结论结论n按=0.05水准拒绝H0,接受H1,认为两种方法疗效的总体分布不同。结合资料可认为A法优于B法。检验步骤检验步骤(三)32符号秩和检验的基本思想符号秩和检验的基本思想n总秩和为总秩和为TN(N+1)/2n如如H0成立,则正负各半,成立,则正负各半,T+与与 T 均接均接近近 N(N+1)/4。n如果相差太大,超出了事先规定的界值,如果相差太大,超出了事先规定的界值,则则H0不成立。不成立。33符号秩和检验 T 界值表N=11 双侧
11、 单侧 1353 0.10 0.05 10 56 0.05 0.025 7 59 0.02 0.01 5 61 0.01 0.005 间距 40 46 52 5611(11+1)/4=33(理论值)34u 的校正n当重复的秩次较多时,当重复的秩次较多时,u 需要校正:需要校正:35配伍设计的秩和检验n配伍设计n使用范围36评委评委白兰地白兰地W白兰地白兰地X白兰地白兰地Y白兰地白兰地ZA四四(4)二二(2)一一(1)三三(3)B四四(4)一一(1)二二(2)三三(3)C三三(3)一一(1)二二(2)四四(4)D四四(4)二二(2)三三(3)一一(1)E三三(3)一一(1)二二(2)四四(4)R
12、i1871015 五位评委对五位评委对4 4种葡萄酒作等级评定种葡萄酒作等级评定(一至四级一至四级)37n将每一配伍组的数据由小到大编秩,相同值将每一配伍组的数据由小到大编秩,相同值 取平均取平均;n分别求出各处理组的秩和分别求出各处理组的秩和 ;n将有关数据带入公式。将有关数据带入公式。确定确定P值值(p.347)b=5,k=4,查表查表13,当当b或或k超出表的范围,超出表的范围,M近似服从近似服从38当有相同秩次,且当有相同秩次,且M 按近似按近似 分布进行推断时需分布进行推断时需校正:校正:39两两比较(两两比较(q检验)检验)1、建立检验假设、建立检验假设 H0:对任两种葡萄酒评判结
13、果的总体分布相同对任两种葡萄酒评判结果的总体分布相同 H1:对任两种葡萄酒评判结果的总体分布不同或不对任两种葡萄酒评判结果的总体分布不同或不全同全同2、计算统计量、计算统计量 将各处理组的秩和从大到小排列将各处理组的秩和从大到小排列:18 15 10 7 组次 1 2 3 4 原组 W Z Y X40 对四种酒评价结果的两两比较对四种酒评价结果的两两比较对比组对比组 组数组数 两秩和之差两秩和之差 P A与与B a1与与4 4 18-7 3.8105 P0.051与与2 2 18-15 1.0392 P0.052与与4 3 15-7 2.7713 P0.052与与3 2 15-10 1.732
14、1 P0.053与与4 2 10-7 1.0392 P0.05413、确定、确定P值值 以以 查查 q 值表值表(P.342)4、统计推断统计推断 按按 水准,水准,428.6 秩和检验的正确应用秩和检验的正确应用n主要对等级资料进行分析;主要对等级资料进行分析;n秩和检验可用于任意分布秩和检验可用于任意分布(distribution free)的资料;的资料;nT检验与检验与H检验的关系检验的关系 H检验检验 T检验检验 n=2 F检验检验 t检验检验43秩和检验用于定量资料秩和检验用于定量资料n 计量资料中:计量资料中:n 极度偏态资料,或个别数值偏离过大极度偏态资料,或个别数值偏离过大n
15、 各组离散度相差悬殊各组离散度相差悬殊n 资料中含有不确定值资料中含有不确定值n 大于大于5年年 n 0.001n 1:1024以上以上 n 兼有等级和定量性质的资料兼有等级和定量性质的资料44参数检验与非参数检验参数检验与非参数检验n在在总体的分布类型已知的条件下,对总体的分布类型已知的条件下,对总体的参数总体的参数进行进行检验,称为检验,称为参数检验参数检验。n在总体的分布类型未知或者不考虑总体的分布的条件在总体的分布类型未知或者不考虑总体的分布的条件下,对下,对总体的分布总体的分布进行检验,称为进行检验,称为非参数检验非参数检验。n适用于任意分布类型的资料,不受总体分布的制约。适用于任意分布类型的资料,不受总体分布的制约。45成组设计两样本比较成组设计两样本比较n如如资资料料满满足足 t 检检验验的的条条件件,应应该该用用 t 检检验验进进行行分分析析。此此时时,如如果果对对这这类类资资料料用用Wilcoxon秩秩和和检检验验,实实际际上上是是将将观观察察单单位位的的具具体体数数值值舍舍弃弃不不用用,只只保保留留了了秩秩次次的的信信息息,使使检检验验功功效效降降低低;尤其样本含量较小时,降低更加明显。尤其样本含量较小时,降低更加明显。n如资料不满足如资料不满足 t 检验的条件,而用了检验的条件,而用了t 检验,检验,同样降低了检验效能。同样降低了检验效能。46
限制150内