非参数统计方法课件.ppt
《非参数统计方法课件.ppt》由会员分享,可在线阅读,更多相关《非参数统计方法课件.ppt(57页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、第八章第八章秩转换的非参数检验秩转换的非参数检验 已知已知已知已知总体分布类型总体分布类型总体分布类型总体分布类型,对,对,对,对未知参数(未知参数(未知参数(未知参数(、)进行进行进行进行统计推断统计推断统计推断统计推断依赖于特定分布类依赖于特定分布类依赖于特定分布类依赖于特定分布类型,型,型,型,比较的是参数比较的是参数比较的是参数比较的是参数 参数统计参数统计(parametric statisticsparametric statistics)非参数统计非参数统计(nonparametric statisticsnonparametric statistics)对总体的分布类对总体的分
2、布类对总体的分布类对总体的分布类型型型型不作任何要求不作任何要求不作任何要求不作任何要求 不受总体参数的影响,不受总体参数的影响,不受总体参数的影响,不受总体参数的影响,比较分布或分布位置比较分布或分布位置比较分布或分布位置比较分布或分布位置 适用范围广;可用于任何类型适用范围广;可用于任何类型适用范围广;可用于任何类型适用范围广;可用于任何类型资料资料资料资料(等级资料,或等级资料,或等级资料,或等级资料,或“50mg”50mg”)对于符合参数统计分析条件者,采用对于符合参数统计分析条件者,采用非参数统计分析,其非参数统计分析,其检验效能较低检验效能较低 参数检验与非参数检验s在在总体的分布
3、类型已知的条件下,对总体的分布类型已知的条件下,对总体的参数总体的参数进行进行检验,称为检验,称为参数检验参数检验。s在总体的分布类型未知或者不考虑总体的分布的条件在总体的分布类型未知或者不考虑总体的分布的条件下,对下,对总体的分布总体的分布进行检验,称为进行检验,称为非参数检验非参数检验。非参数统计方法非参数统计方法s适用范围广,特别适用于:适用范围广,特别适用于:s1.数据分布未知、偏态分布、组间的方差不齐、资料数据分布未知、偏态分布、组间的方差不齐、资料中含有不确定值的中含有不确定值的计量资料计量资料组间的比较。组间的比较。s2.当比较的数据只能用严重程度、优劣等级的当比较的数据只能用严
4、重程度、优劣等级的半定量半定量(等级)资料组间的比较。(等级)资料组间的比较。s上述数据组间比较的统计检验方法上述数据组间比较的统计检验方法秩和检验秩和检验对于计量资料,若不满足正态和方差齐性条件,这对于计量资料,若不满足正态和方差齐性条件,这时小样本资料选时小样本资料选t检验或检验或F检验是不妥的,而选秩转换检验是不妥的,而选秩转换的非参数检验是恰当的。的非参数检验是恰当的。对于分布不知是否正态的小样本资料,为保险起见,对于分布不知是否正态的小样本资料,为保险起见,宜选秩转换的非参数检验。宜选秩转换的非参数检验。注注 意意对于一端或二端是不确定数值(如对于一端或二端是不确定数值(如0.5等)
5、等)的资料,不管是否正态分布,只能选秩转换的非参的资料,不管是否正态分布,只能选秩转换的非参数检验。数检验。对于等级资料,若选行对于等级资料,若选行列表资料的列表资料的2 2检验,只能检验,只能推断构成比差别,而选秩转换的非参数检验,可推推断构成比差别,而选秩转换的非参数检验,可推断等级强度差别。断等级强度差别。秩次与秩和 s秩次秩次(rank),秩统计量秩统计量 是指全部观察值按某种顺序排列的位序;是指全部观察值按某种顺序排列的位序;s秩和秩和(rank sum)同组秩次之和。同组秩次之和。编 秩 A组:、+、+、+、+B组:+、+、+、+、+、+A组:组:-+B组:组:+1 2 3 4 5
6、 76 8 9 10 11 12 1 2 4.5 4.5 4.5 8.54.5 8.5 8.5 8.5 11.5 11.5 秩和s A组:组:、+、+、+、+秩和:秩和:1 2 4.5 4.5 4.5 8.5 TA25 s B组:组:+、+、+、+、+、+秩和:秩和:4.5 8.5 8.5 8.5 11.5 11.5 TB53 TA+TB=N(N+1)/2=78s秩次:在一定程度上反映了等级的高低;秩次:在一定程度上反映了等级的高低;s秩和:在一定程度上反映了等级的分布位置。秩和:在一定程度上反映了等级的分布位置。s对等级的分析,转化为对秩次的分析。秩和检验对等级的分析,转化为对秩次的分析。秩
7、和检验就是通过秩次的排列求出秩和,进行假设检验。就是通过秩次的排列求出秩和,进行假设检验。其特点是假设检验的结果对总体分布的形状差别其特点是假设检验的结果对总体分布的形状差别不敏感,只对总体分布的位置差别敏感。不敏感,只对总体分布的位置差别敏感。第一节第一节 配对样本比较的配对样本比较的 Wilcoxon符号秩检验符号秩检验 用于配对样本差值的中位数和用于配对样本差值的中位数和0比较;还比较;还可用于单个样本中位数和总体中位数比较。可用于单个样本中位数和总体中位数比较。例例8-1 对对12份血清分别用原方法(检测时间份血清分别用原方法(检测时间20分钟)和新方分钟)和新方法(检测时间法(检测时
8、间10分钟)测谷分钟)测谷-丙转氨酶,结果见表丙转氨酶,结果见表8-1的(的(2)、)、(3)栏。问两法所得结果有无差别?)栏。问两法所得结果有无差别?1H0:差值的总体中位数差值的总体中位数Md=0 H1:差值的总体中位数差值的总体中位数Md 0;=0.052求差值;依其绝对值从小到大编秩次求差值;依其绝对值从小到大编秩次(i)绝对值相等者(绝对值相等者(tie)取平均秩次;取平均秩次;(ii)将差值的正负标在秩次之前;将差值的正负标在秩次之前;(iii)零差值时秩次正负各半(或不参与编秩)零差值时秩次正负各半(或不参与编秩)3分别求正、负秩次之和,以绝对值较小者为分别求正、负秩次之和,以绝
9、对值较小者为T值值4根据统计量根据统计量T确定对应的确定对应的P值值(i)小样本时,查表(附表小样本时,查表(附表9)(ii)大样本时,正态近似大样本时,正态近似 符号秩和检验的基本思想总秩和为总秩和为TN(N+1)/2如如H0成立,则正负各半,成立,则正负各半,T+与与 T 均接近均接近 N(N+1)/4。如果相差太大,超出了事先规定的界值,如果相差太大,超出了事先规定的界值,则则H0不成立。不成立。(i)小样本(小样本(n50)时,查附表时,查附表9 界值的判断标准:界值的判断标准:若值在T上、下界值范围内时,时,P0.05,若T值恰好等于界值时时,P=0.05若T值在上、下界值范围外时,
10、时,P50)时,可采用正态近似时,可采用正态近似 n是对子数是对子数,t tj j为第为第j j个个相同秩次的个数。相同秩次的个数。本例本例T=11.5,n=11;相同秩次中有两个相同秩次中有两个1.51.5,则,则t t=2=2,代入上式计算得:代入上式计算得:u u 1.96,0.05,在在 水准上接受水准上接受H H0 0,拒绝拒绝H H1 1,结论与查结论与查表法相同。表法相同。注意注意:符号秩检验若用于配对的等级资料,则先把等符号秩检验若用于配对的等级资料,则先把等级从弱到强转换成秩(级从弱到强转换成秩(1,2,3,);然后求各对秩的);然后求各对秩的差值,省略所有差值为差值,省略所
11、有差值为0的对子数,令余下的有效对的对子数,令余下的有效对子数为子数为n n;最后按最后按n n个差值编正秩和负秩,求正秩和个差值编正秩和负秩,求正秩和或负秩和。但对于等级资料,相同秩多,小样本的或负秩和。但对于等级资料,相同秩多,小样本的检验结果会存在偏性,最好用大样本。检验结果会存在偏性,最好用大样本。2单个样本中位数和总体中位数比较单个样本中位数和总体中位数比较 目的是推断样本所来自的总体中位数目的是推断样本所来自的总体中位数M和某个和某个已知的总体中位数已知的总体中位数M0是否有差别。用样本各变量是否有差别。用样本各变量值和值和M0的差值,即推断差值的总体中位数的差值,即推断差值的总体
12、中位数M和和0是是否有差别。否有差别。例例8-2 已知某地正常人尿氟含量的中位数为已知某地正常人尿氟含量的中位数为45.30。今在。今在该地某厂随机抽取该地某厂随机抽取12名工人,测得尿氟含量见表名工人,测得尿氟含量见表8-2第第(1)栏。问该厂工人的尿氟含量是否高于当地正常人的)栏。问该厂工人的尿氟含量是否高于当地正常人的尿氟含量?尿氟含量?解解:1.检验假设和检验水准检验假设和检验水准:H0:该厂工人尿氟含量的总体中位数该厂工人尿氟含量的总体中位数M=45.30=45.30H1:M45.3045.30=0.05=0.052.2.编秩、求统计量编秩、求统计量T:所有观察值与总体中位数所有观察
13、值与总体中位数45.3045.30之差,按绝对值由小到之差,按绝对值由小到大编秩,绝对值相同取平均秩次,然后分别计算正负秩大编秩,绝对值相同取平均秩次,然后分别计算正负秩次之和,即表次之和,即表8-2第(第(3)、()、(4)栏。)栏。据表据表8-2第(第(3)、()、(4)栏,)栏,T T+=64.5=64.5,T T-=1.5=1.5,取取T T=1.5=1.5。3.3.查表、做结论查表、做结论有效差值个数有效差值个数n n=11=11。据。据n n=11=11和和T T=1.5=1.5查附表查附表9,得单侧,得单侧P P0.050.05,按,按=0.05=0.05水准拒绝水准拒绝H H0
14、 0 ,接受接受H H1 1 ,可认为该厂可认为该厂工人的尿氟含量高于当地正常人的尿氟含量。工人的尿氟含量高于当地正常人的尿氟含量。第二节第二节 两独立样本差别的秩和检验两独立样本差别的秩和检验Wilcoxon rank sum test 对对于于计计量数据,如果量数据,如果资资料料方差相等方差相等,且服从,且服从正正态态分布,就可以用分布,就可以用t检验检验比比较较两两样样本均数。本均数。如果如果此假定不成立或不能确定是否成立,就应采用秩此假定不成立或不能确定是否成立,就应采用秩和检验来分析两样本是否来自同一总体。和检验来分析两样本是否来自同一总体。Wilcoxon秩和检验(秩和检验(Wil
15、coxon rank sum test),用于推用于推断计量资料或等级资料的两个独立样本所来自的两个总体分断计量资料或等级资料的两个独立样本所来自的两个总体分布是否有差别。布是否有差别。秩和检验的目的是推断两个总体分布的位置是否有差别,秩和检验的目的是推断两个总体分布的位置是否有差别,如要推断两个不同人群的某项指标值的大小是否有差别或哪如要推断两个不同人群的某项指标值的大小是否有差别或哪个人群的大,可用其指标值分布的位置差别反映,而不关心个人群的大,可用其指标值分布的位置差别反映,而不关心其指标值分布的形状有无差别。两个总体分布位置不同,实其指标值分布的形状有无差别。两个总体分布位置不同,实际
16、情况一般是两个总体分布形状相同或类似,这时可简化为际情况一般是两个总体分布形状相同或类似,这时可简化为两个总体中位数不等;两个总体中位数不等;基本思想基本思想两样本来自同一总体两样本来自同一总体 任一组秩和不应太大或太小任一组秩和不应太大或太小 如果两如果两总体分总体分布相同布相同 假定:两组样本的总体分布形状相同假定:两组样本的总体分布形状相同 T T 与与平均平均秩和秩和 应相差不大应相差不大 基本思想s如果如果H0 成立,即两组分布位置相同,成立,即两组分布位置相同,则则A组的实际秩和应接近理论秩和组的实际秩和应接近理论秩和n1(N+1)/2;(B组的实际秩和应接近理论秩和组的实际秩和应
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 参数 统计 方法 课件
限制150内