第十一章非参数检验课件.pptx
第十一章非参数检验第1页,此课件共58页哦第十一章 非参数检验第2页,此课件共58页哦一、非参数检验(一)什么是“非参数”非参数模型:非参数模型:缺乏总体分布模式的信息缺乏总体分布模式的信息。(二)非参数检验的定义非参数检验:非参数检验:不需要假设总体是否为正态分布或方差不需要假设总体是否为正态分布或方差是否为齐性的假设检验是否为齐性的假设检验称非参数检验。称非参数检验。第一节 非参数检验的基本概念及特点第3页,此课件共58页哦(三)非参数检验的优点和缺点1、优点:n一般不涉及总体参数,其假设前提也比参数假设一般不涉及总体参数,其假设前提也比参数假设检验少得多,检验少得多,适用面较广适用面较广。n计算简便计算简便。2、缺点:n统计效能远不如参数检验方法。统计效能远不如参数检验方法。由于当数据满足假由于当数据满足假设条件时,参数统计检验方法能够从其中广泛地充设条件时,参数统计检验方法能够从其中广泛地充分地提取有关信息。非参数统计检验方法对数据的分地提取有关信息。非参数统计检验方法对数据的限制较为宽松,只能从中提取一般的信息限制较为宽松,只能从中提取一般的信息,相对参相对参数统计检验方法会浪费一些信息。数统计检验方法会浪费一些信息。第4页,此课件共58页哦(四)非参数检验的特点1 1、它不需要严格的前提假设;、它不需要严格的前提假设;2 2、特别适用于顺序数据;、特别适用于顺序数据;3 3、适用于小样本,且方法简单;、适用于小样本,且方法简单;4 4、最大的不足是不能充分利用资料的全部信息;、最大的不足是不能充分利用资料的全部信息;5 5、不能处理、不能处理“交互作用交互作用”,即多因素情况。,即多因素情况。第5页,此课件共58页哦第6页,此课件共58页哦常用非参常用非参数检验数检验两样本差两样本差异比较异比较独立样本独立样本相关样本相关样本秩和检验法秩和检验法中数检验法中数检验法多样本差多样本差异比较异比较完全随机设计:克完全随机设计:克瓦氏单向方差分析瓦氏单向方差分析随机区组设计:弗里德曼双向等级方差分析随机区组设计:弗里德曼双向等级方差分析符号检验法符号检验法符号等级检验法符号等级检验法第7页,此课件共58页哦 一、秩和检验法 秩和检验法秩和检验法也叫也叫Mann-Whitney-Wilcoxon检验,简称检验,简称M-W-W检验,也称检验,也称Mann-Whitney U检验。检验。秩和即秩次的和或等级之和。秩和即秩次的和或等级之和。与参数检验法中独立样本的与参数检验法中独立样本的t检验法相对应。;检验法相对应。;当两个样本都为定序(顺序)变量时,也需使用秩和法进当两个样本都为定序(顺序)变量时,也需使用秩和法进行差异显著性检验。行差异显著性检验。第二节 两个独立样本的非参数检验方法第8页,此课件共58页哦(一)秩统计量 秩统计量指样本数据的排序等级秩统计量指样本数据的排序等级。假设从总体中反复抽取样本,就能得到一个对假设从总体中反复抽取样本,就能得到一个对应于样本容量应于样本容量n n1 1和和n n2 2的秩和的秩和U U的分布。这是一个间断而的分布。这是一个间断而对称的分布。对称的分布。当当n n1 1和和n n2 2都大于都大于1010时,秩和的时,秩和的U U分布近似于正态分布分布近似于正态分布。第9页,此课件共58页哦(二)计算过程1、小样本:两个样本容量均小于10(n1 10,n2 10)(1 1)排序:)排序:所有数据混合由小到大等级排列;所有数据混合由小到大等级排列;(2 2)计算统计量)计算统计量T T:把样本容量较小的样本中各数据的等级相加,以把样本容量较小的样本中各数据的等级相加,以T T表表示;如果两样本容量相等,则取等级和较小的为示;如果两样本容量相等,则取等级和较小的为T T表示。表示。(3 3)比较与决策:)比较与决策:把把T T值与秩和检验表(附表值与秩和检验表(附表1414)中的临界值比较,)中的临界值比较,若若T T T1T1或或T T T2T2,则表明两样本差异显著;若,则表明两样本差异显著;若T1 T1 T T T2,T2,则意味着则意味着两样本差异不显著。两样本差异不显著。第10页,此课件共58页哦例例11111 1:在一项关于模拟训练的实验中,以技工学校的学生:在一项关于模拟训练的实验中,以技工学校的学生为对象,对为对象,对5 5名学生用针对某一工种的模拟器进行训练,名学生用针对某一工种的模拟器进行训练,内外让内外让6 6名学生下车间直接在实习中训练,经过同样的时间名学生下车间直接在实习中训练,经过同样的时间后对两组人进行该工种的技术操作考核,结果如下:后对两组人进行该工种的技术操作考核,结果如下:模拟器组:模拟器组:5656,6262,4242,7272,7676实习组:实习组:6868,5050,8484,7878,4646,9292假设两组学生初始水平相同,则两种训练方式有无显著差假设两组学生初始水平相同,则两种训练方式有无显著差异?异?第11页,此课件共58页哦(1)建立假设 H0:,即两样本无显著差异,即两样本无显著差异 H1:,即两样本有显著差异,即两样本有显著差异(2)计算统计量1)将数据从小到大排列,见下表。将数据从小到大排列,见下表。2)混合排列等级,即将两组数据视为一组进行等级)混合排列等级,即将两组数据视为一组进行等级排列,见上表。排列,见上表。3)计算各组的秩和,并确定值,即)计算各组的秩和,并确定值,即 T=min(T1,T2)=min(25,41)=2521RR21RR第12页,此课件共58页哦表11-1 两种训练方式的成绩 考核成绩考核成绩成绩排列成绩排列等级等级等级和等级和模拟器组模拟器组(5人)人)56421T1256256442625 72727 76768实习组实习组68462T241(6人)人)50503 84686 78789 468410 929211第13页,此课件共58页哦(3)比较与决策 查秩和检验表,当查秩和检验表,当n1=5,n2=6,T1=19,T2=41,因为因为 192541,即即T1TT2,所以接受虚无假设,拒绝研究假设,差异不显著。所以接受虚无假设,拒绝研究假设,差异不显著。说明两种训练的成绩无显著差异。说明两种训练的成绩无显著差异。第14页,此课件共58页哦n其检验值为:其检验值为:n 2、大样本:当n1和n2都大于10时,秩和的U分布近期近似正态分布,其平均数为:,其平均数为:n其标准差为:其标准差为:21211nnnT1212121nnnnTTTTZ第15页,此课件共58页哦例例112:对某班学生进行注意稳定性实验男生与女生的实:对某班学生进行注意稳定性实验男生与女生的实验结果如下,试检验男女生之间注意稳定性有否显著差异?验结果如下,试检验男女生之间注意稳定性有否显著差异?男生:(男生:(n1=14)19,32,21,34,19,25,25,31,31,27,22,26,26,29 女生:(女生:(n217)25,30,28,34,23,25,27,35,30,29,29,33,35,37,24,34,32第16页,此课件共58页哦n检验过程检验过程:(1)建立假设)建立假设 H0:H1:(2)计算统计量)计算统计量1)求秩和。先混合排列等级,再计算和。排序如下:男生:女生:,17 5.11 5.11 4 5.13 5.21 5.21 5.8 5.8 5.1 27 3 5.23 5.15.23 27 6 31 5.29 25 17 17 5.19 5.29 5.13 5.8 5 27 15 5.19 5.8,21RR21RR174 175.115.1145.135.215.215.85.8 5.1 273 5.23 5.1T第17页,此课件共58页哦2)求)求Z值值3)比较与决策)比较与决策 ,pMdn 的次数的次数10105 51515 r0.05。所以差异不显著,接受虚无假设,不能认为新法。所以差异不显著,接受虚无假设,不能认为新法显著优于传统方法。显著优于传统方法。r与临界值(CR)比较P值差异显著性rr0.05r0.01rr0.05rr0.01P0.050.01P0.05P0.01不显著显 著极显著第31页,此课件共58页哦2、大样本(样本容量N25时)n+和和n-服从二项分布,当服从二项分布,当N25时,将二项分布近似时,将二项分布近似看成正态分布。根据二项分布的原理,有看成正态分布。根据二项分布的原理,有:21qpNNp2122121NNNpq检验统计量:rZ22NNr 校正公式:2205.0NNrZ第32页,此课件共58页哦例例11115 5:在教学评价活动中,要求学生对教师的教:在教学评价活动中,要求学生对教师的教学进行学进行7 7点评价(即点评价(即1 17 7分),表格(分),表格(P352P352)是某班学)是某班学生对一位教师期中与期末的两次评价结果,试问两次结生对一位教师期中与期末的两次评价结果,试问两次结果差异是否显著?果差异是否显著?第33页,此课件共58页哦解:解:1)建立假设)建立假设单侧检验H0:P+P-Ha:P+P-2)确定正、负号数目,正负号总数)确定正、负号数目,正负号总数N的的r值值。统计符号总数N。符号总数中不包含0,只包括正号和负号个数和,即 =8+19=27 将n+和n-中的较小者记为r,即nnN8)19,8min(r第34页,此课件共58页哦3)计算统计量计算统计量4)比较与决策比较与决策 ,p0.05,接受虚无假设,差异不显著。不能认为期中、期末两次评价结果有显著差异。92.12/272/27)5.08(Z2/05.092.1ZZ第35页,此课件共58页哦二、符号等级检验法(一)适用条件 维尔克松符号等级检验法(维尔克松符号等级检验法(Wilcoxon Signed-Rank Wilcoxon Signed-Rank testtest)又称符号秩和检验。其使用条件与符号检验法相)又称符号秩和检验。其使用条件与符号检验法相同,也适合于配对比较,但它的精度比符号检验法高,同,也适合于配对比较,但它的精度比符号检验法高,因为它因为它不仅仅考虑差值的符号还同时考虑差值大小不仅仅考虑差值的符号还同时考虑差值大小。目的是推断配对样本差值的目的是推断配对样本差值的总体中位数总体中位数是否和是否和0 0有差有差别,即推断配对的两个相关样本所来自的两个总体中位数别,即推断配对的两个相关样本所来自的两个总体中位数是否有差别。是否有差别。第36页,此课件共58页哦(二)步骤1、N 25(小样本)(1)把相关样本对应数据之差值按绝对值从小到大作等级)把相关样本对应数据之差值按绝对值从小到大作等级排列(注意差值为零时,零不参加等级排列);排列(注意差值为零时,零不参加等级排列);(2)在各等级前面添上原来的正负号;)在各等级前面添上原来的正负号;(3)分别求出带正号的等级和()分别求出带正号的等级和(T)与带负号的等级)与带负号的等级和(和(T),取两者之中较小的记作),取两者之中较小的记作T;(4)根据)根据N,T查符号等级检验表,当查符号等级检验表,当T大于表中临界值时大于表中临界值时表明差异不显著;小于临界值时说明差异显著。表明差异不显著;小于临界值时说明差异显著。第37页,此课件共58页哦例例11-6:11-6:某幼儿园对某幼儿园对1010名儿童在刚入园时和入园一年后均名儿童在刚入园时和入园一年后均进行了血色素检查,结果如下,试问两次检查有否明显变进行了血色素检查,结果如下,试问两次检查有否明显变化?化?第38页,此课件共58页哦解:1)建立假设)建立假设 H0:H1:.2)求成对数据的差数求成对数据的差数D值值,见上表。3)按)按 排列顺序(不包括排列顺序(不包括0)并添加符号。并将原来差值的正负)并添加符号。并将原来差值的正负号添加在等级前。号添加在等级前。4)计算正号等级和(计算正号等级和(T+)与负号等级和()与负号等级和(T-),并取较小者为值),并取较小者为值,即 T1+6+2+514;T+=8+4+3+7+9=31 =TT TTDTTT,min1414,31min第39页,此课件共58页哦5)根据符号总数,查符号秩序临界值表,进行比较与决策根据符号总数,查符号秩序临界值表,进行比较与决策:当 N=5+4时,。因为,T=146,p0.05,接受虚无假设,拒绝研究假设,差异不显著。说明入园时与入园一年幼儿的血色素没有明显变化。T与临界值(CR)比较P值差异显著性TT0.05T0.01TT0.05TT0.01P0.050.01P0.05P0.01不显著显 著极显著nnN605.0T第40页,此课件共58页哦2、N25(大样本)当当N25时,一般认为时,一般认为T的分布接近正态分布,其平的分布接近正态分布,其平均数和标准差分别为均数和标准差分别为:TTTTNNNNN检验进行TZZ24121,4)1(第41页,此课件共58页哦 若出现相同等级较多(超过25%)时,应采用校正统计量Z:48)(24)12)(1(5.04/)1(3jjcttnnnnnTZ第42页,此课件共58页哦例例11117 7:对例:对例11115 5进行符号等级检验。进行符号等级检验。序号期中x期末yX-y秩次添号136-321-21227-527-2735416+6415-424.5-24.553216+6623-16-6713-215.5-15.5837-424.5-24.593216+61013-215.5-15.511330001212-16-6135416+61426-424.5-24.51536-321-211614-321-211753215.5+15.51812-16-61946-215.5-15.5203216+62137-424.5-24.52212-16-62313-215.5-15.52446-215.5-15.52535-215.5-15.52653215.5+15.5274316+62856-16-6第43页,此课件共58页哦解:1)建立假设)建立假设 H0:正负号等级和无显著差异。即入园时和入园一年没有显著差异,。H1:正负号等级和有显著关系。即入园时和入园一年有显著差异,。2)确定)确定T值值 T67,T311TT67),min(TTTT TT第44页,此课件共58页哦3)计算统计量计算统计量 求均数求均数 求标准差 求Z值 ,p0.05,拒绝虚无假设,接受研究假设,差异显著。说明对该教师的两次评价有显著差异。1894)127(27TU6.4124)154()127(27T93.26.4118967Z93.2Z96.1205.0Z第45页,此课件共58页哦一、克瓦氏单向方差分析(一)适用条件 当实验是按当实验是按完全随机方式分组设计完全随机方式分组设计,且所得数据资,且所得数据资料又料又不符合参数方法中的方差分析不符合参数方法中的方差分析所需假设条件时,所需假设条件时,可进行克瓦氏单向方差分析,即可进行克瓦氏单向方差分析,即Kruskal and Wallis方差分析,也称方差分析,也称H检验检验。第四节 等级方差分析第46页,此课件共58页哦(二)检验步骤1、当K=3 且ni 5时K1iiii12nNN R n ;K13112总样本量,某组数据的等级和;某组的样本容量;分组数式中KiiiNnRNNH第47页,此课件共58页哦例例118:有有 11名学生分别来自教师、工人和干部家名学生分别来自教师、工人和干部家庭,进行创造力测验的结果如下,试问家长的职业与庭,进行创造力测验的结果如下,试问家长的职业与学生创造力有否某些联系?学生创造力有否某些联系?第48页,此课件共58页哦1)将数据进行排序,计算)将数据进行排序,计算 ,见下表。,见下表。R教师家庭工人家庭干部家庭测验分数等级测验分数等级测验分数等级1281190489311410915801103810691017926852373718181111R第49页,此课件共58页哦2)计算统计量)计算统计量3)进行统计决策进行统计决策 查表17,当n1=5,n2=3,n3=3时,接受原假设,说明家长的职业与学生创造力无显著关系。37.2123)311318537(121112)1(3)1(1222212NnRNNHkii51.505.0H05.0HH 第50页,此课件共58页哦2、大样本(K3或n i5时)先计算出H值,然后查 表,df=K-1,进行统计决策。2第51页,此课件共58页哦例例11119 9:A A、B B、C C、D D四所学校分别选出一部分人四所学校分别选出一部分人作为本校代表队参加物理竞赛,结果如下。问四作为本校代表队参加物理竞赛,结果如下。问四所学校成绩有否显著差异?所学校成绩有否显著差异?第52页,此课件共58页哦第53页,此课件共58页哦1)将数据进行排序,计算)将数据进行排序,计算 ,见上表。,见上表。2)计算统计量)计算统计量3)进行统计决策,进行统计决策,查 表,当df=4-1=3时,拒绝原假设,说明四个代表队成绩有显著差异。R281.7205.05.27343)1057813282367136(343312)1(3)1(12222212NnRNNHkii205.0H第54页,此课件共58页哦(一)适用条件 弗里得曼双向等级方差分析(弗里得曼双向等级方差分析(FriedmanFriedman)可解决随)可解决随机区组实验设计的一些非参数检验问题。机区组实验设计的一些非参数检验问题。(二)检验步骤 1 1、将每一区组的、将每一区组的K K个数据(个数据(K K为实验处理数)从小为实验处理数)从小到大排出等级;到大排出等级;2 2、计算每种实验处理、计算每种实验处理n n个数据(个数据(n n为区组数)等为区组数)等级和,用级和,用RiRi表示;表示;二、弗里得曼双向等级方差分析第55页,此课件共58页哦13112122KnRKnKKiiT3 3、代入公式、代入公式第56页,此课件共58页哦例例11-10:11-10:研究研究A A、B B、C C三种实验处理是否有差异,选三种实验处理是否有差异,选5 5个个被试进行实验,用随机区组设计,即每个被试视为一个区被试进行实验,用随机区组设计,即每个被试视为一个区组,分别先后接受组,分别先后接受A A、B B、C C三种实验处理,结果如下(已三种实验处理,结果如下(已经将每一区组的结果作了等级排列,故所列数据是表示等经将每一区组的结果作了等级排列,故所列数据是表示等级的),试问三种实验处理的差异是否显著?级的),试问三种实验处理的差异是否显著?第57页,此课件共58页哦1)1)将数据在各区组内排序将数据在各区组内排序,计算计算 ,见上表见上表2)2)计算统计量计算统计量 =3.13)3)进行统计决策进行统计决策 R13112122KnRKnKKiiT)13(53)5.125.107()13(3512222查表18,当 时,p=0.367;当 时,p=0.182,因为,因此 ,接受原假设,说明三种实验处理没有显著差异。8.22r6.32r6.31.38.222rT367.0182.0p第58页,此课件共58页哦