SAS的非参数检验正式.pptx
《SAS的非参数检验正式.pptx》由会员分享,可在线阅读,更多相关《SAS的非参数检验正式.pptx(71页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、学习目标了解非参检验的优缺点及应用范围;了解非参检验的优缺点及应用范围;熟息非参数检验几种基本类型和检验的基本方法;熟息非参数检验几种基本类型和检验的基本方法;掌握编秩基本步骤,平均秩的计算及相等秩的校正。掌握编秩基本步骤,平均秩的计算及相等秩的校正。配对及单样本秩和检验;配对及单样本秩和检验;两组样本比较的秩和检验;两组样本比较的秩和检验;多组样本比较的秩和检验及两两比较;多组样本比较的秩和检验及两两比较;等级分组资料的非参数检验;等级分组资料的非参数检验;随机区组设计资料比较的秩和检验及两两比较。随机区组设计资料比较的秩和检验及两两比较。第1页/共71页概述比较两个总体间的差异,我们比较熟
2、悉的是可依据总体方差是比较两个总体间的差异,我们比较熟悉的是可依据总体方差是否已知,选择使用正态否已知,选择使用正态Z Z检验或检验或t t检验法。但如果有明显的证据检验法。但如果有明显的证据表明,这些参数型检验法不能使用时又该如何呢?非参数检验表明,这些参数型检验法不能使用时又该如何呢?非参数检验法对此提供了解决方案。法对此提供了解决方案。作为参数检验的一种推广,非参数检验有何特点?它的使用有作为参数检验的一种推广,非参数检验有何特点?它的使用有什么样的要求?本章首先对非参数检验进行概述,接着按照和什么样的要求?本章首先对非参数检验进行概述,接着按照和参数检验对应的原则分别介绍用于两组比较的
3、非参数检验法、参数检验对应的原则分别介绍用于两组比较的非参数检验法、用于多组比较的非参数检验法以及等级相关检验(秩相关)。用于多组比较的非参数检验法以及等级相关检验(秩相关)。第2页/共71页概述参数检验是在已知总体分布的条件下(一般要求总体服从正态参数检验是在已知总体分布的条件下(一般要求总体服从正态分布)对一些主要的参数(如均值、百分数、方差、相关系数分布)对一些主要的参数(如均值、百分数、方差、相关系数等)进行的检验,有时还要求某些总体参数满足一定条件。如等)进行的检验,有时还要求某些总体参数满足一定条件。如独立样本的检验和方差分析不仅要求总体符合正态分布,还独立样本的检验和方差分析不仅
4、要求总体符合正态分布,还要求各总体方差齐性。要求各总体方差齐性。非参数检验则不考虑总体分布是否已知,常常也不是针对总体非参数检验则不考虑总体分布是否已知,常常也不是针对总体参数,而是针对总体的某些一般性假设(如总体分布的位置是参数,而是针对总体的某些一般性假设(如总体分布的位置是否相同,总体分布是否正态)进行检验。否相同,总体分布是否正态)进行检验。第3页/共71页概述非参数检验方法简便,不依赖于总体分布的具体形式因而适用性强,但灵非参数检验方法简便,不依赖于总体分布的具体形式因而适用性强,但灵敏度和精确度不如参数检验。一般而言,非参数检验适用于以下三种情况:敏度和精确度不如参数检验。一般而言
5、,非参数检验适用于以下三种情况:顺序类型的数据资料,这类数据的分布形态一般是未知的;顺序类型的数据资料,这类数据的分布形态一般是未知的;虽然是连虽然是连续数据,但总体分布形态未知或者非正态,这和卡方检验一样,称自由分续数据,但总体分布形态未知或者非正态,这和卡方检验一样,称自由分布检验;布检验;总体分布虽然正态,数据也是连续类型,但样本容量极小,如总体分布虽然正态,数据也是连续类型,但样本容量极小,如1010以下(虽然检验被称为小样本统计方法,但样本容量太小时,代表以下(虽然检验被称为小样本统计方法,但样本容量太小时,代表性毕竟很差,最好不要用要求较严格的参数检验法)。因为这些特点,加性毕竟很
6、差,最好不要用要求较严格的参数检验法)。因为这些特点,加上非参数检验法一般原理和计算比较简单,因此常用于一些为正式研究进上非参数检验法一般原理和计算比较简单,因此常用于一些为正式研究进行探路的预备性研究的数据统计中。当然,由于非参数检验许多牵涉不到行探路的预备性研究的数据统计中。当然,由于非参数检验许多牵涉不到参数计算,对数据中的信息利用不够,因而其统计检验力相对参数检验也参数计算,对数据中的信息利用不够,因而其统计检验力相对参数检验也差得多。差得多。第4页/共71页单组资料的符号及符号秩和检验 单样本资料与已知总体符号秩和检验的检验步骤如下:单样本资料与已知总体符号秩和检验的检验步骤如下:求
7、差值:求样本资料中单个个体数据与总体中位数的差值。求差值:求样本资料中单个个体数据与总体中位数的差值。检验假设检验假设H0H0:差值的总体中位数等于零,即:差值的总体中位数等于零,即H1H1:差值的总体中位数不等于零,即:差值的总体中位数不等于零,即编秩按差值的绝对值由小到大编秩,并按差值的正负给秩次加上正负号。编秩按差值的绝对值由小到大编秩,并按差值的正负给秩次加上正负号。编秩时,若差值为编秩时,若差值为0 0,舍去不计;若差值的绝对值相等,这时取平均秩次。,舍去不计;若差值的绝对值相等,这时取平均秩次。求秩和,并确定统计量求秩和,并确定统计量T T将所排的秩次冠以原差数的符号,分别求出正、
8、将所排的秩次冠以原差数的符号,分别求出正、负差值秩次之和,分别以负差值秩次之和,分别以T T+和和 T T-表示。表示。第5页/共71页单组资料的符号及符号秩和检验编秩按差值的绝对值由小到大编秩,并按差值的正负给秩次加上正负号。编秩时,若差值为编秩按差值的绝对值由小到大编秩,并按差值的正负给秩次加上正负号。编秩时,若差值为0 0,舍去不,舍去不计;若差值的绝对值相等,这时取平均秩次。计;若差值的绝对值相等,这时取平均秩次。求秩和,并确定统计量求秩和,并确定统计量T T将所排的秩次冠以原差数的符号,分别求出正、负差值秩次之和,分别以将所排的秩次冠以原差数的符号,分别求出正、负差值秩次之和,分别以
9、T T+和和 T T-表示。表示。第6页/共71页单组资料的符号及符号秩和检验在在H H0 0成立时,如果当观察例数比较多,正差值的秩和与负差值成立时,如果当观察例数比较多,正差值的秩和与负差值的秩和理论上应相等,即使有些差别,也只能是一些随机因素的秩和理论上应相等,即使有些差别,也只能是一些随机因素造成的。换句话说,如果造成的。换句话说,如果H H0 0成立,一份随机样本中成立,一份随机样本中“不太可能不太可能”出现正差值的秩和与负差值的秩和相差悬殊的情形;如果样出现正差值的秩和与负差值的秩和相差悬殊的情形;如果样本的正差值的秩和与负差值的秩和差别太大,我们有理由拒绝本的正差值的秩和与负差值
10、的秩和差别太大,我们有理由拒绝HH0 0,接受,接受H H1 1,即认为两种处理效应不同;反之,没有理由拒绝,即认为两种处理效应不同;反之,没有理由拒绝HH0 0,还不能认为两种处理效应不同。,还不能认为两种处理效应不同。第7页/共71页单组资料的符号及符号秩和检验双侧检验时,以绝对值较小者为统计量双侧检验时,以绝对值较小者为统计量T T值,即值,即T T=min(=min(T T+,+,T T-)-);单侧检验时,任取正差值的秩和或负差值的;单侧检验时,任取正差值的秩和或负差值的秩和为统计量秩和为统计量T T。记正、负差值的总个数为。记正、负差值的总个数为n n(即(即n n为差值不为差值不
11、等于等于0 0的对子数),则的对子数),则T T+与与T T-之和为之和为n(n+1)/2n(n+1)/2。确定确定P P值和作出推断结论值和作出推断结论查表法(时)查查表法(时)查T T界值表,若检验统计量界值表,若检验统计量T T值在上、下界值范值在上、下界值范围内,其围内,其P P值大于相应的概率水平;若值大于相应的概率水平;若T T值在上、下界值上或值在上、下界值上或范围外,则范围外,则P P值小于相应的概率水平。值小于相应的概率水平。第8页/共71页单组资料的符号及符号秩和检验正态近似法(正态近似法(n n5050时)这时可利用秩和分布的正态近似法作出判断。已知时)这时可利用秩和分布
12、的正态近似法作出判断。已知H H0 0成立时,近似地有成立时,近似地有其中,其中,统计量的计算公式为:统计量的计算公式为:第9页/共71页例题单样本已知某地正常人尿氟含量的中位数为已知某地正常人尿氟含量的中位数为45.30 45.30。今在该地某厂随机抽取。今在该地某厂随机抽取1212名工人,测得尿氟含量。问该厂工名工人,测得尿氟含量。问该厂工人的尿氟含量是否高于当地正常人的尿氟含量?人的尿氟含量是否高于当地正常人的尿氟含量?第10页/共71页配对设计资料的非参数检验 配对设计有两种情况:一种是同对的两个受试对象分别给予两配对设计有两种情况:一种是同对的两个受试对象分别给予两种处理,目的是推断
13、两种处理的效果有无差别。如取同窝别、种处理,目的是推断两种处理的效果有无差别。如取同窝别、体重相近的体重相近的2 2只动物配对。临床试验疗效比较时,常将病种、病只动物配对。临床试验疗效比较时,常将病种、病型、病情及其它影响疗效的主要因素一致的病人配成对子,以型、病情及其它影响疗效的主要因素一致的病人配成对子,以构成配对的研究样本。另一种是同一受试对象处理前后的比较,构成配对的研究样本。另一种是同一受试对象处理前后的比较,目的是推断该处理有无作用。例如观察某指标的变化,用同一目的是推断该处理有无作用。例如观察某指标的变化,用同一组病人治疗前后作比较;用同一批动物处理前后作比较;或用组病人治疗前后
14、作比较;用同一批动物处理前后作比较;或用同一批受试对象的不同部位、不同器官作比较等,也属于配比同一批受试对象的不同部位、不同器官作比较等,也属于配比试验。试验。第11页/共71页配对设计资料的非参数检验配对设计资料一般采用配对配对设计资料一般采用配对t t检验方法进行分析,但若配对数据差数的分布非正态分布,但其总体分布基本检验方法进行分析,但若配对数据差数的分布非正态分布,但其总体分布基本对称,则可采用符号秩检验作为配对对称,则可采用符号秩检验作为配对t t检验的替代方法。符号秩检验功效很高,在数据满足配对检验的替代方法。符号秩检验功效很高,在数据满足配对t t检验的要求检验的要求时,符号秩检
15、验的功效可达配对时,符号秩检验的功效可达配对t t检验功效的检验功效的95%95%。第12页/共71页配对设计资料的非参数检验配对设计资料的检验步骤为:配对设计资料的检验步骤为:求差值求各对数据求差值求各对数据 的差值的差值 ;检验假设检验假设H H0 0:差值的总体中位数等于零,即:差值的总体中位数等于零,即 H H1 1:差值的总体中位数不等于零,即:差值的总体中位数不等于零,即编秩按差值的绝对值由小到大编秩,并按差值的正负给秩次加上正负号。编秩按差值的绝对值由小到大编秩,并按差值的正负给秩次加上正负号。编秩时,若差值为编秩时,若差值为0 0,舍去不计;若差值的绝对值相等,取平均秩次。,舍
16、去不计;若差值的绝对值相等,取平均秩次。求秩和并确定统计量求秩和并确定统计量T T将所排的秩次冠以原差数的符号,分别求出正、将所排的秩次冠以原差数的符号,分别求出正、负差值秩次之和,分别以负差值秩次之和,分别以T T+和和 T T-表示。表示。第13页/共71页配对设计资料的非参数检验在在H H0 0成立时,如果当观察例数比较多,正差值的秩和与负差值成立时,如果当观察例数比较多,正差值的秩和与负差值的秩和理论上应相等,即使有些差别,也只能是一些随机因素的秩和理论上应相等,即使有些差别,也只能是一些随机因素造成的。换句话说,如果造成的。换句话说,如果H H0 0成立,一份随机样本中成立,一份随机
17、样本中“不太可能不太可能“出现正差值的秩和与负差值的秩和相差悬殊的情形;如果样出现正差值的秩和与负差值的秩和相差悬殊的情形;如果样本的正差值的秩和与负差值的秩和差别太大,我们有理由拒绝本的正差值的秩和与负差值的秩和差别太大,我们有理由拒绝HH0 0,接受,接受H H1 1,即认为两种处理效应不同;反之,没有理由拒绝,即认为两种处理效应不同;反之,没有理由拒绝HH0 0,还不能认为两种处理效应不同。,还不能认为两种处理效应不同。第14页/共71页配对设计资料的非参数检验统计量统计量双侧检验时,以绝对值较小者为统计量双侧检验时,以绝对值较小者为统计量T T值,即值,即T T=min(=min(T
18、T+,T T-)-);单侧检验时,任取正差值的秩和或负;单侧检验时,任取正差值的秩和或负差值的秩和为统计量差值的秩和为统计量T T。记正、负差值的总个数为。记正、负差值的总个数为n n(即(即n n为差值不等于为差值不等于0 0的对子数),则的对子数),则T T+与与T T-之和之和为为n(n+1)/2n(n+1)/2。确定确定P P值和作出推断结论。值和作出推断结论。第15页/共71页例题配对设计对对1212份血清分别用原方法(检测时间份血清分别用原方法(检测时间2020分钟)和新方法(检测时间分钟)和新方法(检测时间1010分钟)测谷分钟)测谷-丙转氨酶。问两法所得丙转氨酶。问两法所得结果
19、有无差别?结果有无差别?第16页/共71页成组设计资料的非参数检验 WilcoxonWilcoxon秩和检验,用于推断计量资料或等级资料的两个样本所来自的秩和检验,用于推断计量资料或等级资料的两个样本所来自的两个总体分布是否有差别。在理论上假设两个总体分布是否有差别。在理论上假设H0H0应为两个总体分布相同,即应为两个总体分布相同,即两个样本来自同一总体。由于秩和检验对于两个总体分布的形状差别不敏两个样本来自同一总体。由于秩和检验对于两个总体分布的形状差别不敏感,对于位置相同、形状不同但类似的两个总体分布,推断不出两个总体感,对于位置相同、形状不同但类似的两个总体分布,推断不出两个总体分布有差
20、别,故对立的备择假设分布有差别,故对立的备择假设H1H1不能认为两个总体分布不同,而只能不能认为两个总体分布不同,而只能为两个总体分布位置不同。为两个总体分布位置不同。不管两个总体分布的形状有无差别,秩和检验的目的是推断两个总体分布不管两个总体分布的形状有无差别,秩和检验的目的是推断两个总体分布的位置是否有差别,这正是实践中所需要的,如要推断两个不同人群的某的位置是否有差别,这正是实践中所需要的,如要推断两个不同人群的某项指标值的大小是否有差别或哪个人群的大,可用其指标值分布的位置差项指标值的大小是否有差别或哪个人群的大,可用其指标值分布的位置差别反映,而不关心其指标值分布的形状有无差别。别反
21、映,而不关心其指标值分布的形状有无差别。第17页/共71页成组设计资料的非参数检验求检验统计量求检验统计量T T值:值:把两样本数据混合从小到大编秩,遇数据相等者取把两样本数据混合从小到大编秩,遇数据相等者取平均秩;平均秩;以样本例数小者为以样本例数小者为n1n1,其秩和(,其秩和(T1T1)为)为T T,若样本例数相等,若样本例数相等,可取任一样本的秩和(可取任一样本的秩和(T1T1或或T2T2)为)为T T。确定确定P P值,作出推断结论:当值,作出推断结论:当n110n110和和n2-n110n2-n110时,查时,查T T界值表。若界值表。若T T值在界值范围内,其值在界值范围内,其P
22、 P值大于相应概率水平;若值大于相应概率水平;若T T值刚好等于界值,其值刚好等于界值,其P P值等于相应概率水平;若值等于相应概率水平;若T T值在界值范围外,其值在界值范围外,其P P值小于相应概率水平。值小于相应概率水平。若若n110n110或者或者n2-n110n2-n110,超出界值表的范围,可用正态近似法作检验,超出界值表的范围,可用正态近似法作检验,令令n1n1n2=Nn2=N,按下式计算值。,按下式计算值。第18页/共71页成组设计资料非参数检验的SAS程序 SASSAS中对于非参数分析方法功能的实现主要由中对于非参数分析方法功能的实现主要由npar1waynpar1way过程
23、来完成,过程来完成,npar1waynpar1way过程属于过程属于SASSAS的的STATSTAT模块,对于统计学上所涉及的非参数统模块,对于统计学上所涉及的非参数统计方法几乎都可以通过此过程完成。计方法几乎都可以通过此过程完成。Npar1wayNpar1way过程的基本语句格式如下:过程的基本语句格式如下:PROC NPAR1WAYPROC NPAR1WAY ;BYBY 变量名变量名;CLASSCLASS变量名变量名;EXACTEXACT 统计量选项统计量选项 /;FREQFREQ变量名变量名;OUTPUTOUTPUT OUT=;VARVAR 变量名变量名;RUN;RUN;第19页/共71
24、页成组设计资料非参数检验的SAS程序DATA=DATA=数据集名:指定要进行分析的数据集;数据集名:指定要进行分析的数据集;MEDIANMEDIAN:运用中位数评分进行分析,即进行中位数检验:运用中位数评分进行分析,即进行中位数检验NOPRINTNOPRINT:禁止所有的输出,用在仅需要创建输出数据集时;:禁止所有的输出,用在仅需要创建输出数据集时;STST:运用:运用Siegel-TukeySiegel-Tukey评分进行分析;评分进行分析;ANOVAANOVA:对原始数据进行方差分析;:对原始数据进行方差分析;EDFEDF:要求计算基于经验分布的统计量;:要求计算基于经验分布的统计量;MI
25、SSINGMISSING:指定分组变量的缺失值为一有效的分组水平;:指定分组变量的缺失值为一有效的分组水平;SAVAGESAVAGE:运用:运用SavageSavage评分进行分析;评分进行分析;VWVW:运用:运用Van der WaerdenVan der Waerden评分进行分析计算;评分进行分析计算;第20页/共71页成组设计资料非参数检验的SAS程序CORRECT=NOCORRECT=NO:在两样本时,禁止:在两样本时,禁止WilcoxonWilcoxon和和Siegel-Siegel-TukeyTukey检验的连续性校正过程;检验的连续性校正过程;KLOTZKLOTZ:运用:运用
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- SAS 参数 检验 正式
限制150内