SAS讲义 第二十八课Wilcoxon秩和检验.doc
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_05.gif)
《SAS讲义 第二十八课Wilcoxon秩和检验.doc》由会员分享,可在线阅读,更多相关《SAS讲义 第二十八课Wilcoxon秩和检验.doc(7页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、第二十八课 Wilcoxon秩和检验一、 两样本的Wilcoxon秩和检验由Mann,Whitney和Wilcoxon三人共同设计的一种检验,有时也称为Wilcoxon秩和检验,用来决定两个独立样本是否来自相同的或相等的总体。如果这两个独立样本来自正态分布和具有相同方差时,我们可以采用t检验比较均值。但当这两个条件都不能确定时,我们常替换t检验法为Wilcoxon秩和检验。Wilcoxon秩和检验是基于样本数据秩和。先将两样本看成是单一样本(混合样本)然后由小到大排列观察值统一编秩。如果原假设两个独立样本来自相同的总体为真,那么秩将大约均匀分布在两个样本中,即小的、中等的、大的秩值应该大约均匀
2、被分在两个样本中。如果备选假设两个独立样本来自不相同的总体为真,那么其中一个样本将会有更多的小秩值,这样就会得到一个较小的秩和;另一个样本将会有更多的大秩值,因此就会得到一个较大的秩和。设两个独立样本为:第一个的样本容量为,第二个样本容量为,在容量为的混合样本(第一个和第二个)中,样本的秩和为,样本的秩和为,且有(28.1)我们定义(28.2)(28.3)以样本为例,若它们在混合样本中享有最小的个秩,于是,也是可能取的最小值;同样可能取的最小值为。那么,的最大取值等于混合样本的总秩和减去的最小值,即;同样,的最大取值等于。所以,(28.2)和(28.3)式中的和均为取值在0与的变量。当原假设为
3、真时,所有的和相当于从同一总体中抽得的独立随机样本,和构成可分辨的排列情况,可看成一排个球随机地指定个为球另个为球,共有种可能,而且它们是等可能的。基于这样分析,在原假设为真的条件下不难求出和的概率分布,显然它们的分布还是相同的,这个分布称为样本大小为和的Mann-Whitney-Wilcoxon分布。一个具有实际价值的方法是,对于每个样本中的观察数大于等于8的大样本来说,我们可以采用标准正态分布来近似检验。由于的中心点为,根据(28.2)式,中心点为(28.4)的方差从数学上可推导出(28.5)如果样本中存在结,将影响到公式(28.5)中的方差,按结值调整方差的公式为(28.6)其中第j个结
4、值的个数。结值的存在将使原方差变小,这是一个显然正确的事实。标准化后为(28.7)其中分子加0.5或减0.5是为了对离散变量进行连续性修正,对于大于0减0.5修正,对于小于0加0.5修正。例28.1某航空公司的CEO注意到飞离亚特兰大的飞机放弃预定座位的旅客人数在增加,他特别有兴趣想知道,是否从亚特兰大起飞的飞机比从芝加哥起飞的飞机有更多的放弃预定座位的旅客。获得一个从亚特兰大起飞的9次航班和从芝加哥起飞的8次航班上放弃预定座位的旅客人数样本,见表28.1中的第2列和第4列所示。表28.1 放弃预定座位的旅客人数及统一秩值航班次数亚特兰大(组)芝加哥(组)放弃人数统一编秩放弃人数统一编秩111
5、5.513721591483103.5103.541812815115.51610620139272416171182215211492517秩和96.556.5如果假定放弃预定座位旅客人数的总体是正态分布且有相等的方差,我们可以采用两样本比较的t检验。但航空公司的CEO认为这两个假设条件不能满足,因此采用非参数的Wilcoxon秩和检验。将组与组看成是单一样本进行编秩,见表28.1中的第3列和第5列所示。,最小值是8秩值为1,最大值是25秩值为17,有两个结值10和11,两个10平均分享秩值3和4为3.5,两个11平均分享秩值5和6为5.5。如果两组放弃预定座位的旅客人数是相同的,那么我们期
6、望的两组秩和和大约是相同的;如果两组放弃预定座位的旅客人数是不相同的,那么我们期望的两组秩和和也是非常不相同的。注意到9,8,=96.5,=56.5,两组放弃预定座位旅客人数的分布是相同的。标准正态分布值的计算结果为如果设定显著水平0.05,我们知道标准正态分布在0.05显著水平时,上临界值为1.645,下临界值为1.645,由于1.4451.645,所以得到是相同的结果,不能拒绝原假设。另外,要特别注意的是由于在连续型分布中随机地抽出个样本,几乎极少可能存在有些值相等的情况,但在社会经济中有很多离散变量,很可能存在数值相同的情况,即样本中存在着“结”。我们处理“结”的方法采用分享平均秩,但当
7、大量“结”存在时,将可能直接影响的方差,因此需要把(28.5)式中的方差修正为(28.6)。但在手工计算和结值不多的情况下,常使用未修正方差来简化计算,因为与修正方差的计算结果比较只存在一些小差异,大多数情况下不影响最终的推断结果。二、 单因子非参数方差分析的npar1way过程单因子非参数方差分析的npar1way过程是分析变量的秩,并计算几个基于经验分布的函数(EDF)和通过一个单因子分类变量的响应变量确定的秩得分的统计量。秩的得分计算分成四种:Wilcoxon得分、中位数得分、Savage得分和Van der Waerden得分。然后再由秩得分计算简单的线性秩统计量,由这个秩统计量可以检
8、验一个变量的分布在不同组中是否具有相同的位置参数,或者在EDF检验下,检验这个变量分布在不同组中是否分布相同。秩得分的统计量也可以先用proc rank过程计算秩得分,然后用proc anova过程分析这些秩得分而得到。1. 四种不同的秩得分计算用以下公式定义的统计量(28.8)称为线性秩统计量。其中是第个观察的秩,是秩得分,是一个指示向量(由0和1组成),它表示了第个观察所属的类,是观察的总数。npar1way过程的四种不同的秩得分计算为:1) Wilcoxon得分在Wilcoxon得分中=(28.9)它对Logistic分布的位置移动是局部最优的。在计算两样本情况下的Wilcoxon秩和统
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- SAS讲义 第二十八课Wilcoxon秩和检验 SAS 讲义 第二 十八 Wilcoxon 检验
![提示](https://www.taowenge.com/images/bang_tan.gif)
限制150内