非参数第三章精选PPT.ppt
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_05.gif)
《非参数第三章精选PPT.ppt》由会员分享,可在线阅读,更多相关《非参数第三章精选PPT.ppt(37页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、非参数第三章第1页,此课件共37页哦 可以假定这个样本是从世界许多大城市中随机抽样得到的,可以假定这个样本是从世界许多大城市中随机抽样得到的,所有大城市的指数组成了总体所有大城市的指数组成了总体.有人说有人说64应该是这种大城市花应该是这种大城市花费指数的中位数(费指数的中位数(median);而另外有人说,而另外有人说,64顶多是下四顶多是下四分位数(分位数(first quantile).这里看上去有两个关于位置参数这里看上去有两个关于位置参数的不同检验问题的不同检验问题.(1)样本中位数)样本中位数M是否大于是否大于64.(2)样本下四分位点)样本下四分位点Q0.25是否小于是否小于64
2、.由于中位数也是分位点(由于中位数也是分位点(0.5分位点)分位点).这两个问题实际这两个问题实际上是一个问题,即关于分位点的检验问题上是一个问题,即关于分位点的检验问题.当然也出现当然也出现了求了求 分位点分位点 的的 置信区间问题置信区间问题.第2页,此课件共37页哦第3页,此课件共37页哦3.1.1 广义符号检验:对分位点进行的检验广义符号检验:对分位点进行的检验所谓的广义符号检验是对连续变量所谓的广义符号检验是对连续变量 分位点分位点 进行的进行的检验;而狭义的符号检验则是仅针对中位数检验;而狭义的符号检验则是仅针对中位数 进行的检验进行的检验.假定检验的零假设是假定检验的零假设是 ,
3、而备择假设则可能为而备择假设则可能为记样本中记样本中小于小于 的点数为的点数为 ,而大于,而大于 的点数为的点数为并且用小写的并且用小写的 和和 分别代表分别代表 和和 的实现值的实现值.记记 第4页,此课件共37页哦在零假设在零假设 下,下,应该服从二项分布应该服从二项分布 对对 的检验,下面变量的检验,下面变量K 的分布为的分布为 ,为样本为样本 分位点分位点备择假设备择假设值值使检验有意义的条件使检验有意义的条件第5页,此课件共37页哦而对于而对于 的特例,这时的特例,这时 为中位数,通常记为为中位数,通常记为M,则有下面的表,则有下面的表.对对 的检验,变量的检验,变量 的分布为的分布
4、为备择假设 值第6页,此课件共37页哦例例3.1(续)下面讨论例(续)下面讨论例3.1的样本下四分位点的样本下四分位点 是否是否小于小于64的检验的检验.则检验问题是则检验问题是第7页,此课件共37页哦再看关于再看关于64是否为中位数的检验,是否为中位数的检验,大样本正态近似大样本正态近似第8页,此课件共37页哦3.1.2 基于符号检验的中位数及分位点的置信区间基于符号检验的中位数及分位点的置信区间中位数中位数 的对称置信区间的对称置信区间.首先我们考虑关于中位数首先我们考虑关于中位数 的基于符号检验的的基于符号检验的 置信区间置信区间.它定义为:它定义为:对于显著性水平为对于显著性水平为 的
5、中位数的双边符号检验的中位数的双边符号检验,不会使不会使 被拒绝的那些零假设点被拒绝的那些零假设点 的集合的集合.第9页,此课件共37页哦例例3.2(数据:(数据:tax.txt)下面是随机抽取的)下面是随机抽取的22个企业的纳税额个企业的纳税额.数据已经按照升幂排列数据已经按照升幂排列.1.00 1.35 1.99 2.05 2.06 2.10 2.30 2.61 2.86 2.95 2.98 3.23 3.73 4.03 4.82 5.24 6.10 6.64 6.81 6.86 7.11 9.00实际置信度实际置信度置信区间置信区间0.9999995(1,9)0.999989(1.35,
6、7.11)0.9998789(1.99,6.86)0.9991446(2.05,6.81)0.9830995(2.10,6.10)0.9475212(2.30,5.24)第10页,此课件共37页哦 3.2 Wilcoxon符号秩检验,点估计和区间估计符号秩检验,点估计和区间估计Wilcoxon符号秩检验:把观测值和零假设的中心位置之差的符号秩检验:把观测值和零假设的中心位置之差的绝对值的秩分别按照不同的符号相加作为其检验统计量绝对值的秩分别按照不同的符号相加作为其检验统计量.注意注意,该检验需要假定样本点该检验需要假定样本点 来自连续对称总体分布来自连续对称总体分布.例例3.3 (数据:(数据
7、:EuroAlc.txt)下面是)下面是10个欧洲城镇每人个欧洲城镇每人每年平均消费的酒类相当于纯酒精数(单位:升),数据每年平均消费的酒类相当于纯酒精数(单位:升),数据已经按照升幂排列已经按照升幂排列.4.12 5.81 7.63 9.74 10.39 11.92 12.32 12.89 13.54 14.45 检验问题是:检验问题是:第11页,此课件共37页哦Wilcoxon符号秩检验步骤如下:符号秩检验步骤如下:(1)计算)计算3.88 2.19 0.37 1.74 2.39 3.92 4.32 4.89 5.54 6.45(2)把上面的)把上面的n个绝对值排序,并找出它们的个绝对值排
8、序,并找出它们的n个秩,如果个秩,如果有相同的样本点,每个点取平均秩有相同的样本点,每个点取平均秩.5 3 1 2 4 6 7 8 9 10(3)令)令 等于等于 的的 的秩的和的秩的和.而而 等等于于 的的 的秩的和的秩的和.注意:注意:第12页,此课件共37页哦(4)对双边检验)对双边检验 ,在零假,在零假设下,设下,和和 应该差不多应该差不多.因而,当其中之一很小时,因而,当其中之一很小时,应怀疑零假设应怀疑零假设.取检验统计量取检验统计量 类似的,对类似的,对 的单边检验取的单边检验取对对 的单边检验取的单边检验取 第13页,此课件共37页哦(5)根据得到的)根据得到的W值,利用统计软
9、件或查值,利用统计软件或查Wilcoxon符号符号秩检验的分布表以得到在零假设下的秩检验的分布表以得到在零假设下的p值值.Psignrank(w,10)得到得到p=0.032(6)如果)如果p值较小,则可以拒绝零假设值较小,则可以拒绝零假设.如果如果p值较大则值较大则没有充分证据来拒绝零假设,但不意味着接受零假设没有充分证据来拒绝零假设,但不意味着接受零假设.wilcox.test(x-8,alt=greater)Wilcoxon signed rank testdata:x-8 V=46,p-value=0.03223alternative hypothesis:true location
10、is greater than 0 第14页,此课件共37页哦W+在零假设下的分布在零假设下的分布.秩秩符号的8种组合123-+-+-+-+-+-+-+-+W+0 1 2 3 3 4 5 6概率概率注意注意 W+和和 W-Wilcoxon分布的关系分布的关系第15页,此课件共37页哦3.2.2 基于基于Wilcoxon符号秩检验的点估计和区间估计符号秩检验的点估计和区间估计.首先求每两个数的平均首先求每两个数的平均 (一共有(一共有 个)来扩大样本数目个)来扩大样本数目.这样的平均称为这样的平均称为Walsh平均平均.可可以证明前面的统计量以证明前面的统计量 W+等于大于零的等于大于零的Wal
11、sh平均的个数平均的个数.即即 如果考虑移位如果考虑移位 ,即,即 ,同样可以用,同样可以用第16页,此课件共37页哦 对称中心对称中心 可由可由Walsh平均的中位数来估计,称为平均的中位数来估计,称为Hodge-Lehmann估计量:估计量:利用利用Walsh平均还可以得到平均还可以得到 的置信区间,先按照升幂排列的置信区间,先按照升幂排列Walsh平均,记为平均,记为 ,则,则 的的 置信区间为置信区间为这里整数这里整数k由由 来决定来决定.第17页,此课件共37页哦在大样本时,用类似于在大样本时,用类似于Wilcoxon检验的近似得到检验的近似得到例例3.3欧洲酒精人均消费的例子欧洲酒
12、精人均消费的例子.Walsh平均有平均有55个值(按照升幂个值(按照升幂排列)排列)4.120 4.965 5.810 5.875 6.720 6.930 7.255 7.630 7.775 8.020 8.100 8.220 8.505 8.685 8.830 8.865 9.010 9.065 9.285 9.350 9.675 9.740 9.775 9.975 10.065 10.130 10.260 10.390 10.585 10.830 11.030 11.040 11.155 11.315 11.355 11.640 11.640 11.920 11.965 12.095 12
13、.120 12.320 12.405 12.420 12.605 12.730 12.890 12.930 13.185 13.215 13.385 13.540 13.670 13.995 14.450第18页,此课件共37页哦3.3 正态记分检验正态记分检验考虑线性秩统计量考虑线性秩统计量 ,要,要按照正态分布来定义记分函数,为了使按照正态分布来定义记分函数,为了使 ,不,不用用 作为这里的记分,而稍微改变一下记分函作为这里的记分,而稍微改变一下记分函数使其为数使其为经过相应的替换后经过相应的替换后第19页,此课件共37页哦把把 标准化,就得到这里的对单样本位置的所谓正态标准化,就得到这里
14、的对单样本位置的所谓正态记分检验统计量记分检验统计量如果观测值的总体分布接近于正态,或者在大样本情况下,如果观测值的总体分布接近于正态,或者在大样本情况下,可以认为可以认为T近似的有标准正态分布近似的有标准正态分布.实际上,对于很小的样本实际上,对于很小的样本也适用也适用.如果记如果记 ,则有,则有 大约等于大约等于 ,也就是说,它和期望正态记分相近,也就是说,它和期望正态记分相近.第20页,此课件共37页哦4.125.187.639.7410.3911.9212.3212.8913.5414.453.882.190.371.742.393.924.324.985.546.4553124678
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 参数 第三 精选 PPT
![提示](https://www.taowenge.com/images/bang_tan.gif)
限制150内