非参数统计第二章-单样本检验优秀PPT.ppt
假设某地的10栋房屋出售价格(由低到高排列)为56,69,85,87,90,94,96,113,118,179(单位:万元),问该地区的平均房屋价格是否和人们信任的84万元的水平大体一样。我们用M表示价格分布的中心(这里考虑中位数),如假设该分布对称,则M也是均值。我们要检验 H0:M=84,H1:M84依据传统的参数方法,假设房屋价格听从正态分布N(84,2),则检验统计量为 ,其值为1.384,结论呢?第一节 符号检验和置信区间假设总体 ,Me是总体的中位数,对于假设检验问题:是待检验的中位数取值 定义,,则 ,在零假设状况下 ,在显著性水平为 的拒绝域为其中k是满足上式最大的k值。结果探讨结果探讨结果探讨结果探讨大样本结论大样本结论当n较大时 双边:,p-值左侧:,p-值右侧:,p-值 检验步骤检验步骤 Ex.某国12位总统的寿命(岁)分别为46,57,58,60,60,63,64,67,72,78,88,90.问该国总统寿命的中位数是否不小于71.5岁?依据题目,要检验的是 H0:M0.571.5,H1:M0.571.5明显,当S_太小时拒绝原假设。经计算,K=min(S_,S+)=4 P(K4)=?0.1938假设总体 ,Mp是总体的p分位数,对于假设检验问题:是待检验的分位数取值 定义,,则 ,在零假设状况下 ,在显著性水平为 的拒绝域为其中k是满足上式最大的k值。广义符号检验广义符号检验 例.5年前成年人在每日24小时中的睡眠量中位数是7.5小时,每日睡眠量为6小时或少于6小时的占调查总数的5%,9小时和9小时以上的也占5%。现对8个一般成年人的抽样调查结果为:7.2,8.3,5.6,7.4,7.8,5.2,9.1,5.8.问现在成年人的睡眠量是否少于5年前依据5年前的数据,对0.05,0.5和0.95分位数,至少检验一个假定。H0:M0.5=7.5,H1:M0.57.5H0:M0.05=6,H1:M0.056H0:M0.95=9,H1:M0.95P_ 在第一个检验中,仅判定对二者喜好程度有无差异。由调查结果,n=14,s+=12,s-=2.P(S_2|n=14,p=0.5)=0.0065,双侧检验概率为0.013.在0.05的水平下,拒绝前面的两个假设.中位数的置信区间中位数的置信区间由于得到的区域是以中位数对称的,接受Neyman原则选择最优置信区间,首先找出置信度大于 的全部区间 ,然后再从中选择区间长度最小的一个。对于大样本,可以用近似正态分布求置信区间。依据依次统计量构造置信区间:构造置信度为90%的置信区间:9.8,10.0其次节 Wilcoxon符号秩检验基本概念及性质 对称分布的中心确定是中位数,在非对称分布状况下,中位数不唯一,探讨对称中心比中位数更有意义。例:下面的数据中,O是对称中心吗?0 0检验步骤检验步骤Ex.某公司为削减加工费用,确定若铸件重量的中位数超过25公斤,就转包加工;若不超过25公斤则不转包。现从这批铸件中随机抽取8件,每件的重量分别为:24.3,25.8,25.4,24.8,25.2,25.1,25.0,25.5。运用这些数据,能否作出这批铸件是否转包的确定。第四节 Cox-Stuart趋势检验 检验原理检验原理:数据序列:数据序列:,双边假设检验问题:,双边假设检验问题:令:令:取取数数对对 ,为为正正的的数数目目,为为负负的的数数目目,当当正正号号或或者者负负号号太太多多的的时时候候,认认为为数数据据存存在在趋趋势势。在在零假设状况下零假设状况下 Di Di听从二项分布。从而转化为符号检验问题听从二项分布。从而转化为符号检验问题X1,X2,Xn例 某地区32年来的降雨量如下表 问(1):该地区前10年来降雨量是否有变更?(2):该地区32年来降雨量是否有变更?年份 1971 1972 1973 1974 1975 1976 1977 1978 降雨量 206 223 235 264 229 217 188 204 年份 1979 1980 1981 1982 1983 1984 1985 1986 降雨量 182 230 223 227 242 238 207 208 年份 1987 1988 1989 1990 1991 1992 1993 1994 降雨量 216 233 233 274 234 227 221 214 年份 1995 1996 1997 1998 1999 2000 2001 2002 降雨量 226 228 235 237 243 240 231 210Ex 美国国家宇航局(NASA)自1966至1984年的科研和发展经费按时间依次为问:经费有无上升趋势?5.9 5.4 4.7 4.3 3.8 3.4 3.4 3.3 3.3 3.3 3.7 3.9 4.0 4.2 4.9 5.2 6.0 6.7 7.0 首先用全部首先用全部1919个数据检验个数据检验:n=19,c=10,S_=5,S+=4再用再用19701970年至年至19841984年的年的1515个数据检验个数据检验:n=15,c=8,S_=7,S+=0第五节 游程检验游程的概念:随机游程问题:一个二元0/1序列当中,一段全由0或者全由1构成的串成为一个游程,游程中数据的个数称为游程长度,序列中游程的个数记为R,反映0和1轮换交替的频繁程度。在序列长度N固定的时候,假如游程过少过者过多,都说明序列的随机性不好。当游程过多或者过少时,就会怀疑序列的随机性。检验原理和计算方法设是由0或者1组成的序列 ,假设检验问题:R为游程个数,假设有 个0,个1,这时R取任何一个值的概率都是 ,R的条件分布 建立了抽样分布之后,在零假设成立时,可以计算 或者 的值,进行检验。X1,X2,Xn随机游程问题:序列共有8个游程 R=8,m=10,n=11 查表可知,=0.05下临界值为c1=6,c2=17 因为6R=817,故认为这些数据符合随机性假设