非参数统计-趋势存在性检验课件.ppt
Cox-Staut趋势存在性检验 在客观世界里,会遇到各种随时间变动的数据序列,人们通常关心数据随时间变化的规律,其中趋势分析是常会分析的内容。在趋势分析中,人们首先关心趋势是否存在,如果趋势存在,则根据实际需要用更精细的模型刻画或度量趋势。随着统计软件的日益盛行,很多人习惯将存在性问题和确定性问题一起由计算机回答,比如,回归分析就是最常用的趋势分析工具。通常的做法是用线性回归拟合直线,然后再通过检验验证线型假设的合理性,如果检验通过,则表示回归模型是合适的,线型趋势是存在的。如果模型没有通过检。如果模型没有通过检验,我们只能否定存在线型趋势,而不能否定其他趋势验,我们只能否定存在线型趋势,而不能否定其他趋势。Cox与Staut在研究数列趋势问题的时候,于1955年提出了一种不依赖于趋势结构的快速判断趋势是否存在的方法。即Cox-Staut趋势存在性检验,它的理论基础正是符号检验。基础正是符号检验。Cox-Staut趋势存在性检验 如果数据有上升的趋势,那么排在后面的数的取值比排在前面的数显著地大;反之,如果数据有下降的趋势,那么排在后面的数的取值比排在前面的数明显的小。换句话讲,我们可能生成一些数对,每一个数对是从前后两个不同时期中各选出一个数构成的,这些数对可以反映前后数据的变化。为保证数对同分布,前后两个数的间隔应固定。这就意味着将数据一分为二,自然形成前后数对。Cox-Staut提出最优的拆分点是数列中位于中间位置的数。Cox-Staut趋势存在性检验 检验原理检验原理:设数据序列:,双边假设检验问题:令:取数对 ,为正的数目,为负的数目,当正号或者负号太多的时候,认为数据存在趋势。在零假设情况下 Di服从二项分布。从而转化为符号检验问题。当n=100时,c=50,形成的数对为(x1,x51)、(x2,x52)(x50,x100)当n=99 时,c=50,形成的数对为(x1,x51)、(x2,x52)(x49,x99)X1,X2,Xn例3.6 某地区32年来的降雨量如下表 问(1):该地区前10年来降雨量是否有变化?(2):该地区32年来降雨量是否有变化?年份 1971 1972 1973 1974 1975 1976 1977 1978降雨量 206 223 235 264 229 217 188 204年份 1979 1980 1981 1982 1983 1984 1985 1986降雨量 182 230 223 227 242 238 207 208年份 1987 1988 1989 1990 1991 1992 1993 1994降雨量 216 233 233 274 234 227 221 214年份 1995 1996 1997 1998 1999 2000 2001 2002降雨量 226 228 235 237 243 240 231 210=5,结论:不能拒原假设。类似于符号检验在配对样本比较中的应用类似于符号检验在配对样本比较中的应用 x y-c(217,188,204,182,230)binom.test(sum(xy),length(x-y),0.5)Exact binomial testdata:sum(x x y binom.test(sum(xy),length(x-y),0.5)Exact binomial testdata:sum(x y)out of length(x-y)number of successes=2,n=16,p-value=0.004181alternative hypothesis:p is not equal to 0.5 结论:拒绝H0,认为降雨量有明显变化.rain-c(206,223,235,264,229,217,188,204,182,230,223,227,242,238,207,208,216,233,233,274,234,227,221,214,226,228,235,237,243,240,231,210)year 20,R 的的抽样分布近似为正态抽样分布近似为正态根据求得的Z值,看是否在拒绝域内,做出决策。Runs Test:大样本例子大样本例子(p70 例例3.10)3.10 实习学生在实习期迟到的情况被门镜系统记录下来,实习学生在实习期迟到的情况被门镜系统记录下来,N表示表示正常,正常,F表示迟到,根据以下记录判断这名学生迟到是否随机。表示迟到,根据以下记录判断这名学生迟到是否随机。1 2 3 4 5 6 7 8 9 10 NNN F NNNNNNN F NN FF NNNNNN F NNNN F 11 12 13 NNNNN FFFF NNNNNNNNNNNN R=13解解 假设检验问题:假设检验问题:05H0:学生迟到是随机的。学生迟到是随机的。H1:学生迟到不随机。学生迟到不随机。本例中本例中n1=40,n0=1=0,=0.05如果如果-1.96 Z library(tseries)run1=c(1,1,1,0,rep(1,7),0,1,1,0,0,rep(1,6),+0,rep(1,4),0,rep(1,5),rep(0,4),rep(1,13)a=as.factor(run1)#将将run1转换为因子型变量转换为因子型变量 runs.test(a)Runs Testdata:aStandard Normal=-1.8074,p-value=0.0707alternative hypothesis:two.sided R中常量基本分为四种类型,逻辑型,数值型,字符型,因子型。中常量基本分为四种类型,逻辑型,数值型,字符型,因子型。因子型分为顺序数据和分类数据两种类别,表现为数字但不能因子型分为顺序数据和分类数据两种类别,表现为数字但不能进行加减乘除。进行加减乘除。R软件中随机游程检验的程序及输出结果在R软件中,我们可以直接调用函数进行随机游程检验,首先需要装在软件包tseries。选择Packages-Install pacakges(s),在弹出的对话框中选择一个稳定的镜像地址,系统会自动连接到主页:http:/cran.r-project.org/上的统计包。选择需要的统计包自动安装,在输入library(tseries)。