非参数统计检验方法的应用.doc
《非参数统计检验方法的应用.doc》由会员分享,可在线阅读,更多相关《非参数统计检验方法的应用.doc(5页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、论文投稿领域:数理经济与计量经济学非参数统计检验方法的应用阮曙芬1 程娇翼1 张振中2(1. 中国地质大学数理学院,武汉 ;2.中南大学数学科学与计算学院,长沙)摘要:本文对非参数统计中常用的三种假设检验方法进行了简单的介绍。运用Kruskal-Wallis检验方法对2002年前三季度的上海股市综合指数收益率数据进行了周末效应的检验,结果表明2002年上海股市综合指数收益率不具有周末效应。关键字:符号检验;Wilcoxon秩和检验;Kruskal-Wallis检验1引言非参数统计是统计分析的重要组成部分。非参数假设检验是在总体分布未知或者总体分布不满足参数统计对总体所做的假定的时候,分析样本特
2、点,寻找相应的非参数检验统计量。本文就是以此为出发点,介绍了非参数统计中假设检验常用的几个检验方法:符号检验、Wilcoxon秩和检验和Kruskal-Wallis检验,然后结合具体的问题和数据,在统计软件SAS中作相应的非参数检验。2非参数假设检验介绍2.1 配对样本的符号检验符号检验是根据正、负符号进行假设检验的方法。这种检验方法用于配对设计数值变量资料的假设检验,常常是差值不服从正态分布或者总体分布未知的情况下不能用检验的时候使用。其原理是对差值进行编制并冠以符号,然后对正负秩和进行比较检验。设随机变量相互独立同分布,分布为,在连续。假设检验问题: :检验统计量可取,即为中取正号的个数。
3、在下,的分布是参数为和的二项分布。2.2 两独立样本的Wilcoxon秩和检验Wilcoxon秩和检验的理论背景如下:有两个总体,一个总体的样本为,相互独立同分布,分布为;另一个样本为,相互独立同分布,分布为,连续。问随机变量是否随机大于随机变量,即检验:,:,且有某些点不等号成立。将,共个随机变量一起排序,产生对应的秩。则Wilcoxon秩和检验统计量为:即在混合样本中的秩的和为Wilcoxon秩和检验统计量。2.3多样本的Kruskal-Wallis检验Kruskal-Wallis检验一般对多个总体的分布情况进行检验。其理论基础为:假设有种处理,对于第个检验体实行第种处理产生的效果记为,其
4、分布函数为。即:;:存在和,。 设观测值为。全体样本数为,的顺位记为。假定同顺位不会出现。考虑统计量:检验方法为:。 其中,。当较小时,可以查表得到的值;当该值较大时,近似服从自由度为的分布。因此,为自由度为的分布的右侧的分位数点。3 Kruskal-Wallis检验的应用股市的周末效应是指周一的收益率比其他交易日收益率低,且风险较大;周五的收益率比其他交易日高,且相对风险较小。下面分别对2002年的前三季度的上证综合指数进行周末效应的分析。本实证分析中,样本为2002年1月4日到2002年9月27日的上海股市综合指数(数据来源于3.1收益率分布状况的分析首先计算收益率序列的方差,均值,偏度和
5、峰度初步判断该序列是否服从正态分布。然后利用Kolmogorov-Smirnov等检验结果对收益率进行正态性检验。 SAS程序创建数据集:将excel数据导入SAS中,然后在分析家中利用数据计算得到:r0=p/lag1(p)和r=log(r0);data sasuser.chx1 sasuser.chx2 sasuser.chx3 sasuser.chx4 sasuser.chx5;set sasuser.ch01;select (w); when(1) output sasuser.chx1; when(2) output sasuser.chx2; when(3) output sasus
6、er.chx3; when(4) output sasuser.chx4; when(5) output sasuser.chx5;end;run; proc univariate data=sasuser.ch01; var r;run;SAS结果输出见表1汇总表1 上证指数收益率描述性统计分析星期周一周二周三周四周五全体数据均值-3.882 E-34.875 E-30.422 E-31.363 E-3-3.423 E-3-0.110 E-3t统计量-1.268(0.214)1.399(0.171)0.180(0.858)0.423(0.675)-1.776(0.085)-0.084(0.9
7、33)自由度3434343433169方差0.319 E-30.413 E-30.186 E-30.352 E-30.123 E-30.283 E-3偏度-1.0692.2922.6960.992-0.6301.144峰度3.6667.85012.4333.6460.3897.084由上表可知,上证指数收益率序列的偏度和峰度分别为1.144和 7.084,而正态分布的偏度和峰度分别为0和3,所以我们可以初步断定指数收益率序列为非正态分布。为了进一步证实这一论断,我们对收益率序列进行Kolmogorov-Smirnov检验。SAS自动输出包括Kolmogorov-Smirnov检验统计量在内的四
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 参数 统计 检验 方法 应用
限制150内