第六章非参数检验精选文档.ppt
《第六章非参数检验精选文档.ppt》由会员分享,可在线阅读,更多相关《第六章非参数检验精选文档.ppt(42页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、第六章非参数检验本讲稿第一页,共四十二页主要内容 n非参数检验和参数检验的区别n总体分布的卡方检验n二项分布检验nSPSS单样本变量值随机性检验nSPSS单样本K-S检验n两独立样本非参数检验n多独立样本非参数检验n两配对样本非参数检验n多配对样本非参数检验本讲稿第二页,共四十二页非参数检验简介 n参数检验方法检验的内容是总体分布的某些参数,例如均值,方差,比率等。n非参数检验主要用于不考虑被研究对象的总体分布,或对总体的分布不做任何事先的假定的检验。n非参数检验的内容不是总体分布的某些参数,而是检验总体某些有关的性质,例如总体的分布位置、分布形状之间的比较,或者各样本所在总体是否独立等。本讲
2、稿第三页,共四十二页非参数检验方法的优点 n稳健性:因对总体分布的约束条件放宽,从而对一些离群值或极端值不至于太敏感。n使用范围广:对数据的度量标准(或测量测度)无约束,定序数据、定量数据都可;部分数据缺失也可;小样本、分布未知样本、数据污染样本、混杂样本等都可以应用非参数方法。本讲稿第四页,共四十二页非参数检验的应用范围n参数检验方法的条件不满足。例如样本来自的总体不服从正态分布,T检验不适用,必须应用非参数方法来比较两个总体的中心趋势。n研究定类变量和定序变量之间的关系。本讲稿第五页,共四十二页SPSS非参数检验本讲稿第六页,共四十二页非参数检验n非参数检验根据样本数目以及样本之间的关系可
3、以分为:单样本非参数检验两独立样本非参数检验多独立样本非参数检验两配对样本非参数检验多配对样本非参数检验本讲稿第七页,共四十二页单样本非参数检验 nSPSS的单样本非参数检验方法包括:总体分布的卡方(Chi-square)检验二项分布(Binomial)检验单样本K-S(Kolmogorov-Smirnov)检验单样本变量值随机性检验(Runs Test)本讲稿第八页,共四十二页卡方检验n卡方检验是一种常用的对总体分布进行检验的非参数检验方法。n例如,医生研究心脏病人猝死人数与日期的关系,检验现在的人口结构和十年前是否一样,血型是否和人的性格有关系,现代社会中受过高等教育、高中毕业、初中毕业、
4、小学毕业和文盲的比例是否为3:6:10:2:1等问题都可以通过卡方检验来实现。本讲稿第九页,共四十二页卡方检验的定义n定义:总体分布的卡方检验适用于配合度检验,是根据样本数据的实际频数推断总体分布与期望分布或理论分布是否有显著差异。n卡方检验的原假设是:H0样本来自的总体的分布与假设的分布(又称期望分布或者理论分布)无显著差异。本讲稿第十页,共四十二页卡方检验的原理(1)n卡方检验的基本思想是,如果从一个随机变量X所在的总体中随机抽取若干个观察样本,这些观察样本落在X的k个互不相交的子集中的观测频数服从一个多项分布,这个多项分布当k趋于无穷时近似服从卡方分布。本讲稿第十一页,共四十二页卡方检验
5、的原理(2)n因此假设样本来自总体服从某个期望分布或理论分布,同时获得样本数据各子集的实际观察频数,并根据下面的公式计算统计量Q,作出推断:n其中,Qi表示观察频数,Ei表示期望频数或理论频数。可见Q值越大,表示观察频数和理论频数越不接近;Q值越小,说明观察频数和理论频数越接近。本讲稿第十二页,共四十二页卡方检验的原理(3)nSPSS将自动计算Q统计量,由于Q统计量服从自由度为k-1的卡方分布,因此SPSS将根据卡方分布表给出Q统计量所对应的相伴概率值。n如果相伴概率小于或等于显著性水平,则应拒绝零假设H0,认为样本来自的总体分布形态与期望分布或理论分布存在显著差异;如果相伴概率值大于显著性水
6、平,则不能拒绝零假设,认为样本来自的总体分布形态与期望分布或理论分布不存在显著差异。本讲稿第十三页,共四十二页卡方检验例子n某地一周内各日患忧郁症的人数分布如下表所示,请检验一周内各日患忧郁症人数是否满足1:1:2:2:1:1:1本讲稿第十四页,共四十二页单击Data菜单中的Weight Cases命令,弹出Weight Cases对话框,选中Weight cases by选项,将变量“患者数”添加到Frequency Variable框中,定义该变量为权数,再单击OK按钮,返回数据编辑窗口。本讲稿第十五页,共四十二页本讲稿第十六页,共四十二页弹出Chi-Square Test对话框,要对一周
7、内各日的人数进行分布分析,故在对话框左侧的变量列表中选择“周日”变量,使之添加到Test Variable List框中。确定待检验样本的取值范围所有数据都参加检验用户自定义一个取值范围,只有在这个范围内的数据才参与检验给出期望分布的频数表示所有分组的期望频数都相同,即期望分布为均匀分布要求用户输入期望分布的频率数,通过单击Add(增加),Change(更改),Remove(删除)按钮对期望分布进行操作本讲稿第十七页,共四十二页单击Chi-Square Test对话框中的Options按钮,打开上图对话框。Options对话框中的Statistics框用来指定输出附加的分析结果,其中:Desc
8、riptive:表示输出待检验变量的描述统计量Quartiles:表示输出待检验变量的四分位数Missing Values框用来说明缺失值如何处理,其中:Exclude cases test-by-test:表示当分析计算涉及到含有缺失值的变量时,则去掉在该变量上是缺失值的个案Exclude cases listwise:表示去除所有含缺失值的个案后再进行分析本讲稿第十八页,共四十二页结果分析第一个表中,周一到周日实际患病的人数(Observed N)分别为31、38、70、80、29、24、31,按照给定的理论分布,这一周各天的期望频数(Expected N)应为33.7、33.7、67.3
9、、67.3、33.7、33.7、33.7。实际观察频数和期望频数的差(Residual)分别为-2.7、4.3、2.7、12.7、-4.7、-9.7、-2.7第二表中,Asymp.Sig值即相伴概率值0.331,大于显著性水平0.05,因此不能拒绝零假设,可以认为样本来自的总体分布与指定的期望分布无显著差异,即忧郁症患病人数在一周内的比例关系基本是1:1:2:2:1:1:1本讲稿第十九页,共四十二页二项分布检验n现实生活中有很多数据的取值只有两类,如医学中的生与死、患病的有与无、性别中的男与女、产品的合格与不合格等。从这种二分类总体中抽取的所有可能结果,要么是对立分类中的这一类,要么是另一类,
10、其频数分布称为二项分布。nSPSS二项分布检验就是根据收集到的样本数据,推断总体分布是否服从某个指定的二项分布。本讲稿第二十页,共四十二页二项分布检验n其零假设是:样本来自的总体与所指定的某个二项分布不存在显著的差异。n如果相伴概率小于或等于显著性水平,则应拒绝零假设H0,认为样本来自的总体分布形态与指定的二项分布存在显著差异;如果相伴概率值大于显著性水平,则不能拒绝零假设,认为样本来自的总体分布形态与指定的二项分布不存在显著差异。本讲稿第二十一页,共四十二页二项分布检验n例:某地某一时期内出生35名婴儿,其中女性19名,男性16名,问这个地方出生婴儿的性别比例与通常的男女比例(总体概率约为0
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 第六 参数 检验 精选 文档
限制150内