SPSS非参数检验.pdf
《SPSS非参数检验.pdf》由会员分享,可在线阅读,更多相关《SPSS非参数检验.pdf(6页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、非参数检验 SPSS 单样本非参数检验是对单个总体的分布形态等进行推断的方法,其中包括卡方检验、二项分布检验、KS 检验以及变量值随机性检验等方法.参数检验与非参数检验的区别:参数检验是在总体分布形式已知的情况下,对总体分布的参数如均值、方差等进行推断的方法。但是,在数据分析过程中,由于种种原因,人们往往无法对总体分布形态作简单假定,此时参数检验的方法就不再适用了。非参数检验正是一类基于这种考虑,在总体方差未知或知道甚少的情况下,利用样本数据对总体分布形态等进行推断的方法。由于非参数检验方法在推断过程中不涉及有关总体分布的参数,因而得名为“非参数检验。一、几种常见的非参数检验 1、总体分布的卡
2、方检验 卡方检验方法可以根据样本数据,推断总体分布与期望分布或某一理论分布是否存在显著差异,是一种吻合性检验,通常适于对有多项分类值的总体分布的分析。它的原假设是:样本来自的总体分布与期望分布或某一理论分布无差异。例如,医学家在研究心脏病人猝死人数与日期的关系时发现:一周之中,星期一心脏病人猝死者较多,其他日子则基本相当.当天的比例近似为 2。8:1:1:1:1:1:1。现收集到心脏病人死亡日期的样本数据,推断其总体分布是否与上述理论分布相吻合.2、二项分布检验 SPSS 的二项分布检验正是要通过样本数据检验样本来自的总体是否服从指定的概率为P 的二项分布,其原假设是:样本来自的总体与指定的二
3、项分布无显著差异。在生活中有很多数据的取值是二值的,例如,人群可以分成男性和女性,产品可以分成合格和不合格,学生可以分成三好学生和非三好学生,投掷硬币实验的结果可以分成出现正面和出现反面等.通常将这样的二值分别用 1 或 0 表示。如果进行 n 次相同的实验,则出现两类(1 或 0)的次数可以用离散型随机变量 X来描述。如果随机变量 X 为 1 的概率设为 P,则随机变量 X 值为 0 的概率 Q 便等于 1-P,形成二项分布。从某产品中随机抽取 23 个样品进行检测并得到检测结果.用 1 表示一级品,用 0 表示非一级品。根据抽样结果验证该批产品的一级品率是否为90%。3、单样本 K-S 检
4、验 KS 检验方法能够利用样本数据推断样本来自的总体是否服从某一理论分布,是一种拟合优度的检验方法,适用于探索连续型随机变量的分布.单样本 KS 检验的原假设是:样本来自的总体与指定的理论分布无显著差异,SPSS 的理论分布主要包括正态分布、均匀分布、指数分布和泊松分布等.例如,收集一批周岁儿童身高的数据,需利用样本数据推断周岁儿童总体的身高是否服从正态分布。再例如,利用收集的住房状况调查的样本数据,分析家庭人均住房面积是否服从正态分布。4、变量值随机性检验 变量值随机性检验通过对样本变量值的分析,实现对总体的变量值出现是否随机进行检验。例如,在投硬币时,如果以 1 表示出现的是正面,以 0
5、表示出现的是反面,在进行了若干次投币后,将会得到一个以 1,0 组成的变量值序列。这时可能会分析“硬币出现正反面是否是随机的”这样的问题。变量值随机性检验正是解决这类问题的一个有效方法.它的原假设是:总体变量值出现是随机的。变量随机性检验的重要依据是游程。所谓游程是样本序列中连续出现相同的变量值的次数。可以直接理解,如果硬币的正反面出现是随机的,那么在数据序列中,许多个 1 或许多个 0 连续出现的可能性将不太大,同时,1 和 0 频繁交叉出现的可能性也会较小。因此,游程数太大或太小都将表明变量值存在不随机的现象。例:为检验某耐压设备在某段时间内工作是否持续正常,测试并记录下该时间段内各个时间
6、点上的设备耐压的数据。现采用游程检验方法对这批数据进行分析。如果耐压数据的变动是随机的,可认为该设备工作一直正常,否则认为该设备有不能正常工作的现象。二、检验方法 1、两独立样本的非参数检验 两独立样本的非参数检验是在对总体分布不甚了解的情况下,通过对两组独立样本的分析来推断样本来自的两个总体的分布等是否存在显著差异的方法.独立样本是指在一个总体中随机抽样对在另一个总体中随机抽样没有影响的情况下所获得的样本.SPSS 中提供了多种两独立样本的非参数检验方法,其中包括曼-惠特尼 U 检验、K-S 检验、WW 游程检验、极端反应检验等。某工厂用甲乙两种不同的工艺生产同一种产品。如果希望检验两种工艺
7、下产品的使用是否存在显著差异,可从两种工艺生产出的产品中随机抽样,得到各自的使用寿命数据.甲工艺:675 682 692 679 669 661 693 乙工艺:662 649 672 663 650 651 646 652(1)曼惠特尼 U 检验 两独立样本的曼惠特尼 U 检验可用于对两总体分布的比例判断。其原假设:两组独立样本来自的两总体分布无显著差异。曼惠特尼 U 检验通过对两组样本平均秩的研究来实现判断.秩简单说就是变量值排序的名次,可以将数据按升序排列,每个变量值都会有一个在整个变量值序列中的位置或名次,这个位置或名次就是变量值的秩。(2)KS 检验 K-S 检验不仅能够检验单个总体
8、是否服从某一理论分布,还能够检验两总体分布是否存在显著差异。其原假设是:两组独立样本来自的两总体的分布无显著差异。这里是以变量值的秩作为分析对象,而非变量值本身。(3)游程检验 单样本游程检验是用来检验变量值的出现是否随机,而两独立变量的游程检验则是用来检验两独立样本来自的两总体的分布是否存在显著差异。其原假设是:两组独立样本来自的两总体的分布无显著差异。两独立样本的游程检验与单样本游程检验的思想基本相同,不同的是计算游程数的方法。两独立样本的游程检验中,游程数依赖于变量的秩。(4)极端反应检验 极端反应检验从另一个角度检验两独立样本所来自的两总体分布是否存在显著差异。其原假设是:两独立样本来
9、自的两总体的分布无显著差异。基本思想是:将一组样本作为控制样本,另一组样本作为实验样本。以控制样本作为对照,检验实验样本相对于控制样本是否出现了极端反应。如果实验样本没有出现极端反应,则认为两总体分布无显著差异,相反则认为存在显著差异。2、多独立样本的非参数检验 多独立样本的非参数检验是通过分析多组独立样本数据,推断样本来自的多个总体的中位数或分布是否存在显著差异.多组独立样本是指按独立抽样方式获得的多组样本.SPSS 提供的多独立样本非参数检验的方法主要包括中位数检验、KruskalWallis 检验、Jonckheere-Terpstra 检验。例:希望对北京、上海、成都、广州四个城市的周
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- SPSS 参数 检验
限制150内