spss非参数检验.ppt
《spss非参数检验.ppt》由会员分享,可在线阅读,更多相关《spss非参数检验.ppt(152页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、总体分布的卡方(总体分布的卡方(Chi-squareChi-square)检验)检验10.1二项分布检验二项分布检验10.2SPSSSPSS单样本变量值随机性检验单样本变量值随机性检验10.3 SPSS SPSS单样本单样本K-SK-S检验检验10.4两独立样本非参数检验两独立样本非参数检验10.5多独立样本非参数检验多独立样本非参数检验10.6两配对样本非参数检验两配对样本非参数检验10.7多配对样本非参数检验多配对样本非参数检验10.8 前面已经讨论的许多统计分析方法对总体前面已经讨论的许多统计分析方法对总体有特殊的要求,如有特殊的要求,如T T检验要求总体符合正态分检验要求总体符合正态分
2、布,布,F F检验要求误差呈正态分布且各组方差整检验要求误差呈正态分布且各组方差整齐,等等。这些方法常用来估计或检验总体参齐,等等。这些方法常用来估计或检验总体参数,统称为参数检验。数,统称为参数检验。 但许多调查或实验所得的科研数据,其总但许多调查或实验所得的科研数据,其总体分布未知或无法确定。因为有的数据不是来体分布未知或无法确定。因为有的数据不是来自所假定分布的总体,或者数据根本不是来自自所假定分布的总体,或者数据根本不是来自一个总体,还有可能数据因为某种原因被严重一个总体,还有可能数据因为某种原因被严重污染,这样在假定分布的情况下进行推断的做污染,这样在假定分布的情况下进行推断的做法就
3、有可能产生错误的结论。此时人们希望检法就有可能产生错误的结论。此时人们希望检验对一个总体分布形状不必作限制。验对一个总体分布形状不必作限制。 这种不是针对总体参数,而是针对总体的这种不是针对总体参数,而是针对总体的某些一般性假设(如总体分布)的统计分析方某些一般性假设(如总体分布)的统计分析方法称非参数检验(法称非参数检验(Nonparametric TestsNonparametric Tests)。)。非参数检验根据样本数目以及样本之间的关系非参数检验根据样本数目以及样本之间的关系可以分为单样本非参数检验、两独立样本非参可以分为单样本非参数检验、两独立样本非参数检验、多独立样本非参数检验、
4、两配对样本数检验、多独立样本非参数检验、两配对样本非参数检验和多配对样本非参数检验几种。非参数检验和多配对样本非参数检验几种。 本章将介绍总体分布的卡方(本章将介绍总体分布的卡方(Chi-Chi-squaresquare)检验、二项分布()检验、二项分布(BinomialBinomial)检验、)检验、单样本单样本K-SK-S(Kolmogorov-SmirnovKolmogorov-Smirnov)检验、单)检验、单样本变量值随机性检验(样本变量值随机性检验(Runs TestRuns Test)、两独)、两独立样本非参数检验、多独立样本非参数检验、立样本非参数检验、多独立样本非参数检验、两
5、配对样本非参数检验、多配对样本非参数检两配对样本非参数检验、多配对样本非参数检验等验等8 8类常用的非参数检验方法。其中前类常用的非参数检验方法。其中前4 4种属种属于单样本非参数检验。于单样本非参数检验。 在得到一批样本数据后,人们往往希望从在得到一批样本数据后,人们往往希望从中得到样本所来自的总体的分布形态是否和某中得到样本所来自的总体的分布形态是否和某种特定分布相拟合。这可以通过绘制样本数据种特定分布相拟合。这可以通过绘制样本数据直方图的方法来进行粗略的判断。如果需要进直方图的方法来进行粗略的判断。如果需要进行比较准确的判断,则需要使用非参数检验的行比较准确的判断,则需要使用非参数检验的
6、方法。其中总体分布的卡方检验(也记为方法。其中总体分布的卡方检验(也记为22检验)就是一种比较好的方法。检验)就是一种比较好的方法。10.1.1 统计学上的定义和计算公式统计学上的定义和计算公式 定义:总体分布的卡方检验适用于配合度定义:总体分布的卡方检验适用于配合度检验,是根据样本数据的实际频数推断总体分检验,是根据样本数据的实际频数推断总体分布与期望分布或理论分布是否有显著差异。它布与期望分布或理论分布是否有显著差异。它的零假设的零假设H0H0:样本来自的总体分布形态和期望:样本来自的总体分布形态和期望分布或某一理论分布没有显著差异。分布或某一理论分布没有显著差异。 因此,总体分布的卡方检
7、验是一种吻合性因此,总体分布的卡方检验是一种吻合性检验,比较适用于一个因素的多项分类数据分检验,比较适用于一个因素的多项分类数据分析。总体分布的卡方检验的数据是实际收集到析。总体分布的卡方检验的数据是实际收集到的样本数据,而非频数数据。的样本数据,而非频数数据。 研究问题研究问题 某地一周内各日患忧郁症的人数分布如表某地一周内各日患忧郁症的人数分布如表10-110-1所示,请检验一周内各日人们忧郁数是否所示,请检验一周内各日人们忧郁数是否满足满足1:1:2:2:1:1:11:1:2:2:1:1:1。10.1.2 SPSS中实现过程中实现过程周周 日日患患 者者 数数13123837048052
8、9624731 实现步骤实现步骤 (1 1)本例输出结果中有两个表格,其中)本例输出结果中有两个表格,其中第一个表格如下。第一个表格如下。10.1.3 结果和讨论结果和讨论(2 2)输出的结果文件中第二个表格如下。)输出的结果文件中第二个表格如下。10.2.1 统计学上的定义和计算公式统计学上的定义和计算公式 现实生活中有很多数据的取值只有两类,现实生活中有很多数据的取值只有两类,如医学中的生与死、患病的有与无、性别中的如医学中的生与死、患病的有与无、性别中的男性和女性、产品的合格与不合格等。从这种男性和女性、产品的合格与不合格等。从这种二分类总体中抽取的所有可能结果,要么是对二分类总体中抽取
9、的所有可能结果,要么是对立分类中的这一类,要么是另一类,其频数分立分类中的这一类,要么是另一类,其频数分布称为二项分布。调用布称为二项分布。调用SPSSSPSS中的二项分布检验中的二项分布检验(BinomialBinomial)可对样本资料进行二项分布分)可对样本资料进行二项分布分析。析。 SPSS SPSS二项分布检验就是根据收集到的样二项分布检验就是根据收集到的样本数据,推断总体分布是否服从某个指定的二本数据,推断总体分布是否服从某个指定的二项分布。其零假设是项分布。其零假设是H0H0:样本来自的总体与所:样本来自的总体与所指定的某个二项分布不存在显著的差异。指定的某个二项分布不存在显著的
10、差异。 SPSS SPSS中的二项分布检验,在样本小于或中的二项分布检验,在样本小于或等于等于3030时,按照计算二项分布概率的公式进行时,按照计算二项分布概率的公式进行计算;样本数大于计算;样本数大于3030时,计算的是时,计算的是Z Z统计量,统计量,认为在零假设下,认为在零假设下,Z Z统计量服从正态分布。统计量服从正态分布。Z Z统统计量的计算公式如下计量的计算公式如下 SPSS SPSS将自动计算将自动计算Z Z统计量,并给出相应的统计量,并给出相应的相伴概率值。如果相伴概率小于或等于用户的相伴概率值。如果相伴概率小于或等于用户的显著性水平显著性水平,则应拒绝零假设,则应拒绝零假设H
11、0H0,认为样本,认为样本来自的总体分布形态与指定的二项分布存在显来自的总体分布形态与指定的二项分布存在显著差异;如果相伴概率值大于显著性水平,则著差异;如果相伴概率值大于显著性水平,则不能拒绝零假设不能拒绝零假设H0H0,认为样本来自的总体分布,认为样本来自的总体分布形态与指定的二项分布不存在显著差异。形态与指定的二项分布不存在显著差异。SPSSSPSS二项分布检验的数据是实际收集到的样本二项分布检验的数据是实际收集到的样本数据,而非频数数据。数据,而非频数数据。 研究问题研究问题某地某一时期内出生某地某一时期内出生3535名婴儿,其中女性名婴儿,其中女性1919名名(定(定Sex=0Sex
12、=0),男性),男性1616名(定名(定Sex=1Sex=1)。问这)。问这个地方出生婴儿的性别比例与通常的男女性比个地方出生婴儿的性别比例与通常的男女性比例(总体概率约为例(总体概率约为0.50.5)是否不同?数据如表)是否不同?数据如表10-210-2所示。所示。 10.2.2 SPSS中实现过程中实现过程婴婴 儿儿Sex婴婴 儿儿Sex婴婴 儿儿Sex111312512014126131151270411612805117029061180300701903118020032090210330100220340111231350121241 实现步骤实现步骤10.2.3 结果和讨论结果和
13、讨论10.3.1 统计学上的定义和计算公式统计学上的定义和计算公式 定义:单样本变量值的随机性检验是对某定义:单样本变量值的随机性检验是对某变量的取值出现是否随机进行检验,也称为游变量的取值出现是否随机进行检验,也称为游程检验(程检验(RunRun过程)。过程)。 单样本变量值的随机性检验是由单样本变量值的随机性检验是由WaldWald提提出的,它的零假设为出的,它的零假设为H0H0:总体某变量的变量值:总体某变量的变量值出现是随机的。出现是随机的。 单样本变量值的随机性检验通过游程单样本变量值的随机性检验通过游程(RunRun)数来实现。所谓游程是样本序列中连)数来实现。所谓游程是样本序列中
14、连续出现的变量值的次数。续出现的变量值的次数。 在在SPSSSPSS单样本变量值的随机性检验中,单样本变量值的随机性检验中,SPSSSPSS将利用游程构造将利用游程构造Z Z统计量,并依据正态分统计量,并依据正态分布表给出对应的相伴概率值。如果相伴概率小布表给出对应的相伴概率值。如果相伴概率小于或等于用户的显著性水平于或等于用户的显著性水平,则应拒绝零假,则应拒绝零假设设H0H0,认为样本值的出现不是随机的;如果相,认为样本值的出现不是随机的;如果相伴概率值大于显著性水平,则不能拒绝零假设伴概率值大于显著性水平,则不能拒绝零假设H0H0,认为变量值的出现是随机的。,认为变量值的出现是随机的。1
15、0.3.2 SPSS中实现过程中实现过程 研究问题研究问题 某村发生一种地方病,其住户沿一条河排某村发生一种地方病,其住户沿一条河排列,调查时对发病的住户标记为列,调查时对发病的住户标记为“1”1”,对非,对非发病的住户标记为发病的住户标记为“0”0”,共,共3535户,其取值如户,其取值如表表10-310-3所示。所示。 住住 户户发发 病病 情情 况况住住 户户发发 病病 情情 况况住住 户户发发 病病 情情 况况11131251201412613115127041161281511702906118030070191311802013209021033010022034011123135
16、0121241 实现步骤实现步骤10.3.3 结果和讨论结果和讨论10.4.1 统计学上的定义和计算公式统计学上的定义和计算公式 定义:单样本定义:单样本K-SK-S检验是以两位前苏联数检验是以两位前苏联数学家学家KolmogorovKolmogorov和和SmirnovSmirnov命名的,也是一种命名的,也是一种拟合优度的非参数检验方法。单样本拟合优度的非参数检验方法。单样本K-SK-S检验检验是利用样本数据推断总体是否服从某一理论分是利用样本数据推断总体是否服从某一理论分布的方法,适用于探索连续型随机变量的分布布的方法,适用于探索连续型随机变量的分布形态。形态。 单样本单样本K-SK-S
17、检验可以将一个变量的实际频检验可以将一个变量的实际频数分布与正态分布(数分布与正态分布(NormalNormal)、均匀分布)、均匀分布(UniformUniform)、泊松分布()、泊松分布(PoissonPoisson)、指数)、指数(ExponentialExponential)分布进行比较。其零假设)分布进行比较。其零假设H0H0为样本来自的总体与指定的理论分布无显著差为样本来自的总体与指定的理论分布无显著差异。异。SPSSSPSS实现实现K-SK-S检验的过程如下:检验的过程如下: (1 1)根据样本数据和用户的指定构造出)根据样本数据和用户的指定构造出理论分布,查分布表得到相应的理
18、论累计概率理论分布,查分布表得到相应的理论累计概率分布函数;分布函数; SPSS SPSS在统计中将计算在统计中将计算K-SK-S的的Z Z统计量,并统计量,并依据依据K-SK-S分布表(小样本)或正态分布表(大分布表(小样本)或正态分布表(大样本)给出对应的相伴概率值。如果相伴概率样本)给出对应的相伴概率值。如果相伴概率小于或等于用户的显著性水平小于或等于用户的显著性水平,则应拒绝零,则应拒绝零假设假设H0H0,认为样本来自的总体与指定的分布有,认为样本来自的总体与指定的分布有显著差异;如果相伴概率值大于显著性水平,显著差异;如果相伴概率值大于显著性水平,则不能拒绝零假设则不能拒绝零假设H0
19、H0,认为样本来自的总体与,认为样本来自的总体与指定的分布无显著差异。指定的分布无显著差异。10.4.2 SPSS中实现过程中实现过程 研究问题研究问题 某地某地144144个周岁儿童身高数据如表个周岁儿童身高数据如表10-410-4所所示,问该地区周岁儿童身高频数是否呈正态分示,问该地区周岁儿童身高频数是否呈正态分布?布? 身身 高高 区区 间间人人 数数642684697701671207225732474227616782796831 实现步骤实现步骤10.4.3 结果和讨论结果和讨论(1 1)本例输出结果如下表所示。)本例输出结果如下表所示。10.5.1 统计学上的定义和计算公式统计学
20、上的定义和计算公式 定义:两独立样本的非参数检验是在对总定义:两独立样本的非参数检验是在对总体分布不很了解的情况下,通过分析样本数据,体分布不很了解的情况下,通过分析样本数据,推断样本来自的两个独立总体分布是否存在显推断样本来自的两个独立总体分布是否存在显著差异。一般用来对两个独立样本的均数、中著差异。一般用来对两个独立样本的均数、中位数、离散趋势、偏度等进行差异比较检验。位数、离散趋势、偏度等进行差异比较检验。两个样本是否独立,主要看在一个总体中抽取两个样本是否独立,主要看在一个总体中抽取样本对另外一个总体中抽取样本有无影响。如样本对另外一个总体中抽取样本有无影响。如果没有影响,则可以认为两
21、个总体是独立的。果没有影响,则可以认为两个总体是独立的。SPSSSPSS提供了提供了4 4种两独立样本的非参数检验方法。种两独立样本的非参数检验方法。1两独立样本的两独立样本的Mann-Whitney U检验检验两独立样本的两独立样本的Mann-Whitney UMann-Whitney U检验的零假设检验的零假设H0H0为样本来自的两独立总体均值没有显著差异。为样本来自的两独立总体均值没有显著差异。两独立样本的两独立样本的Mann-Whitney UMann-Whitney U检验主要通过检验主要通过对平均秩的研究来实现推断。秩简单地说就是对平均秩的研究来实现推断。秩简单地说就是名次。如果将
22、数据按照升序进行排序,这时每名次。如果将数据按照升序进行排序,这时每一个具体数据都会有一个在整个数据中的位置一个具体数据都会有一个在整个数据中的位置或名次,这就是该数据的秩,数据有多少个,或名次,这就是该数据的秩,数据有多少个,秩便有多少个。秩便有多少个。2两独立样本的两独立样本的K-S检验检验两独立样本的两独立样本的K-SK-S检验能够对两独立样本的总检验能够对两独立样本的总体分布情况进行比较。其零假设是体分布情况进行比较。其零假设是H0H0为样本来为样本来自的两独立总体分布没有显著差异。自的两独立总体分布没有显著差异。两独立样本的两独立样本的K-SK-S检验实现方法是:首先将两检验实现方法
23、是:首先将两组样本数据(组样本数据(X1X1,X2X2,XmXm)和()和(Y1Y1,Y2Y2,YnYn)混合并按升序排列()混合并按升序排列(m m和和n n是两是两组样本的样本容量),分别计算两组样本秩的组样本的样本容量),分别计算两组样本秩的累计频率和每个点上的累计频率;最后将两个累计频率和每个点上的累计频率;最后将两个累计频率相减,得到差值序列数据。累计频率相减,得到差值序列数据。两独立样本的两独立样本的K-SK-S检验将关注差值序列。检验将关注差值序列。SPSSSPSS将自动计算将自动计算K-S ZK-S Z统计量,并依据正态分布表统计量,并依据正态分布表给出对应的相伴概率值。如果相
24、伴概率小于或给出对应的相伴概率值。如果相伴概率小于或等于用户的显著性水平等于用户的显著性水平 ,则应拒绝零假设,则应拒绝零假设H0H0,认为两个样本来自的总体分布有显著差异;如认为两个样本来自的总体分布有显著差异;如果相伴概率值大于显著性水平,则不能拒绝零果相伴概率值大于显著性水平,则不能拒绝零假设假设H0H0,认为两个样本来自的总体分布无显著,认为两个样本来自的总体分布无显著差异。差异。3两独立样本的游程检验(两独立样本的游程检验(Wald-Wolfwitz Runs)两独立样本的游程检验用来检验样本来自的两两独立样本的游程检验用来检验样本来自的两独立总体的分布是否存在显著差异。其零假设独立
25、总体的分布是否存在显著差异。其零假设是是H0H0为样本来自的两独立总体分布没有显著差为样本来自的两独立总体分布没有显著差异。异。 样本的游程检验中,计算游程的方法与观样本的游程检验中,计算游程的方法与观察值的秩有关。首先,将两组样本混合并按照察值的秩有关。首先,将两组样本混合并按照升序排列。在数据排序时,两组样本的每个观升序排列。在数据排序时,两组样本的每个观察值对应的样本组标志值序列也随之重新排列,察值对应的样本组标志值序列也随之重新排列,然后对标志值序列按照前面然后对标志值序列按照前面10.310.3节的方法求游节的方法求游程。程。 如果计算出的游程数相对比较小,则说明如果计算出的游程数相
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- spss 参数 检验
限制150内