spss 使用教程非参数检验教案.pptx
《spss 使用教程非参数检验教案.pptx》由会员分享,可在线阅读,更多相关《spss 使用教程非参数检验教案.pptx(152页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、会计学1spss 使用教程非参数检验使用教程非参数检验总体分布的卡方(Chi-square)检验10.1二项分布检验10.2SPSS单样本变量值随机性检验10.3 SPSS单样本K-S检验10.4两独立样本非参数检验10.5多独立样本非参数检验10.6两配对样本非参数检验10.7多配对样本非参数检验10.8第1页/共152页阅读提示阅读提示n n非参数检验用于对样本的概率分布状态的检验n n建议先看实例再看理论n n实例1在15页第2页/共152页 前面已经讨论的许多统计分析方法对总体有特殊的要求,如T检验要求总体符合正态分布,F检验要求误差呈正态分布且各组方差整齐,等等。这些方法常用来估计或
2、检验总体参数,统称为参数检验。第3页/共152页 但许多调查或实验所得的科研数据,其总体分布未知或无法确定。因为有的数据不是来自所假定分布的总体,或者数据根本不是来自一个总体,还有可能数据因为某种原因被严重污染,这样在假定分布的情况下进行推断的做法就有可能产生错误的结论。此时人们希望检验对一个总体分布形状不必作限制。第4页/共152页 这种不是针对总体参数,而是针对总体的某些一般性假设(如总体分布)的统计分析方法称非参数检验(Nonparametric Tests)。非参数检验根据样本数目以及样本之间的关系可以分为单样本非参数检验、两独立样本非参数检验、多独立样本非参数检验、两配对样本非参数检
3、验和多配对样本非参数检验几种。第5页/共152页 本章将介绍总体分布的卡方(Chi-square)检验、二项分布(Binomial)检验、单样本K-S(Kolmogorov-Smirnov)检验、单样本变量值随机性检验(Runs Test)、两独立样本非参数检验、多独立样本非参数检验、两配对样本非参数检验、多配对样本非参数检验等8类常用的非参数检验方法。其中前4种属于单样本非参数检验。第6页/共152页10.1 10.1 总体分布的卡方(总体分布的卡方(Chi-squareChi-square)检验)检验 在得到一批样本数据后,人们往往希望从中得到样本所来自的总体的分布形态是否和某种特定分布相
4、拟合。这可以通过绘制样本数据直方图的方法来进行粗略的判断。如果需要进行比较准确的判断,则需要使用非参数检验的方法。其中总体分布的卡方检验(也记为2检验)就是一种比较好的方法。第7页/共152页 定义:总体分布的卡方检验适用于配合度检验,是根据样本数据的实际频数推断总体分布与期望分布或理论分布是否有显著差异。它的零假设H0:样本来自的总体分布形态和期望分布或某一理论分布没有显著差异。第8页/共152页第9页/共152页第10页/共152页第11页/共152页第12页/共152页 因此,总体分布的卡方检验是一种吻合性检验,比较适用于一个因素的多项分类数据分析。总体分布的卡方检验的数据是实际收集到的
5、样本数据,而非频数数据。第13页/共152页 研究问题 某地一周内各日患忧郁症的人数分布如表10-1所示,请检验一周内各日人们忧郁数是否满足1:1:2:2:1:1:1。第14页/共152页表表10-110-1学生的数学成绩学生的数学成绩周周 日日患患 者者 数数131238370480529624731第15页/共152页 实现步骤图图10-1 10-1 在菜单中选择在菜单中选择“Weight Cases”Weight Cases”命令命令第16页/共152页图图10-2 “Weight Cases”10-2 “Weight Cases”对话框对话框第17页/共152页图图10-3 10-3
6、在菜单中选择在菜单中选择“Chi-Square”Chi-Square”命令命令第18页/共152页图图10-4 “Chi-Square Test”10-4 “Chi-Square Test”对话框对话框第19页/共152页图图10-5 “Chi-Square Test10-5 “Chi-Square Test:Options”Options”对话框对话框第20页/共152页 (1)本例输出结果中有两个表格,其中第一个表格如下。第21页/共152页(2)输出的结果文件中第二个表格如下。第22页/共152页10.2 二项分布检验统计学上的定义和计算公式 现实生活中有很多数据的取值只有两类,如医学中
7、的生与死、患病的有与无、性别中的男性和女性、产品的合格与不合格等。从这种二分类总体中抽取的所有可能结果,要么是对立分类中的这一类,要么是另一类,其频数分布称为二项分布。调用SPSS中的二项分布检验(Binomial)可对样本资料进行二项分布分析。第23页/共152页 SPSS二项分布检验就是根据收集到的样本数据,推断总体分布是否服从某个指定的二项分布。其零假设是H0:样本来自的总体与所指定的某个二项分布不存在显著的差异。第24页/共152页 SPSS中的二项分布检验,在样本小于或等于30时,按照计算二项分布概率的公式进行计算;样本数大于30时,计算的是Z统计量,认为在零假设下,Z统计量服从正态
8、分布。Z统计量的计算公式如下第25页/共152页 SPSS将自动计算Z统计量,并给出相应的相伴概率值。如果相伴概率小于或等于用户的显著性水平,则应拒绝零假设H0,认为样本来自的总体分布形态与指定的二项分布存在显著差异;如果相伴概率值大于显著性水平,则不能拒绝零假设H0,认为样本来自的总体分布形态与指定的二项分布不存在显著差异。第26页/共152页SPSS二项分布检验的数据是实际收集到的样本数据,而非频数数据。第27页/共152页 研究问题某地某一时期内出生35名婴儿,其中女性19名(定Sex=0),男性16名(定Sex=1)。问这个地方出生婴儿的性别比例与通常的男女性比例(总体概率约为0.5)
9、是否不同?数据如表10-2所示。第28页/共152页表表10-210-23535名婴儿的性别名婴儿的性别婴婴 儿儿Sex婴婴 儿儿Sex婴婴 儿儿Sex111312512014126131151270411612805117029061180300701903118020032090210330100220340111231350121241第29页/共152页 实现步骤图图10-6 10-6 在菜单中选择在菜单中选择“Binomial Test”Binomial Test”命令命令第30页/共152页图图10-7 “Binomial Test”10-7 “Binomial Test”对话框对
10、话框第31页/共152页图图10-8 “Binomial Test10-8 “Binomial Test:Options”Options”对话框对话框第32页/共152页第33页/共152页10.3 SPSS单样本变量值随机性检验统计学上的定义和计算公式 定义:单样本变量值的随机性检验是对某变量的取值出现是否随机进行检验,也称为游程检验(Run过程)。第34页/共152页 单样本变量值的随机性检验是由Wald提出的,它的零假设为H0:总体某变量的变量值出现是随机的。单样本变量值的随机性检验通过游程(Run)数来实现。所谓游程是样本序列中连续出现的变量值的次数。第35页/共152页 在SPSS单
11、样本变量值的随机性检验中,SPSS将利用游程构造Z统计量,并依据正态分布表给出对应的相伴概率值。如果相伴概率小于或等于用户的显著性水平,则应拒绝零假设H0,认为样本值的出现不是随机的;如果相伴概率值大于显著性水平,则不能拒绝零假设H0,认为变量值的出现是随机的。第36页/共152页 研究问题 某村发生一种地方病,其住户沿一条河排列,调查时对发病的住户标记为“1”,对非发病的住户标记为“0”,共35户,其取值如表10-3所示。第37页/共152页表表10-310-33535名住户发病情况名住户发病情况住住 户户发发 病病 情情 况况住住 户户发发 病病 情情 况况住住 户户发发 病病 情情 况况
12、111312512014126131151270411612815117029061180300701913118020132090210330100220340111231350121241第38页/共152页 实现步骤图图10-9 10-9 在菜单中选择在菜单中选择“Runs”Runs”命令命令第39页/共152页图图10-10 “Runs Test”10-10 “Runs Test”对话框对话框第40页/共152页图图10-11 “Runs Test10-11 “Runs Test:Options”Options”对话框对话框第41页/共152页第42页/共152页统计学上的定义和计算公
13、式10.4 SPSS单样本K-S检验 定义:单样本K-S检验是以两位前苏联数学家Kolmogorov和Smirnov命名的,也是一种拟合优度的非参数检验方法。单样本K-S检验是利用样本数据推断总体是否服从某一理论分布的方法,适用于探索连续型随机变量的分布形态。第43页/共152页 单样本K-S检验可以将一个变量的实际频数分布与正态分布(Normal)、均匀分布(Uniform)、泊松分布(Poisson)、指数(Exponential)分布进行比较。其零假设H0为样本来自的总体与指定的理论分布无显著差异。第44页/共152页SPSS实现K-S检验的过程如下:(1)根据样本数据和用户的指定构造出
14、理论分布,查分布表得到相应的理论累计概率分布函数;第45页/共152页第46页/共152页 SPSS在统计中将计算K-S的Z统计量,并依据K-S分布表(小样本)或正态分布表(大样本)给出对应的相伴概率值。如果相伴概率小于或等于用户的显著性水平,则应拒绝零假设H0,认为样本来自的总体与指定的分布有显著差异;如果相伴概率值大于显著性水平,则不能拒绝零假设H0,认为样本来自的总体与指定的分布无显著差异。第47页/共152页 研究问题 某地144个周岁儿童身高数据如表10-4所示,问该地区周岁儿童身高频数是否呈正态分布?第48页/共152页表表10-410-4儿童身高数据儿童身高数据身身 高高 区区
15、间间人人 数数642684697701671207225732474227616782796831第49页/共152页 实现步骤图图10-12 10-12 在菜单中选择在菜单中选择“1-Sample K-S”1-Sample K-S”命令命令第50页/共152页图图10-13 “One-Sample Kolmogorov-Smirnov Test”10-13 “One-Sample Kolmogorov-Smirnov Test”对话框对话框第51页/共152页图图10-14 “One-Sample K-S10-14 “One-Sample K-S:Options”Options”对话框对话框
16、第52页/共152页(1)本例输出结果如下表所示。第53页/共152页10.5 两独立样本非参数检验 定义:两独立样本的非参数检验是在对总体分布不很了解的情况下,通过分析样本数据,推断样本来自的两个独立总体分布是否存在显著差异。一般用来对两个独立样本的均数、中位数、离散趋势、偏度等进行差异比较检验。第54页/共152页两个样本是否独立,主要看在一个总体中抽取样本对另外一个总体中抽取样本有无影响。如果没有影响,则可以认为两个总体是独立的。SPSS提供了4种两独立样本的非参数检验方法。第55页/共152页1两独立样本的Mann-Whitney U检验两独立样本的Mann-Whitney U检验的零
17、假设H0为样本来自的两独立总体均值没有显著差异。第56页/共152页两独立样本的Mann-Whitney U检验主要通过对平均秩的研究来实现推断。秩简单地说就是名次。如果将数据按照升序进行排序,这时每一个具体数据都会有一个在整个数据中的位置或名次,这就是该数据的秩,数据有多少个,秩便有多少个。第57页/共152页2两独立样本的K-S检验两独立样本的K-S检验能够对两独立样本的总体分布情况进行比较。其零假设是H0为样本来自的两独立总体分布没有显著差异。第58页/共152页两独立样本的K-S检验实现方法是:首先将两组样本数据(X1,X2,Xm)和(Y1,Y2,Yn)混合并按升序排列(m和n是两组样
18、本的样本容量),分别计算两组样本秩的累计频率和每个点上的累计频率;最后将两个累计频率相减,得到差值序列数据。第59页/共152页两独立样本的K-S检验将关注差值序列。SPSS将自动计算K-S Z统计量,并依据正态分布表给出对应的相伴概率值。如果相伴概率小于或等于用户的显著性水平,则应拒绝零假设H0,认为两个样本来自的总体分布有显著差异;如果相伴概率值大于显著性水平,则不能拒绝零假设H0,认为两个样本来自的总体分布无显著差异。第60页/共152页3两独立样本的游程检验(Wald-Wolfwitz Runs)两独立样本的游程检验用来检验样本来自的两独立总体的分布是否存在显著差异。其零假设是H0为样
19、本来自的两独立总体分布没有显著差异。第61页/共152页 样本的游程检验中,计算游程的方法与观察值的秩有关。首先,将两组样本混合并按照升序排列。在数据排序时,两组样本的每个观察值对应的样本组标志值序列也随之重新排列,然后对标志值序列按照前面10.3节的方法求游程。第62页/共152页 如果计算出的游程数相对比较小,则说明样本来自的两总体的分布形态存在较大差距;如果得到的游程数相对比较大,则说明样本来自的两总体的分布形态不存在显著差距。第63页/共152页 SPSS将自动计算游程数得到Z统计量,并依据正态分布表给出对应的相伴概率值。如果相伴概率小于或等于用户的显著性水平,则应拒绝零假设H0,认为
20、两个样本来自的总体分布有显著差异;如果相伴概率值大于显著性水平,则不能拒绝零假设H0,认为两个样本来自的总体分布无显著差异。第64页/共152页4两独立样本的极端反应检验(Moses Extreme Reactions)两独立样本的极端反应检验用来检验样本来自的两独立总体的分布是否存在显著差异。其零假设H0为样本来自的两独立总体分布没有显著差异。第65页/共152页 两独立样本的极端反应检验将一个样本作为控制样本,另外一个样本作为实验样本。以控制样本作对照,检验实验样本是否存在极端反应。首先将两组样本混合并按升序排列;然后找出控制样本最低秩和最高秩之间所包含的观察值个数,即跨度(Span)。为
21、控制极端值对分析结果的影响,也可以先去掉样本两个最极端的观察值后再求跨度,这个跨度称为截头跨度。第66页/共152页 两独立样本的极端检验计算跨度和截头跨度。如果跨度或截头跨度很小,则表明两个样本数据无法充分混合,可以认为实验样本存在极端反应。第67页/共152页 SPSS自动计算跨度和截头跨度,依据分布表给出对应的相伴概率值。如果相伴概率小于或等于用户的显著性水平,则应拒绝零假设H0,认为两个样本来自的总体分布有显著差异;如果相伴概率值大于显著性水平,则不能拒绝零假设H0,认为两个样本来自的总体分布无显著差异。第68页/共152页 研究问题 研究两个不同厂家生产的灯泡使用寿命是否存在显著差异
22、。随机抽取两个厂家生成的灯泡若干,实验得到使用寿命,数据如表10-5所示。第69页/共152页表表10-510-5两个厂家生产的灯泡使用寿命数据两个厂家生产的灯泡使用寿命数据灯泡寿命(灯泡寿命(h)厂厂 家家 编编 号号67516821691167016501693165016492680263026502646265126202第70页/共152页 实现步骤图图10-15 10-15 在菜单中选择在菜单中选择“2 Independent Samples”2 Independent Samples”命令命令第71页/共152页图图10-16 “Two-Independent-Samples-T
23、est”10-16 “Two-Independent-Samples-Test”对话框对话框第72页/共152页 图图10-17 “Two Independent Samples10-17 “Two Independent Samples:Define Groups”Define Groups”对话框对话框 第73页/共152页图图10-18 “Two-Independent-Samples10-18 “Two-Independent-Samples:Options”Options”对话框对话框第74页/共152页 (1)两独立样本Mann-Whitney U检验结果如下面两表所示。第75页/
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- spss 使用教程非参数检验教案 使用 教程 参数 检验 教案
限制150内