spss课件第6章.ppt
《spss课件第6章.ppt》由会员分享,可在线阅读,更多相关《spss课件第6章.ppt(113页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、 在实践中我们常常会遇到一些问题的总体分布并不明确,或者总体参数的假设条件不成立,不能使用参数检验。这一类问题的检验应该采用统计学中的另一类方法,即非参数检验。第第6 6章章 SPSSSPSS的非参数检验的非参数检验 SPSS 中进行非参数检验由【Analyze(分析)】菜单中的【Nonparametric Tests(非参数检验)】菜单项导出。其中包括以下命令。Chi-square test:卡方检验。Binomial test:二项分布检验。Runs test:游程检验。1-Simple K-S test:单样本K-S检验。2 Independent Sample test:两个独立样本非
2、参数检验。K Independent Samples test:多个独立样本非参数检验。2 Related Sample test:两个相关样本非参数检验。K Related Sample test:多个相关样本非参数检验。6.1 6.1 非参数非参数检验检验概述概述6.1.1 非参数检验的提出 非参数检验是不依赖总体分布的统计推断方法。它是指在总体不服从正态分布且分布情况不明时,用来检验数据资料是否来自同一个总体假设的一类检验方法。由于这些方法一般不涉及总体参数而得名。这类方法的假定前提比参数假设检验方法少得多,也容易满足,适用于计量信息较弱的资料且计算方法也简便易行,所以在实际中有广泛的应
3、用。6.1.2 6.1.2 非参数非参数检验检验的特点的特点 和参数方法相比,非参数检验方法的优势如下:(1)稳健性。因为对总体分布的约束条件大大放宽,不至于因为对统计中的假设过分理想化而无法切合实际情况,从而对个别偏离较大的数据不至于太敏感。(2)对数据的测量尺度无约束,对数据的要求也不严格,什么数据类型都可以做。(3)适用于小样本、无分布样本、数据污染样本、混杂样本等。表6-1 参数检验和非参数检验的效率比较应 用参数检验非参数检验对正态总体的非参数检验的效率评价配对样本数据两个独立样本多个独立样本相关随机性t检验或者z检验t检验或者z检验方差分析(F检验)线性相关无可用的参数检验符号检验
4、Wilcoxon检验Wilcoxon检验K-W检验秩相关检验游程检验0.630.950.950.950.91没有可比较的基础6.2 SPSS6.2 SPSS在卡方在卡方检验检验中的中的应应用用1.使用目的 卡方检验(Chi-Squar Test)也称为卡方拟合优度检验,是K.Pearson给出的一种最常用的非参数检验方法。它用于检验观测数据是否与某种概率分布的理论数值相符合,进而推断观测数据是否是来自于该分布的样本的问题。2.基本原理 进行卡方检验时,首先提出零假设:样本X来自的总体分布服从期望分布或某一理论分布。接着,利用实际观测值的频数与理论的期望频数之间的差异来构造检验统计量,它描述了观
5、察值和理论值之间的偏离程度。3.软件使用方法 SPSS会自动计算出2统计量及对应的相伴概率P值。6.2.2 6.2.2 卡方卡方检验检验的的SPSSSPSS操作操作详详解解Step01:打开主菜单 选择菜单栏中的【Analyze(分析)】【Nonparametric Tests(非参数检验)】【Legacy Dialogs(旧对话框)】【Chi-Square(卡方)】命令,弹出【Chi-Square Test(卡方检验)】对话框。Step02:选择检验变量 在【Chi-Square Test(卡方检验)】对话框左侧的候选变量列表框中选择一个或几个变量,将其添加至【Test Variable L
6、ist(检验变量列表)】列表框中,表示需要进行进行卡方检验的变量。Step03:确定检验范围 在【Expected Range(期望全距)】选项组中可以确定检验值的范围,对应有两个单选项。Step04:选择期望值 在【Expected Values(期望值)】选项组中可以指定期望值,对应有两个单选项。Step05:选择计算精确概率 单击【Exact】按钮,弹出【Exact Tests(精确检验)】对话框,该对话框用于选择计算概率P值的方法。Step06:其他选项选择 单击【Options】按钮,弹出【Options(选项)】对话框,该对话框用于指定输出内容和关于缺失值的处理方法.Step07单
7、击【OK】按钮,结束操作,SPSS软件自动输出结果。6.2.3 6.2.3 实实例例图图文分析:人文分析:人员结员结构的构的调动调动1.实例内容 某公司经营多年,形成了一套成熟的企业文化和管理体系,例如根据多年的运营经验,经理层、监察员、办事员三种职务类别人员比例大约在15:5:80为宜,这样运行效率最高。目前公司进行人事调整,公司人员结构发生变动,有员工担心是否人事调整已经导致职务类型比例的失调。请利用数据文件6-1.sav来解决该问题。三种职务的期望构成比为15、5和80。而目前样本中观察到的三种职务的人数比为84:27:363,构成比分别是17.7、5.7和76.6,和理论值有差异。那么
8、这种差异是由随机误差造成的,还是真的构成比和以前有所变化?该问题就可以用2检验来实现。相应的假设检验如下。H0:目前三个职业的总体构成比仍然是15、5和80。H1:目前三个职业的总体构成比不再是15、5和80。2.2.实实例操作例操作Step01:打开对话框 打开数据文件6-1.sav,选择菜单栏中的【Analyze(分析)】【Nonparametric Tests(非参数检验)】【Legacy Dialogs(旧对话框)】【Chi-Square(卡方)】命令,弹出【Chi-Square Test(卡方检验)】对话框。其中,“jobcat”变量表示职业类型,“1”表示办事员,“2”表示监察员,
9、“3”表示经理。Step02:选择检验变量 在左侧的候选变量列表框中选择“jobcat”变量作为检验变量,将其添加至【Test Variable List(检验变量列表)】列表框中。Step03:选择期望值 在【Expected Values(期望值)】选项组中点选【Values】单选钮,以指定期望概率值。接着在Values的文本框中分别输入0.8、0.05和0.15这三个数值,并且单击【Add】按钮加以确定。Step04:完成操作 最后,单击【OK(确定)】按钮,操作完成。3 3 实实例例结结果及分析果及分析 SPSS的结果报告中列出了期望频数和实际频数。显然残差值越小,说明实际频数与期望频
10、数越接近。Observed NExpected NResidualClerical363379.2-16.2Custodial2723.73.3Manager8471.112.9Total474(1)频数表(2)卡方检验表 具体包括 统计量(Chi-Square)、自由度(df)和近似概率P值(Asymp.Sig.)。可见,统计量等于3.492,自由度等于2,对应的概率P值0.174大于显著性水平0.05。因此接受零假设,认为目前三个职业的总体构成比仍然是15、5和80,人数的调动只是随机误差造成的,公司人员结构没有显著性改变。Employment CategoryChi-Square3.49
11、2adf2Asymp.Sig.1746.3 SPSS6.3 SPSS在二在二项项分布分布检验检验中的中的应应用用6.3.1 二项分布检验的基本原理1.方法概述事件要服从二项分布,则应该具备下列基本的条件。(1)各观察单位只能具有相互对立的一种结果。(2)已知发生某一结果(阳性)的概率为,其对立结果的概率为1-。(3)n次试验在相同条件下进行,且各个观察单位的观察结果相互独立,即每个观察单位的观察结果不会影响到其他观察单位的结果。2.软件使用方法 SPSS二项分布检验过程是推断总体的分布是否等于指定的某个二项分布。其假设检验过程如下。H0:样本来自的总体与某个指定的二项分布无显著性差异。H1:样
12、本来自的总体与某个指定的二项分布有显著性差异。SPSS会自动计算出二项分布检验相应的检验统计量及对应的概率P值。如果概率P值小于或等于用户设定的显著性水平,则拒绝零假设,认为总体与某个指定的二项分布有显著性差异;相反的,如果概率P值大于显著性水平,则接受零假设。需要注意的是,二项分布检验过程要求变量必须是数值型的二元变量(只取两个可能值的变量)。假如变量是字符型的,可以使用重编码功能将其转化为数值型变量;假如变量不是二元变量,需要设置断点将数据分为两个部分,将大于断点值的归为一组,其余归为另一组。6.3.2 6.3.2 二二项项分布分布检验检验的的SPSSSPSS操作操作详详解解 Step01
13、:打开主菜单 选择菜单栏中的【Analyze(分析)】【Nonparametric Tests(非参数检验)】【Legacy Dialogs(旧对话框)】【Binomial(二项式)】命令,弹出【Binomial Test(二项式检验)】对话框。Step02:选择检验变量 在【Binomial Test(二项式检验)】对话框左侧的候选变量列表框中选择一个或几个变量,将其添加至【Test Variable List(检验变量列表)】列表框中,表示需要进行进行二项分布检验的变量。Step03:定义二元变量 在【Define Dichotomy(定义二分法)】选项组中可以定义二元变量。Step04:
14、指定检验概率值 在【Test Proportion(检验比例)】选项组中可以指定二项分布的检验概率值。系统默认的检验概率值是0.5,这意味着要检验的二项是服从均匀分布的。如果所要检验的二项分布不是同概率分布,参数框中要键入第一组变量所对应的检验概率值。Step05:选择计算精确概率 【Exact】按钮用于选择计算概率P值的方法。Step06:其他选项选择 【Options】按钮用于指定输出内容和关于缺失值的处理方法。Step07:单击【OK】按钮,结束操作,SPSS软件自动输出结果。6.3.3 6.3.3 实实例例图图文分析:灯泡是否合格文分析:灯泡是否合格1.1.实实例内容例内容 某灯泡厂生
15、产的一种特制灯泡按照工艺技术标准的要求,其合格灯泡的寿命必须大于960小时。通常在生产稳定的时候,该厂的这种产品合格品率为95,为检验产品质量,今从新生产的一大批产品中随机抽查了30只灯泡,测得它们的寿命的数据资料,试根据这些样品数据检验该批产品的合格率是否等于95。1070 1073 958 958 975 969 1079 964 968 947962 970 1054 987 967 969 967 1001 994 9931084 1012 985 994 964 952 951 987 963 9572.2.实实例操作例操作Step01:打开对话框 打开数据文件6-2.sav,选择菜
16、单栏中的【Analyze(分析)】【Nonparametric Tests(非参数检验)】【Legacy Dialogs(旧对话框)】【Binomial(二项式)】命令,弹出【Binomial Test(二项式检验)】对话框。Step02:选择检验变量 在左侧的候选变量列表框中选择“time”变量作为检验变量,将其添加至【Test Variable List(检验变量列表)】列表框中。Step03:定义二元变量 在【Define Dichotomy(定义二分法)】选项组中点选 【Cut point(割点)】,以指定断点。接着在其文本框中输入“960”,表示以它作为分界点将原始样本分为两组。St
17、ep04:指定检验概率值 在【Test Proportion(检验比例)】文本框中输入指定概率值“0.05”。Step05:描述性统计量输出 单击【Options】按钮,弹出【Options(选项)】对话框。在【Statistics(统计量)】选项组中勾选【Descriptive(描述性)】和【Quartiles(四分位数)】复选框,表示输出基本统计量。再单击【Continue】按钮,返回【Binomial Test(二项式检验)】对话框。Step06:完成操作 最后,单击【OK(确定)】按钮,操作完成。3.3.实实例例结结果及分析果及分析(1)基本统计量 SPSS首先输出了样本的描述性统计量
18、表。这里共选择了30个灯泡寿命样本作二项分布检验,灯泡的平均寿命等于989.13小时,标准差等于40.968小时,灯泡寿命最小值等于947小时,寿命最大值等于1084小时。同时其25、50和75分位点等于 962.75、969.50和996.75小时。NMeanStd.DeviationMinimumMaximumPercentiles25th50th(Median)75th灯泡寿命30989.1340.9689471084962.75969.50995.75(2)二项分布检验表 首先根据断点“960”将原始数据划分为两部分:“Group 1”和“Group 2”,它们各自的样本容量等于6和2
19、4,所占总体的比例为20和80。由于这里要检验合格率是否等于95,也就是要检验“Group 1”组所占比例是否等于0.05。但根据单尾概率P值(0.003)小于显著性水平 (0.05),可以判断这批样本的合格率不等于95,即这批产品没有合格。CategoryNObserved Prop.Test Prop.Asymp.Sig.(1-tailed)灯泡寿命Group 1 96024.80Total301.006.4 SPSS6.4 SPSS在游程在游程检验检验中的中的应应用用6.4.1 游程检验的基本原理1.方法概述 游程检验是一种利用游程数所作的单样本随机性的检验方法,它可以用来判断观察值的顺
20、序是否为随机。许多统计模型的假设中都要求观察值都是独立的,也就是说,收集到的数据样本的顺序是不相关的。如果样本顺序影响到统计结果,那么样本就可能不是随机的,这将使研究者不能得出关于抽样总体的准确结论。因此,研究者可以使用游程检验来检验数据的随机性。2.基本原理 游程检验可用来检验任何序列的随机性,而不管这个序列是怎样产生的;此外还可用来判断两个总体的分布是否相同,从而检验出它们的位置中心有无显著差异。3.软件使用方法 SPSS中利用游程数构造Z统计量,利用Z统计量的分布来检验序列是否具有随机性。软件将自动计算出Z统计量的取值及对应的概率P值。如果概率P值小于或等于用户设定的显著性水平,则拒绝零
21、假设,认为变量不具有随机性;相反的,如果概率P值大于显著性水平,则认为变量出现是随机的。6.4.2 6.4.2 游程游程检验检验的的SPSSSPSS操作操作详详解解Step01:打开对话框 选择菜单栏中的【Analyze(分析)】【Nonparametric Tests(非参数检验)】【Legacy Dialogs(旧对话框)】【Runs(游程)】命令,弹出【Runs Test(游程检验)】对话框。Step02:选择检验变量 在【Runs Test(游程检验)】对话框左侧的候选变量列表框中选择一个或几个变量,将其添加至【Test Variable List(检验变量列表)】列表框中,表示需要进
22、行游程检验的变量。Step03:确定断点 在【Cut point(割点)】选项组中指定计算游程数的分界值。小于分界值的观察值归为一组,其余的归为另一组,然后计算游程数。Step04:选择计算精确概率 【Exact】按钮用于选择计算概率P值的方法,它的功能和卡方检验中的相应按钮相同的。Step05:其他选项选择 【Options】按钮用于指定输出内容和关于缺失值的处理方法。Step06:单击【OK】按钮,结束操作,SPSS软件自动输出结果。6.4.3 6.4.3 实实例例图图文分析:企文分析:企业业盈盈亏亏预测预测1.实实例内容例内容 已知某企业在过去20年的盈亏情况为“0 0 0 0 1 1
23、1 1 1 1 1 0 0 0 1 1 1 1 1 1”。其中“0”表示亏损,“1”表示盈利。现根据财务统计预测今年该企业盈利,请问这个结果对企业明年的经营状况有无影响?2.实实例操作例操作 根据过去20年的经营情况看到该企业的盈亏情况经常逐年发生变化。已知今年企业盈利,要判断明年企业的盈亏状态,其实就是要分析今年企业的盈利是否会对明年它的盈亏带来一定的影响。也就是说,要判断不同年份之间的盈亏情况有无影响性,即盈亏情况是否是随机的。这样就可以通过游程检验来分析历史数据。如果历史数据是随机的,说明今年的盈利不会对明年企业的生产产生影响;反之,表明今年的盈利会对明年生产有影响。所以采用SPSS具体
24、操作步骤如下。Step01:打开对话框 打开数据文件6-3.sav,选择菜单栏中的【Analyze(分析)】【Nonparametric Tests(非参数检验)】【Legacy Dialogs(旧对话框)】【Runs Test(游程检验)】命令,弹出【Runs Test(游程检验)】对话框。其中“x”变量表示企业盈亏状态,“0”表示亏损,“1”表示盈利。Step02:选择检验变量 在候选变量列表框中选择“x”变量作为检验变量,将其添加至【Test Variable List(检验变量列表)】列表框中。Step03:确定断点 在【Cut point(割点)】选项组中取消勾选【Median(中位
25、数)】复选框,勾选【Mean(均值)】复选框。Step04:完成操作最后,单击【OK(确定)】按钮,操作完成。3.3.实实例例结结果及分析果及分析 首先“Test Value0.65”表示游程检验以0.65作为断点将原始数据分为两组。在过去20年中,企业亏损的年份数共有7年,而在剩下的13年里该企业都是盈利的。整个历史数据的游程数等于4。接着计算游程检验的Z统计量等于-2.843,相伴概率P值0.004显然小于显著性水平0.05。所以,认为企业盈亏历史数据并不是随机的,其中有一定的规律性。因此,今年企业的盈利会对明年企业的经营状况产生显著影响。盈亏Test Valuea.65Cases=Tes
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- spss 课件
限制150内