社会经济统计软件应用SPSS应用.ppt
社会经济统计软件应用SPSS应用 Still waters run deep.流静水深流静水深,人静心深人静心深 Where there is life,there is hope。有生命必有希望。有生命必有希望第第4 4章章 均值比较与检验均值比较与检验 u1.1.参数检验的基本步骤参数检验的基本步骤u2.2.单一样本单一样本T T检验(检验(OneOneSample T Test)Sample T Test)u3.3.独立样本独立样本T T检验(检验(IndependentIndependentSamples T Test)Samples T Test)u4.4.配对样本配对样本T T检验(检验(PairedPairedSamples T Test)Samples T Test)1.1.参数检验的基本步骤参数检验的基本步骤u假设检验,就是事先对总体参数或总体分布形式假设检验,就是事先对总体参数或总体分布形式作出一个假设,然后利用样本信息来判断原假设作出一个假设,然后利用样本信息来判断原假设是否合理(即判断样本信息与原假设是否有显著是否合理(即判断样本信息与原假设是否有显著差异),从而决定是否接受或否定原假设。差异),从而决定是否接受或否定原假设。u假设检验包括假设检验包括:n参数检验:在总体分布己知的情况下,对总体包含的参数检验:在总体分布己知的情况下,对总体包含的参数进行的检验。参数进行的检验。n非参数检验:当总体分布未知时,根据样本推断总体非参数检验:当总体分布未知时,根据样本推断总体的分布类型和参数值的大小的过程称为非参数检验。的分布类型和参数值的大小的过程称为非参数检验。u假设检验的基本原理:小概率原理和反证法思想假设检验的基本原理:小概率原理和反证法思想n小概率原理:小概率事件在一次实验中不可能发生。小概率原理:小概率事件在一次实验中不可能发生。n反证法思想:为了检验假设是否成立,先假定它正确,反证法思想:为了检验假设是否成立,先假定它正确,然后根据样本信息,构造一个小概率事件,如果小概率然后根据样本信息,构造一个小概率事件,如果小概率事件发生了,就拒绝原假设。事件发生了,就拒绝原假设。n在具体操作中,首先应给定所谓的小概率,一般取在具体操作中,首先应给定所谓的小概率,一般取O.O5O.O5,即显著性水平。记为,即显著性水平。记为。u依据小概率原理推断可能会犯错误!依据小概率原理推断可能会犯错误!u两类错误两类错误 n第第类错误(弃真错误):当原假设为真时,而拒绝原类错误(弃真错误):当原假设为真时,而拒绝原假设所犯的错误。犯第假设所犯的错误。犯第类错误的概率常用类错误的概率常用 表示,易表示,易知知 就是显著性水平。就是显著性水平。n第第类错误(取伪错误):当原假设为假时,而接受原类错误(取伪错误):当原假设为假时,而接受原假设所犯的错误。犯第假设所犯的错误。犯第类错误的概率常用类错误的概率常用 表示。表示。u参数检验的基本步骤如下:参数检验的基本步骤如下:n1 1)提出原假设和备择假设)提出原假设和备择假设原假设为正待检验的假设:原假设为正待检验的假设:H H0 0备择假设为可供选择的假设:备择假设为可供选择的假设:H H1 1。H H1 1与与H H0 0是互斥的关系。是互斥的关系。一般地,参数检验的假设有三种形式:一般地,参数检验的假设有三种形式:p(1 1)双侧检验:)双侧检验:H H0 0 :0 0;H H1 1:0 0p(2 2)左侧检验:)左侧检验:H H0 0 :0 0;H H1 1:0 0 p(3 3)右侧检验:)右侧检验:H H0 0 :0 0;H H1 1:0 0单侧检验单侧检验n2 2)构造检验统计量)构造检验统计量n3 3)给定置信水平)给定置信水平,确定接受域和拒绝域,确定接受域和拒绝域n4 4)根据样本计算统计量的观测值,若观测值处于拒绝域)根据样本计算统计量的观测值,若观测值处于拒绝域中则拒绝原假设,否则接受原假设中则拒绝原假设,否则接受原假设u注意在注意在SPSSSPSS中假设检验的判断原则不同中假设检验的判断原则不同n在在SPSSSPSS中是采用中是采用p p(Sig.Sig.)值进行判断。()值进行判断。(P P值为统计量值为统计量观测值实现的概率)观测值实现的概率)n在在SPSSSPSS系统中,所有的假设检验(包括非参数检验)都系统中,所有的假设检验(包括非参数检验)都只要求使用者记住(必须记住!)检验的原假设只要求使用者记住(必须记住!)检验的原假设H H0 0是什是什么,并且按照以下的准则去判断是否应该接受原假设:么,并且按照以下的准则去判断是否应该接受原假设:若若Sig.Sig.,则接受原假设,则接受原假设H H0 0;若;若Sig.Sig.,则拒绝原假设,则拒绝原假设H H0 0。2.2.单一样本单一样本T T检验(检验(OneOneSample T Test)Sample T Test)u单一样本单一样本T T检验是处理一个正态总体在方差未知时总体均检验是处理一个正态总体在方差未知时总体均值与某一已知数是否有显著性差异的假设检验。值与某一已知数是否有显著性差异的假设检验。u原假设原假设H H0 0:0 0u【例例】已知某一地区成年男子的脉搏平均数为已知某一地区成年男子的脉搏平均数为7272次分,次分,pulse.savpulse.sav是根据该地区邻近山区随机抽取的是根据该地区邻近山区随机抽取的2020名健康成名健康成年男子的脉搏值而建立的数据文件。现在根据该数据文件年男子的脉搏值而建立的数据文件。现在根据该数据文件推断山区成年男子的脉搏平均数是否与该地区成年男子有推断山区成年男子的脉搏平均数是否与该地区成年男子有所不同。所不同。u本例原假设本例原假设H H0 0:7272 u在打开数据文件后,在菜单栏中选择在打开数据文件后,在菜单栏中选择Analyze|Analyze|Compare Means|OneCompare Means|OneSample T TestSample T Test命令命令Test Variables框:框:用于选取需要分析用于选取需要分析的变量的变量Test Value:输入要检:输入要检验的总体均值验的总体均值0,默,默认值为认值为0OptionsOptions对话框对话框Missing Values:在检验变量中含在检验变量中含有缺失值的观测有缺失值的观测将不被计算。将不被计算。在任何一个变量在任何一个变量中含有缺失值的中含有缺失值的观测都将不被计观测都将不被计算算Confidence Interval:输入置信区间,一般:输入置信区间,一般取取90、95、99等。等。结果解释结果解释双侧检验双侧检验Sig.=0.0000.05,所以拒绝原,所以拒绝原假设。认为山区男子假设。认为山区男子和该地区男子的脉搏和该地区男子的脉搏数有显著差别。数有显著差别。均值差(均值差(72)为)为3.050总体均值总体均值的点估计为的点估计为75.050,95置信区间估置信区间估计为计为73.70,76.40对对p p(Sig.Sig.)值的说明)值的说明接受域接受域接受域接受域临界值临界值临界值临界值/2 /2/2 样本统计量样本统计量样本统计量样本统计量t t拒绝域拒绝域拒绝域拒绝域拒绝域拒绝域拒绝域拒绝域样本统计样本统计量量t的密度的密度1-置信水平置信水平置信水平置信水平样本统计量样本统计量t的观测值的观测值p/2p/2 原假设原假设H0接受域接受域接受域接受域临界值临界值临界值临界值/2 /2/2 样本统计量样本统计量t拒绝域拒绝域拒绝域拒绝域拒绝域拒绝域拒绝域拒绝域样本统计样本统计量量t的密度的密度1-置信水平置信水平置信水平置信水平样本统计量样本统计量t的观测值的观测值p/2p/2 原假设原假设H03.3.独立样本独立样本T T检验(检验(IndependentIndependentSamples T Test)Samples T Test)u独立样本独立样本T T检验就是是利用来自两个总体的独立样检验就是是利用来自两个总体的独立样本,推断两个总体的均值是否存在显著差异。本,推断两个总体的均值是否存在显著差异。u原假设原假设H H0 0:1 12 2u前提条件前提条件n两总体应服从或近似服从正态分布两总体应服从或近似服从正态分布n两样本相互独立,即从一总体中抽取一组样本对另一两样本相互独立,即从一总体中抽取一组样本对另一 总体中抽取一组样本没有任何影响。两组样本的个案数总体中抽取一组样本没有任何影响。两组样本的个案数目可以不等。目可以不等。u注意的一个问题注意的一个问题n独立样本独立样本T T检验的结论在很大程度上取决于两个总体的检验的结论在很大程度上取决于两个总体的方差是否相等。这就要求在检验两总体均值是否相等方差是否相等。这就要求在检验两总体均值是否相等之前,首先对两总体方差的齐性进行检验。在统计分之前,首先对两总体方差的齐性进行检验。在统计分析中,析中,如果两个总体的方差相等,称为满足方差齐性。如果两个总体的方差相等,称为满足方差齐性。在在SPSSSPSS的独立样本的独立样本T T检验中,系统会自动给出检验中,系统会自动给出LeneveSLeneveS方差齐性检验的结果。方差齐性检验的结果。方差齐性检验的原假方差齐性检验的原假设为设为H H0 0:1 12 2 。u【例例】数据文件数据文件test.savtest.sav是对某班是对某班1414名学生某次名学生某次物理考试成绩的汇总。试对男女生考试成绩有无物理考试成绩的汇总。试对男女生考试成绩有无显著差异进行检验。显著差异进行检验。u本例原假设本例原假设H H0 0:1 12 2u在打开数据文件后,在菜单栏中选择在打开数据文件后,在菜单栏中选择Analyze|Analyze|Compare Means|IndependentCompare Means|IndependentSamples T TestSamples T Test命令命令4.4.配对样本配对样本T T检验(检验(PairedPairedSamples T Test)Samples T Test)u配对样本配对样本T T检验用于检验两个相关的样本是否来自具有相检验用于检验两个相关的样本是否来自具有相同均值的总体,实质是检验差值变量的均值与同均值的总体,实质是检验差值变量的均值与0 0之间差异之间差异的显著性。的显著性。u原假设原假设H H0 0:1 12 20 0u前提条件前提条件n两样本数据必须两两配对两样本数据必须两两配对,即即:样本个数相同样本个数相同,个案顺序相同个案顺序相同n两总体之差应服从或近似服从正态分布两总体之差应服从或近似服从正态分布u与独立样本与独立样本T T检验的区别检验的区别n两样本每对数据之间都有一定关系两样本每对数据之间都有一定关系n样本数据必须两两配对样本数据必须两两配对u【例例】一种新上市的减肥茶需要做市场调查,对一种新上市的减肥茶需要做市场调查,对3535个消费个消费者进行了测试,分别统计了这者进行了测试,分别统计了这3535个受试者服用减肥茶前后个受试者服用减肥茶前后的体重数据,形成的体重数据,形成3535个配对。试对减肥茶是否有效进行检个配对。试对减肥茶是否有效进行检验。(数据文件为验。(数据文件为tea.saytea.say)u本例原假设本例原假设H H0 0:1 12 20 0u打开数据文件打开数据文件tea.savtea.sav,其中,服用减肥茶前的体重定义,其中,服用减肥茶前的体重定义为变量为变量beforebefore,服用减肥茶后的体重定义为变量,服用减肥茶后的体重定义为变量afterafter。u在菜单栏中选择在菜单栏中选择Analyze|Compare Means|PairedAnalyze|Compare Means|PairedSamples T TestSamples T Test命令命令实验题实验题