SPSS统计分析 参数估计与假设检验新.pptx
《SPSS统计分析 参数估计与假设检验新.pptx》由会员分享,可在线阅读,更多相关《SPSS统计分析 参数估计与假设检验新.pptx(66页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、主要内容主要内容4.1 假设检验4.2 平均值分析4.3 单样本T检验4.4 独立样本T检验4.5配对样板T检验第1页/共66页4.1 假设检验点估计简介1.基本概念 点估计用样本统计量的值直接作为总体参数的估计值。如用样本均值直接作为总体均值的估计值,用样本方差直接作为总体方差的估计值等。2.2.常用的点估计方法(1)矩估计法(2)极大似然估计法(3)稳健估计法第2页/共66页4.1 假设检验区间估计简介 因为点估计直接用样本估计值作为总体参数的估计值,没有提供关于估计精度的任何信息,存在抽样标准误差,故提出了未知参数的区间估计法。给出两个数,指出总体参数以一定概率位于两数所确定的区间内,这
2、种估计叫做参数的区间估计。区间估计是在点估计的基础上,给出总体参数估计的一个范围,所以区间估计相对于点估计更加精确,要优于点估计。第3页/共66页4.1 统计推断与假设检验SPSS实例分析【例4 4-1-1】从一个正态总体中随机抽取容量为8的样本,各样本值分别为10,8,12,15,6,13,5,11;求总体均值在95%的置信区间。分析:这是一个求总体均值的区间估计问题,进行总体均值的区间估计可以采用探索分析或单样本T检验,本例中采用探索分析,具体分析步骤同例4-3。第4页/共66页4.1假设检验基本概念及统计原理1.1.统计假设原假设:被检验的假设,通过检验可能被接受,也可能被否定;在很多情
3、况下,我们给出一个统计假设仅仅是为了拒绝它。例如,如果我们要判断给定的一枚硬币是否均匀,则假设硬币是均匀的(即p=0.5,其中p是正面出现的概率);类似地,如果我们要判断一种方法是否优于其他的方法,则假设两种方法之间没有差异。这样的假设通常称为零假设或原假设,记为 。备择假设:与原假设对应的假设,只有在原假设被否定后才可接受的假设;例如,如果零假设是 ,则备择假设是 。备择假设记为 。拒绝域、临界点:当检验统计量取某个区域中的值时,拒绝原假设,则称该取值区域为拒绝域,称拒绝域的边界点为临界点。第5页/共66页4.1 假设检验基本概念及统计原理2.2.显著性水平与置信水平显著性水平:在作假设检验
4、时,我们犯第一类错误的最大概率称为检验的显著性水平。这个概率常记为,通常抽样前就指定好,这样得到的结果才不会影响我们的选择。在实际问题中,显著性水平可以有多种选择,但最为普通的是0.05或0.01。例如,如果设计一个决策法则选择的显著性水平是0.05(5%),那么在100次中可能有5次机会使我们拒绝本该接受的假设。也就是说,我们大约有95%的把握作出正确的决策。此时,我们说拒绝假设的显著性水平为0.05,即犯拒绝本应接受的假设这类错误的概率是0.05。置信水平:1-为置信度或置信水平;第6页/共66页4.1 假设检验基本概念及统计原理3.3.假设检验的两类错误第一类错误:在假设检验中拒绝了本来
5、是正确的原假设。第二类错误:在假设检验中没有拒绝错误的原假设。4 4概率P P值 P值是当原假设正确时,观测到的样本信息出现的概率。通常用P值与预先设定的显著性水平值比较,若P值小于显著性水平,则认为该概率值足够小,应拒绝原假设。5 5单侧检验与双侧检验双侧检验:只强调差异而不强调方向性的检验叫双侧检验。单侧检验:强调某一方向的检验叫单侧检验。第7页/共66页4.1 假设检验小概率事件原理 在概率论中我们把发生概率小到接近于0的事件称为小概率事件(即在大量重复试验中出现的频率非常低)。在统计学上,把小概率事件看成在一次特定的抽样中不可能发生的事件,称为“小概率事件实际不可能原理”。这是统计学上
6、进行假设检验(显著性检验)的基本依据。根据这一原理,若某事件在理论上被认为在原假设成立的情况下是个小概率事件,它不会出现,而在实际中出现了,我们就推翻原来的假设,认为原假设不成立,从而接受备择假设。第8页/共66页4.1 假设检验假设检验的一般步骤第1 1步 给出检验问题的原假设;根据检验问题的要求,将需要检验的最终结果作为零假设。例如,需要检验某学校的高考数学平均成绩是否同往年的平均成绩一样,都为75,由此可做出零假设,第2 2步 选择检验统计量;在统计推断中,总是通过构造样本的统计量并计算统计量的概率值进行推断,一般构造的统计量应服从或近似服从常用的已知分布,例如均值检验中最常用的t分布和
7、F分布等。第3 3步 规定显著性水平;第9页/共66页4.1 假设检验假设检验的一般步骤第4 4步 计算检验统计量的观测值及其发生的概率值;在给定零假设前提下,计算统计量的观测值和相应概率p值。概率p值就是在零假设 成立时检验统计量的观测值发生的概率,该概率值间接地给出了样本值在零假设成立的前提下的概率,对此可以依据一定的标准来判断其发生的概率是否为小概率。第10页/共66页4.1 假设检验假设检验的一般步骤第5 5步 在给定显著性水平条件下,做出统计推断结果。这里的显著性水平指的是当假设正确时被拒绝的概率,即弃真概率,一般取0.01或0.05。当检验统计量的概率p值小于显著性水平时,则认为此
8、时拒绝零假设而犯弃真错误的概率小于显著性水平,即低于预先给定的水平,也就是说犯错误的概率小到我们能容忍的范围,这时可以拒绝零假设;反之,如果检验统计量的概率p值大于显著性水平,如果拒绝零假设,犯弃真错误的概率大于预先给定的容忍水平,这时不应该拒绝零假设。第11页/共66页 4.1 假设检验参数检验简介 参数检验的总体分布形式是已知的或假定的,只是一些参数的取值或范围未知,分析的主要目的是估计参数的取值范围,或对其进行某种统计检验。如正态总体的均值是否与某个值存在显著差异,两个总体的均值是否有显著差异等。主要包括:单样本T检验:检验单个变量的均值与假设检验值之间是否存在差异;独立样本T检验:检验
9、两组来自独立总体的样本,其独立总体的均值或中心位置是否一样;配对样本T检验:检验两个相关的样本是否来自具有相同均值的总体。第12页/共66页 4.1 假设检验非参数检验简介 非参数检验是在总体分布未知的情况下,利用样本数据对总体分布形态等进行推断的方法,在推断过程中不涉及有关总体分布的参数,而是检验总体某些有关的性质,如总体的分布位置、分布形状之间的比较等。与参数检验的原理相同,非参数检验过程也是先根据问题提出原假设,然后利用统计学原理构造出适当的统计量,最后利用样本数据计算统计量的概率P值,与显著性水平进行比较,得出拒绝或者接受原假设的结论。非参数检验包括单样本(O)、独立样本(I)、相关样
10、本(R)的非参数检验。第13页/共66页 4.1 假设检验参数检验及非参数检验比较 1参数检验和非参数检验的区别 参数检验和非参数检验最本质的区别是:参数检验需要事先确定或假定总体的分布,非参数检验则不需要假定总体的分布,而是直接用样本来推断总体的分布。除此之外,二者之间还可以从很多方面来区分。研究的对象和目标不同。研究的统计量有所不同。第14页/共66页主要内容主要内容4.1 假设检验4.2 平均值分析 4.3 单样本T检验4.4 独立样本T检验4.5配对样板T检验第15页/共66页与第三章中的“描述统计”中计算某一样本总体均值相比,平均值分析可以对样本进行分组计算。例 各地区分性别受教育程
11、度的人口数量,数据见data4-0.sav 4.2 平均值分析第16页/共66页主要内容主要内容4.1 假设检验4.2 平均值分析4.3 单样本T检验4.4 独立样本T检验4.5配对样板T检验第17页/共66页 4.3 单样本T检验4.3.1 基本概念及统计原理1.单样本T检验的概念 单样本T检验利用来自某总体的样本数据,推断该总体的均值与指定的检验值之间是否存在显著性差异,它是对总体均值的假设检验。为此,给出检验均值 ,原假设:=,其中 为总体均值,即认为总体均值与检验值 之间无显著性差异。例如,从新生的入学成绩的抽样数据推断平均成绩是否为75分;在人口普查中,某地区职工今年的平均收入是否和
12、往年的平均收入有显著差异。第18页/共66页4.3 单样本T检验4.3.1 基本概念及统计原理2.单样本T检验的检验统计量 单样本T检验的前提是总体服从正态分布 ,其中 为总体均值,为总体方差。如果样本容量为n,样本均值为 ,则 仍服从正态分布,即:。在零假设成立的条件下,均值检验使用t统计量,构造的t统计量为:其中,用 代入,t统计量服从自由度为n-1的t分布,S为样本标准差。在给定原假设的前提下,SPSS将检验值代入t统计量,得到检验统计量观测值,以及根据T分布的分布函数计算出的概率P值。第19页/共66页4.3 单样本T检验4.3.1 基本概念及统计原理3.单样本T检验的步骤 在给定样本
13、来自正态总体的假设下,单样本T检验作为假设检验的一种方法,其基本步骤与假设检验的步骤是一样的。第20页/共66页 4.3 单样本T检验4.3.2 单样本T检验SPSS实例分析【例4-2】某生产食盐的生产线,其生产的袋装食盐的标准质量为500 g,现随机抽取10袋,其质量分别为495 g,502 g,510 g,497 g,506 g,498 g,503 g,492 g,504 g,501 g。假设数据呈正态分布,请检验生产线的工作情况。分析:这是一个典型的比较样本均值和总体均值的T检验问题;第1步 数据组织:首先建立SPSS数据文件,只需建立一个变量“Weight”,录入相应的数据即可,建立的
14、数据文件存入文件data4-1.sav中。第21页/共66页 4.3 单样本T检验4.3.2 单样本T检验SPSS实例分析 第2步 单样本T检验分析设置选择菜单“分析比较均值单样本T检验(S)”,打开“单样本T检验”对话框,将变量“weight”移入”检验变量”列表框,并输入检验值500;打开“单样本T检验:选项”对话框,设置置信区间为95%(缺省为95%);第22页/共66页 4.3 单样本T检验4.3.2 单样本T检验SPSS实例分析 第3步 主要结果及分析:单样本统计量表 单样本T检验结果表 N均值标准差均值的标准误weight10500.80005.391351.70489检验值=50
15、0tdfSig(双侧)均值差值差分的 95%置信区间下限上限weight.4699.650.80000-3.05674.6567本例置信水平为95%,显著性水平为0.05,从上表中可以看出,双尾检测概率P值为0.650,大于0.05,故原假设成立,也就是说,抽样袋装食盐的质量与500克无显著性差异,有理由相信生产线工作状态正常 下表给出了单样本T检验的描述性统计量,包括样本数(N)、均值、标准差、均值的标准误。第23页/共66页主要内容主要内容4.1 假设检验4.2 平均值分析4.3 单样本T检验4.4 独立样本T检验4.5配对样板T检验第24页/共66页4.4 独立样本T检验4.4.1 基本
16、概念及统计原理1.独立样本T检验的概念 单样本T检验是检验样本均值和总体均值是否有显著性差异,而两独立样本T检验的目的是利用来自某两个总体的独立样本,推断两个总体的均值是否存在显著差异。其原假设H0为 ,即假设两总体均值相等,备择假设为 ,即假设两总体均值不等。例如,为比较两种牧草对奶牛的饲养效果,随机从奶牛群中选取喂养不同牧草的奶牛各10头记录每日平均产奶的量,根据记录的数据推断两种牧草对奶牛饲养的效果有无显著性差异。第25页/共66页4.4 独立样本T检验4.4.1 基本概念及统计原理2独立样本T检验的检验统计量 独 立 样 本 T检 验 的 前 提 是 两 个 独 立 的 总 体 分 别
17、 服 从 和 和 。在零假设成立的条件下,独立样本T检验使用t统计量。构造独立样本T检验的t统计量分为两种情况。1)当样本方差相等时,t统计量定义为:其中 和 分别为两样本容量,,和 分别为两样本标准差。该统计量服从自由度为 的t分布。第26页/共66页4.4 独立样本T检验4.4.1 基本概念及统计原理2独立样本T检验的检验统计量 2)当样本方差不等时,t统计量定义为:可见,独立样本T检验的结论在很大程度上取决于两个总体的方差是否相等。这就要求在检验两总体均值是否相等之前,首先应对两总体方差是否相等进行检验,也称之为方差齐性检验。第27页/共66页4.4 独立样本T检验4.4.1 基本概念及
18、统计原理3.方差齐性检验方法 利用Levene F方差齐性检验方法检验两总体方差是否存在显著差异;首先提出原假设;执行检验过程中,若概率p 值小于给定的显著性水平(一般为0.05),则拒绝原假设,认为两个总体的方差不等;否则认为两个总体的方差无显著性差异。4.独立样本T检验的一般步骤 在两样本来自正态总体且相互独立的假设下,独立样本T检验作为假设检验的一种方法,其基本步骤与假设检验的步骤是一样的。第28页/共66页4.4 独立样本T检验4.4.2 独立样本T检验SPSS实例分析【例4-3】为比较两种不同品种的玉米的产量,分别统计了8个地区的单位面积产量,具体数据见表5.8。假定样本服从正态分布
19、,且两组样本相互独立,试比较在置信度为95%的情况下,两种玉米产量是否有显著性差异。第29页/共66页4.4 独立样本T检验4.4.2 独立样本T检验SPSS实例分析 第1步 数据组织:在SPSS数据文件中建立两个变量,分别为“品种”、“产量”,度量标准分别为“名义”、“度量”,变量“品种”的值标签为:a品种A,b品种B,录入数据后,保存名为data4-2.sav的SPSS数据文件;第2步 独立样本T检验设置:选择菜单“选择比较均值独立样本T检验”,打开“独立样本T检验”对话框,将“产量”作为要进行T检验的变量,将“品种”字段作为分组变量,定义分组变量的两个分组分别为“a”和“b”。打开“独立
20、样本T检验:选项”对话框,具体选项内容及设置与单样本T检验相同。第30页/共66页4.4 独立样本T检验4.4.2 基本概念及统计原理第3步 运行结果及分析:独立样本T检验的基本描述统计量 玉米品种N均值标准差均值的标准误单位面积产量品种A881.250011.804964.17368品种B875.750010.024973.54436 上表给出了本例独立样本T检验的基本描述统计量,包括两个样本的均值、标准差和均值的标准误。第31页/共66页4.4 独立样本T检验4.4.基本概念及统计原理独立样本T检验结果表 独立样本检验独立样本检验方差方程方差方程的的 Levene Levene 检验检验均
21、值方程的均值方程的 t t 检验检验F FSigSig.t tdfdfSig.Sig.(双双侧侧)均值差均值差值值标准误标准误差值差值差分的差分的 95%95%置置信区间信区间下限下限上限上限单位面积单位面积产量产量假设方差相假设方差相等等.10.104 4.75.752 21.0041.0041414.332.3325.5005.50000005.475605.47560-6.24396.24398 817.24317.2439898假设方差不假设方差不相等相等1.0041.00413.6413.642 2.333.3335.5005.50000005.475605.47560-6.2729
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- SPSS统计分析 参数估计与假设检验新 SPSS 统计分析 参数估计 假设检验
限制150内