统计学统计假设检验.pptx
《统计学统计假设检验.pptx》由会员分享,可在线阅读,更多相关《统计学统计假设检验.pptx(110页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、第 6 章 统计假设检验6.1 假设检验的基本问题 6.2 总体均值的假设检验6.3 总体比例的假设检验6.4 总体方差的显著性检验6.5 假设检验中的其他问题6.6 Excel应用第1页/共110页学习目标1.假设检验的基本思想和原理 2.假设检验的步骤3.一个总体参数的检验4.两个总体参数的检验5.P值的计算与应用6.用Excel进行检验第2页/共110页6.1 假设检验的基本问题 基本思想 假设与检验 两类可能的错误 双边检验与单边检验第3页/共110页假设检验在统计方法中的地位统计方法统计方法描述统计描述统计推断统计推断统计参数估计参数估计假设检验假设检验第4页/共110页例子【例例6
2、.1.1】有一厂家生产了两批灯泡各10,000只,其中一批9,999只好的,仅有一只坏的,而另一批灯泡恰好相反,有9,999只是坏的,仅1只是好的,现卖给某一商场,据说这是好的那一批,可商场从这批灯泡中任抽一只发觉是坏的,于是拒绝买下这批货物 商场拒买的理由是什么呢?假设这批灯泡是好的那批,那么“任抽一只是坏的”这样的随机事件发生的概率应是0.01,这样小的概率在一次抽样中几乎不可能发生,而今任抽一只是坏的,这样的事件居然发生,于是拒绝接受“这是好的那批”的假设,肯定地认为将买到坏的那批,于是坚决拒买 他会犯错误吗?第5页/共110页假设检验中的小概率原理 什么是小概率?1.在一次试验中,一个
3、几乎不可能发生的事件发生的概率2.在一次试验中小概率事件一旦发生,我们就有理由拒绝原假设3.小概率由研究者事先确定什么是小什么是小什么是小概率?概率?概率?第6页/共110页假设检验的基本思想.因此我们拒绝假设 =50.如果这是总体的真实均值样本均值 =50抽样分布H H0 0这个值不像我们应该得到的样本均值.2020第7页/共110页假设检验的基本思想 这是一个带有概率性质的反证法:先假定一个假设是成立的,在这种假设下,将构成一个小概率事件,根据实际推断原理:“小概率事件在一次试验中几乎是不可能发生的”。然而这样的事件在一次试验中却发生了,那么我们自然要怀疑“假设”的正确性,于是“拒绝假设”
4、。如果“小概率事件”末发生,则不能拒绝“假设”,而只能接受它 第8页/共110页假设的陈述第9页/共110页什么是假设?(hypothesis)对总体参数的具体数值所作的陈述总体参数包括总体均值、比例、方差等分析之前必需陈述我认为这种新药的疗效比原有的药物更有效!第10页/共110页什么是假设检验?(hypothesis test)1.先对总体的参数(或分布形式)提出某种假设,然后利用样本信息判断假设是否成立的过程2.有参数检验和非参数检验一种是当总体分布类型已知,所涉及到的是分布中所包含的几个未知参数的假设检验,这种假设检验叫参数假设检验。另外一种是除上述假设检验以外的其它假设检验,称为非参
5、数假设检验 3.逻辑上运用反证法,统计上依据小概率原理第11页/共110页总体总体假设检验的过程抽取随机样本抽取随机样本均值均值 x x =20=20我认为人口的平我认为人口的平均年龄是均年龄是5050岁岁 提出假设提出假设 拒绝假设 别无选择!作出决策作出决策第12页/共110页原假设与备择假设第13页/共110页原假设(null hypothesis)1.研究者想收集证据予以反对的假设2.又称“0假设”3.总是有符号 ,或 4.表示为 H0H0:=某一数值 指定为符号=,或 为什么叫为什么叫为什么叫0 0 0假设假设假设?第14页/共110页1.研究者想收集证据予以支持的假设2.也称“研究
6、假设”3.总是有符号 ,或 4.表示为 H1H1:某一数值,或 某一数值例如,H1:55 第16页/共110页【例】某厂生产一种产品,其直径尺寸d(毫米)服从正态分布N(200,42)。今采取新的工艺生产,从产品中随机抽取10件检查新工艺生产的产品质量,得其平均直径为202.5毫米。试问,改革工艺前后产品直径平均尺寸有无显著变化?试陈述用于检验的原假设与备择假设提出假设(例题分析)解解解:研研研究究究者者者抽抽抽检检检的的的意意意图图图是是是倾倾倾向向向于于于证证证实实实改改改革革革工工工艺艺艺后后后产产产品品品直直直径平均尺度有变化。建立的原假设和备择假设为径平均尺度有变化。建立的原假设和备
7、择假设为径平均尺度有变化。建立的原假设和备择假设为 H H H0 0 0:200200200200200200 H H H1 1 1:200200200第17页/共110页1.原假设和备择假设是一个完备事件组,而且相互对立在一项假设检验中,原假设和备择假设必有一个成立,而且只有一个成立2.先确定备择假设,再确定原假设 3.等号“=”总是放在原假设上 4.因研究目的不同,对同一问题可能提出不同的假设(也可能得出不同的结论)提出假设(结论与建议)第18页/共110页两类错误与显著性水平第19页/共110页假设检验中的两类错误1.第类错误(弃真错误)原假设为真时拒绝原假设第类错误的概率记为被称为显著
8、性水平2.第类错误(取伪错误)原假设为假时未拒绝原假设第类错误的概率记为(Beta)第20页/共110页H H0 0:无罪无罪假设检验中的两类错误(决策结果)陪审团审判陪审团审判裁决裁决实际情况实际情况无罪无罪有罪有罪无罪无罪正确正确错误错误有罪有罪错误错误正确正确H0 检验检验决策决策实际情况实际情况H0为真为真H0为假为假未拒绝未拒绝H0正确决策正确决策(1 )第第类错类错误误()拒绝拒绝H0第第类错类错误误()正确决策正确决策(1-(1-)假设检验就好像一场审判过程假设检验就好像一场审判过程假设检验就好像一场审判过程统计检验过程统计检验过程统计检验过程第21页/共110页 错误和 错误的
9、关系 你不能同时减少两类错误!和 的关系就像翘翘板,小 就大,大 就小第22页/共110页显著性水平 (significant level)1.是一个概率值2.原假设为真时,拒绝原假设的概率被称为抽样分布的拒绝域3.表示为(alpha)常用的 值有0.01,0.05,0.104.由研究者事先确定第23页/共110页双侧检验与单侧检验第24页/共110页1.备择假设没有特定的方向性,并含有符号“”的假设检验,称为双侧检验或双尾检验(two-tailed test)2.备择假设具有特定的方向性,并含有符号“”或“”的假设检验,称为单侧检验或单尾检验(one-tailed test)备择假设的方向为
10、“”,称为右侧检验 双侧检验与单侧检验第25页/共110页双侧检验与单侧检验(假设的形式)假假设双双侧检验单侧检验单侧检验左左侧检验右右侧检验原假设原假设H0:=0 0H0:0 0H0:0 0备择假设备择假设H1:0 0H1:0 0第26页/共110页统计量与拒绝域第27页/共110页1.根据样本观测结果计算得到的,并据以对原假设和备择假设作出决策的某个样本统计量2.对样本估计量的标准化结果原假设H0为真点估计量的抽样分布 检验统计量(test statistic)3.3.标准化的检验统计量标准化的检验统计量 第28页/共110页显著性水平和拒绝域(双侧检验)抽样分布抽样分布抽样分布000临界
11、值临界值临界值临界值临界值临界值 /2/2 /2/2/2 样本统计量样本统计量样本统计量拒绝拒绝拒绝HHH000拒绝拒绝拒绝HHH0001-1-1-置信水平置信水平置信水平第29页/共110页显著性水平和拒绝域(双侧检验)0 0临界值临界值临界值临界值 /2/2 /2/2 样本统计量样本统计量拒绝拒绝H H0 0拒绝拒绝H H0 0抽样分布抽样分布1-1-置信水平第30页/共110页显著性水平和拒绝域(双侧检验)0 0临界值临界值临界值临界值 /2/2 /2/2 样本统计量样本统计量拒绝拒绝H H0 0拒绝拒绝H H0 0抽样分布抽样分布1-1-置信水平置信水平第31页/共110页显著性水平和
12、拒绝域(双侧检验)0 0临界值临界值临界值临界值 /2/2 /2/2 样本统计量样本统计量拒绝拒绝H H0 0拒绝拒绝H H0 0抽样分布抽样分布1-1-置信水平第32页/共110页显著性水平和拒绝域(单侧检验)0 0临界值临界值 样本统计量样本统计量拒绝拒绝H H0 0抽样分布抽样分布1-1-置信水平置信水平第33页/共110页显著性水平和拒绝域(左侧检验)0 0临界值临界值 样本统计量样本统计量拒绝拒绝H H0 0抽样分布1-1-置信水平置信水平观察到的样本统计量观察到的样本统计量观察到的样本统计量第34页/共110页显著性水平和拒绝域(左侧检验)0 0临界值临界值 样本统计量样本统计量拒
13、绝拒绝H H0 0抽样分布抽样分布1-1-置信水平置信水平第35页/共110页显著性水平和拒绝域(右侧检验)0 0临界值临界值 样本统计量样本统计量拒绝拒绝H H0 0抽样分布抽样分布1-1-置信水平置信水平观察到的样本统计量观察到的样本统计量第36页/共110页显著性水平和拒绝域(右侧检验)0 00临界值临界值临界值 样本统计量样本统计量样本统计量抽样分布抽样分布1-1-置信水平置信水平拒绝拒绝拒绝H HH0 00第37页/共110页决策规则1.给定显著性水平,查表得出相应的临界值z或z/2,t或t/22.将检验统计量的值与 水平的临界值进行比较3.作出决策双侧检验:I统计量I 临界值,拒绝
14、H0左侧检验:统计量 临界值,拒绝H0第38页/共110页假设检验步骤的总结1.设立零假设H0和备择假设H1;2.选择统计量,计算被检验的实际统计量之值;3.确定统计量的抽样分布;4.确定显著性水平,根据显著性水平确定临界值5.根据临界值(或者p值),确定检验准则,即给出拒绝域和接受域;6.将计算的被检验实际统计量之值与临界值比较(或者根据p值大小判断),从而判定接受或拒绝零假设,完成统计假设检验 第39页/共110页6.2 总体均值的假设检验 Z-检验 T-检验 第40页/共110页总体均值的检验(z检验)1.假定条件正态总体或非正态总体大样本(n30)2.使用z检验统计量 2 已知:2 未
15、知:第41页/共110页总体均值的检验(检验方法的总结)假设假设双侧检验双侧检验左左侧检验右右侧检验假设形式假设形式H0:=0H1:0H0:0H1:0统计量统计量 已知:未知:拒绝域拒绝域P值决策值决策拒绝H0第42页/共110页总体均值的检验(2 已知)(例题分析)【例】某市历年来对7岁男孩的统计资料表明,他们的身高服从均值为1.32米、标准差为0.12米的正态分布。现从各个学校随机抽取25个7岁男学生,测得他们平均身高1.36米,若已知今年全市7岁男孩身高的标准差仍为0.12米,问与历年7岁男孩的身高相比是否有显著差异?双侧检验第43页/共110页总体均值的检验(2 已知)(例题分析)H0
16、:=1.32H1:1.32 =0.05n=25临界值(c):检验统计量:z z0 01.961.96-1.96-1.960.0250.025拒绝拒绝 H H0 0拒绝拒绝 H H0 00.0250.025决策:结论:不拒绝不拒绝H H0 0样样本本提提供供的的证证据据表表明明:男男孩孩平平均身高没有显著提高均身高没有显著提高第44页/共110页两个总体均值之差的检验(z检验)1.假定条件两个样本是独立的随机样本正态总体或非正态总体大样本(n130和 n230)2.检验统计量 12,22 已知:12,22 未知:第45页/共110页两个总体均值之差的检验(检验方法的总结)假设假设双侧检验双侧检验
17、左左侧检验右右侧检验假设形式假设形式H0:1-2=0H1:1-20H0:1-20H1:1-20统计量统计量12,22 已知12,22 未知拒绝域拒绝域P值决策值决策拒绝H0第46页/共110页两个总体均值之差的检验(例题分析)【例例】由由长长期期积积累累的的资资料料知知道道,甲甲、乙乙两两城城市市2020岁岁男男青青年年的的体体重重都都服服从从正正态态分分布布,并并且且标标准准差差分分别别为为14142 2公公斤斤和和10105 5公公斤斤,现现各各随随机机抽抽取取2727名名2020岁岁男男青青年年,则则得得平平均均体体重重分分别别为为65654 4公公斤斤和和54547 7公公斤斤,问问甲
18、甲、乙乙两两城城市市2020岁岁男男青青年年平平均均体体重重有有无无显显著著差差异异?两个样本的有关数据两个样本的有关数据 甲城市男青年甲城市男青年乙城市男青年乙城市男青年n1=27n2=27x1=65.4x2=54.7 1=14.2 2=10.5第47页/共110页两个总体均值之差的检验(例题分析)H0:1 1-=0H1:1 1-0 =0.05n1=27,n2=27临界值(c):检验统计量:决策:结论:拒绝拒绝H H0 0两城市男青年的平均体重有显著差异两城市男青年的平均体重有显著差异z z0 01.961.96-1.96-1.960.0250.025拒绝拒绝 H H0 0拒绝拒绝 H H0
19、 00.0250.025第48页/共110页总体均值的检验(t检验)1.假定条件总体服从正态分布2.检验统计量 2 未知:第49页/共110页总体均值的检验(检验方法的总结)假设假设双侧检验双侧检验左左侧检验右右侧检验假设形式假设形式H0:=0H1:0H0:0H1:0统计量统计量 未知:拒绝域拒绝域P值决策值决策拒绝H0第50页/共110页总体均值的检验(例题分析)【例】某制药厂试制某种安定神经的新药,给10个病人试服,结果各病人增加睡眠量如表所示,试判断这种新药对病人有无安定神经的功效?10人增加睡眠的时间人增加睡眠的时间(小时)0.7-1.1-0.21.20.13.43.70.81.82.
20、0第51页/共110页总体均值的检验(例题分析)H0:=0H1:0 =0.05df=10-1=9临界值(c):检验统计量:拒绝拒绝H H0 0认为这种新药对病人有安定神认为这种新药对病人有安定神经的功效经的功效 决策:结论:t t0 01.8331.8330.050.05拒绝拒绝 H H0 0第52页/共110页两个总体均值之差的检验(12,22 未知但 12=22)1.假定假定条件条件n n两个独立的小样本两个独立的小样本n n两个两个总体都是正态分布总体都是正态分布n n 1 12 2、2 22 2未知但相等,即未知但相等,即 1 12 2=2 22 22.检验检验统计量统计量其中:自由度
21、:第53页/共110页两个总体均值之差的检验(例题分析)【例例】某某工工业业管管理理局局在在体体制制改改革革前前后后,分分别别调调查查了了l0l0个个和和1212个个企企业业的的劳劳动动生生产产率率情情况况,得得知知改改革革前前、后后平平均均劳劳动动生生产产率率(元元人人)分分别别为为20892089、24502450,劳劳动动生生产产率率的的方方差差分分别别为为76897689;68506850。又又知知改改革革前前、后后企企业业劳劳动动生生产产率率的的标标准准差差相相等等问问:在在显显著著性性水水平平0.050.05下下,改革前、后平均劳动生产率有无显著差异改革前、后平均劳动生产率有无显著
22、差异?第54页/共110页两个总体均值之差的检验(例题分析)H0:1 1-=0H1:1 1-0 =0.05n1=10,n2=12临界值(c):检验统计量:决策:结论:拒绝H0改革后的劳动生产率高于改革前的劳动生改革后的劳动生产率高于改革前的劳动生产率产率 0 0-1.725-1.725拒绝拒绝 H H0 00.050.05第55页/共110页6.3 总体比例的假设检验 单个总体比例的检验 两个总体比例的检验 第56页/共110页适用的数据类型离散数据 连续数据数值型数据数 据品质数据第57页/共110页单个总体比例检验1.假定条件总体服从二项分布可用正态分布来近似(大样本)2.检验的 z 统计
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 统计学 统计 假设检验
限制150内