统计学——假设检验概念和方法.pptx
《统计学——假设检验概念和方法.pptx》由会员分享,可在线阅读,更多相关《统计学——假设检验概念和方法.pptx(106页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、假设检验在统计方法中的地位统计方法统计方法描述统计描述统计推断统计推断统计参数估计参数估计假设检验假设检验第1页/共106页学习目标1.了解假设检验的基本思想 2.掌握假设检验的步骤3.对实际问题作假设检验4.利用置信区间进行假设检验5.利用P-值进行假设检验第2页/共106页6.1 假设检验的基本问题一一.假设问题的提出二二.假设的表达式三三.两类错误四四.假设检验中的值五五.假设检验的另一种方法六六.单侧检验第3页/共106页让我们先看一个例子.基本概念基本概念第4页/共106页 生产流水线上罐装可乐不断地封装,然后装箱外运.怎么知道这批罐装可乐的容量是否合格呢?罐装可乐的容量按标准应为3
2、55毫升.基本概念基本概念第5页/共106页 每隔一定时间,抽查若干罐.如每隔1小时,抽查5罐,得5个容量的值X1,X5,根据这些值来判断生产是否正常.通常的办法是进行抽样检查.基本概念基本概念第6页/共106页根据样本的信息检验关于总体的某个命题是否正确.这类问题称作假设检验问题.基本概念基本概念第7页/共106页什么是假设?(hypothesis)对总体参数的的数值所作的一种陈述总体参数包括总体均值、比例、方差等分析之前必需陈述我认为该地区新生婴儿我认为该地区新生婴儿的平均体重为的平均体重为31903190克克!第8页/共106页什么是假设检验?(hypothesis testing)1.
3、事先对总体参数或分布形式作出某种假设,然后利用样本信息来判断原假设是否成立2.有参数假设检验和非参数假设检验3.采用逻辑上的反证法,依据统计上的小概率原理第9页/共106页假设检验的基本思想.因此我们拒因此我们拒绝假设绝假设 =50=50.如果这是总如果这是总如果这是总体的真实均值体的真实均值体的真实均值样本均值样本均值 =50抽样分布抽样分布H H0 0这个值不像我这个值不像我们应该得到的们应该得到的样本均值样本均值 .2020第10页/共106页总体总体假设检验的过程抽取随机样本抽取随机样本均值均值 X X=20=20我认为人口的平我认为人口的平均年龄是均年龄是5050岁岁 提出假设提出假
4、设 拒绝假设!别无选择.作出决策作出决策第11页/共106页假设检验的步骤假设检验的步骤提出假设提出假设确定适当的检验统计量确定适当的检验统计量规定显著性水平规定显著性水平 计算检验统计量的值计算检验统计量的值作出统计决策作出统计决策第12页/共106页提出原假设和备择假设 什么是原假设?(null hypothesis)1.待检验的假设,又称“0假设”2.研究者想收集证据予以反对的假设3.总是有等号 ,或 4.表示为 H0H0:某一数值 指定为=号,即 或 例如,H0:3190(克)为什么叫为什么叫为什么叫0 00假设假设假设?第13页/共106页为什么叫 0 假设?之所以用零来修饰原假设,
5、其原因是原假设的内容总是没有差异或没有改变,或变量间没有关系等等零假设总是一个与总体参数有关的问题,所以总是用希腊字母表示。关于样本统计量如样本均值或样本均值之差的零假设是没有意义的,因为样本统计量是已知的,当然能说出它们等于几或是否相等第14页/共106页 什么是备择假设?(alternative hypothesis)1.与原假设对立的假设,也称“研究假设”2.研究者想收集证据予以支持的假设总是有不等号:,或 3.表示为 H1H1:某一数值,或 某一数值例如,H1:3910(克),或3910(克)提出原假设和备择假设第15页/共106页 什么检验统计量?1.用于假设检验决策的统计量2.选择
6、统计量的方法与参数估计相同,需考虑是大样本还是小样本总体方差已知还是未知3.检验统计量的基本形式为确定适当的检验统计量第16页/共106页规定显著性水平(significant level)什么显著性水平?1.是一个概率值2.原假设为真时,拒绝原假设的概率被称为抽样分布的拒绝域3.表示为(alpha)常用的 值有0.01,0.05,0.104.由研究者事先确定第17页/共106页作出统计决策1.计算检验的统计量2.根据给定的显著性水平,查表得出相应的临界值z或z,t或t3.将检验统计量的值与 水平的临界值进行比较4.得出拒绝或不拒绝原假设的结论第18页/共106页假设检验中的小概率原理 什么小
7、概率?1.在一次试验中,一个几乎不可能发生的事件发生的概率2.在一次试验中小概率事件一旦发生,我们就有理由拒绝原假设3.小概率由研究者事先确定什么是小什么是小什么是小概率?概率?概率?第19页/共106页什么是小概率?概率是从0到1之间的一个数,因此小概率就应该是接近0的一个数著名的英国统计家Ronald Fisher 把20分之1作为标准,这也就是0.05,从此0.05或比0.05小的概率都被认为是小概率Fisher没有任何深奥的理由解释他为什么选择0.05,只是说他忽然想起来的第20页/共106页假设检验中的两类错误1.第一类错误(弃真错误)原假设为真时拒绝原假设会产生一系列后果第一类错误
8、的概率为被称为显著性水平2.第二类错误(取伪错误)原假设为假时接受原假设第二类错误的概率为(Beta)第21页/共106页H H0 0:无罪无罪假设检验中的两类错误(决策结果)陪审团审判陪审团审判裁决裁决实际情况实际情况无罪无罪有罪有罪无罪无罪正确正确错误错误有罪有罪错误错误正确正确H0 检验检验决策决策实际情况实际情况H0为真为真H0为假为假接受接受H0正确决策正确决策(1 )第二类错第二类错误误()拒绝拒绝H0第一类错第一类错误误()正确决策正确决策(1-(1-)假设检验就好像一场审判过程假设检验就好像一场审判过程统计检验过程统计检验过程第22页/共106页 错误和 错误的关系 你不能同时
9、减少两类错误!和和 的关系就像的关系就像翘翘板,翘翘板,小小 就就大,大,大大 就小就小第23页/共106页影响 错误的因素1.总体参数的真值随着假设的总体参数的减少而增大2.显著性水平 当减少时增大3.总体标准差 当增大时增大4.样本容量 n当 n 减少时增大第24页/共106页什么是P 值?(P-value)1.是一个概率值2.如果原假设为真,P-值是抽样分布中大于或小于样本统计量的概率左侧检验时,P-值为曲线上方小于等于检验统计量部分的面积右侧检验时,P-值为曲线上方大于等于检验统计量部分的面积3.被称为观察到的(或实测的)显著性水平H0 能被拒绝的的最小值第25页/共106页双侧检验的
10、P 值 /2 2 /2 2 Z Z拒绝拒绝拒绝拒绝H HH0 00值值值临界值临界值临界值计算出的样本统计量计算出的样本统计量计算出的样本统计量计算出的样本统计量计算出的样本统计量计算出的样本统计量临界值临界值临界值1/2 1/2 1/2 P P P 值值值1/2 1/2 1/2 P P P 值值值第26页/共106页左侧检验的P 值H HH0 00值值值临界值临界值临界值 样本统计量样本统计量样本统计量拒绝域拒绝域拒绝域抽样分布抽样分布1-1-置信水平置信水平计算出的样本统计量计算出的样本统计量计算出的样本统计量P P P 值值值第27页/共106页右侧检验的P 值H H0 0值值临界值临界
11、值 拒绝域拒绝域抽样分布抽样分布1-1-置信水平置信水平计算出的样本统计量计算出的样本统计量P P 值值第28页/共106页利用 P 值进行检验(决策准则)1.单侧检验若p-值 ,不拒绝 H0若p-值 ,拒绝 H02.双侧检验若p-值 ,不拒绝 H0若p-值 ,拒绝 H0第29页/共106页双侧检验与单侧检验(假设的形式)假设假设研究的问题研究的问题双侧检验双侧检验左侧检验左侧检验右侧检验右侧检验H0=0 0 0 0 0 0H1 0 0 0 0第30页/共106页双侧检验(原假设与备择假设的确定)1.属于决策中的假设检验2.不论是拒绝H0还是不拒绝H0,都必需采取相应的行动措施3.例如,某种零
12、件的尺寸,要求其平均长度为10cm,大于或小于10cm均属于不合格我们想要证明(检验)大于或小于这两种可能性中的任何一种是否成立4.建立的原假设与备择假设应为 H0:10 H1:10第31页/共106页双侧检验(显著性水平与拒绝域)抽样分布抽样分布抽样分布H HH000值值值临界值临界值临界值临界值临界值临界值 /2/2 /2/2/2 样本统计量样本统计量样本统计量拒绝域拒绝域拒绝域拒绝域拒绝域拒绝域1-1-1-置信水平置信水平置信水平第32页/共106页双侧检验(显著性水平与拒绝域)H H0 0值值临界值临界值临界值临界值/2 /2/2 样本统计量样本统计量拒绝域拒绝域拒绝域拒绝域抽样分布抽
13、样分布1-1-置信水平置信水平第33页/共106页双侧检验(显著性水平与拒绝域)H H0 0值值临界值临界值临界值临界值 /2 /2/2 样本统计量样本统计量拒绝域拒绝域拒绝域拒绝域抽样分布抽样分布1-1-置信水平置信水平第34页/共106页双侧检验(显著性水平与拒绝域)H H0 0值值临界值临界值临界值临界值/2 /2/2 样本统计量样本统计量拒绝域拒绝域拒绝域拒绝域抽样分布抽样分布1-1-置信水平置信水平第35页/共106页单侧检验(原假设与备择假设的确定)1.将研究者想收集证据予以支持的假设作为备择假设H1例如,一个研究者总是想证明自己的研究结论是正确的一个销售商总是想正确供货商的说法是
14、不正确的备择假设的方向与想要证明其正确性的方向一致2.将研究者想收集证据证明其不正确的假设作为原假设H03.先确立备择假设H1第36页/共106页单侧检验(原假设与备择假设的确定)q一项研究表明,采用新技术生产后,将会使产品的使用寿命明显延长到1500小时以上。检验这一结论是否成立研究者总是想证明自己的研究结论(寿命延长)是正确的备择假设的方向为“”(寿命延长)建立的原假设与备择假设应为 H0:1500 H1:1500第37页/共106页单侧检验(原假设与备择假设的确定)q一项研究表明,改进生产工艺后,会使产品的废品率降低到2%以下。检验这一结论是否成立研究者总是想证明自己的研究结论(废品率降
15、低)是正确的备择假设的方向为“”(废品率降低)建立的原假设与备择假设应为 H0:2%H1:2%第38页/共106页单侧检验(原假设与备择假设的确定)q某灯泡制造商声称,该企业所生产的灯泡的平均使用寿命在1000小时以上。如果你准备进一批货,怎样进行检验检验权在销售商一方作为销售商,你总是想收集证据证明生产商的说法(寿命在1000小时以上)是不是正确的备择假设的方向为“1020 =0.05n=16临界值(s):检验统计量检验统计量:在在 =0.05=0.05的水平上拒绝的水平上拒绝H H0 0有证据表明这批灯泡的使用有证据表明这批灯泡的使用寿命有显著提高寿命有显著提高决策决策:结论结论:Z Z0
16、 0拒绝域拒绝域0.050.051.6451.645第53页/共106页 2 未知大样本均值的检验(例题分析)【例】某电子元件批量生产的质量标准为平均使用寿命1200小时。某厂宣称他们采用一种新工艺生产的元件质量大大超过规定标准。为了进行验证,随机抽取了100件作为样本,测得平均使用寿命1245小时,标准差300小时。能否说该厂生产的电子元件质量显著地高于规定标准?(0.05)单侧检验单侧检验第54页/共106页 2 未知大样本均值的检验(例题分析)H0:1200H1:1200 =0.05n=100临界值(s):检验统计量检验统计量:在在 =0.05=0.05的水平上不拒绝的水平上不拒绝H H
17、0 0不能认为该厂生产的元件寿命不能认为该厂生产的元件寿命显著地高于显著地高于12001200小时小时决策决策:结论结论:Z Z0 0拒绝域拒绝域0.050.051.6451.645第55页/共106页总体均值的检验(2未知小样本)1.假定条件总体为正态分布2未知,且小样本2.使用t 统计量第56页/共106页 2 未知小样本均值的检验(例题分析)【例】某机器制造出的肥皂厚度为5cm,今欲了解机器性能是否良好,随机抽取10块肥皂为样本,测得平均厚度为5.3cm,标准差为0.3cm,试以0.05的显著性水平检验机器性能良好的假设。双侧检验双侧检验第57页/共106页 2 未知小样本均值的检验(例
18、题分析)H0:=5H1:5 =0.05df=10-1=9临界值(s):检验统计量检验统计量:在在 =0.05=0.05的水平上拒绝的水平上拒绝H H0 0说明该机器的性能不好说明该机器的性能不好 决策:决策:结论:结论:t t0 02.2622.262-2.262-2.262.025025拒绝拒绝 H H0 0拒绝拒绝 H H0 0.025025第58页/共106页 2 未知小样本均值的检验(P 值的计算与应用)第1步:进入Excel表格界面,选择“插入”下拉菜单第2步:选择“函数”点击,并在函数分类中点击“统 计”,然后,在函数名的菜单中选择字符 “TDIST”,确定第3步:在弹出的X栏中录
19、入计算出的t值3.16 在自由度(Deg-freedom)栏中录入9 在Tails栏中录入2,表明是双侧检验(单测 检验则在该栏内录入1)P值的结果为0.011550.025,拒绝H0第59页/共106页 2 未知小样本均值的检验(例题分析)【例】一个汽车轮胎制造商声称,某一等级的轮胎的平均寿命在一定的汽车重量和正常行驶条件下大于40000公里,对一个由20个轮胎组成的随机样本 作 了 试 验,测 得 平 均 值 为41000公里,标准差为5000公里。已知轮胎寿命的公里数服从正态分布,我们能否根据这些数据作出结论,该制造商的产品同他所说的标准相符?(=0.05)单侧检验!单侧检验!第60页/
20、共106页均值的单尾 t 检验(计算结果)H0:40000H1:40000 =0.05df=20-1=19临界值(s):检验统计量检验统计量:在在 =0.05=0.05的水平上不拒绝的水平上不拒绝H H0 0不能认为制造商的产品同他所不能认为制造商的产品同他所说的标准不相符说的标准不相符决策决策:结论结论:-1.7291-1.7291t t0 0拒绝域拒绝域.05.05第61页/共106页总体比例的检验(Z 检验)第62页/共106页适用的数据类型离散数据 连续数据数值型数据数 据品质数据第63页/共106页一个总体比例检验1.假定条件有两类结果总体服从二项分布可用正态分布来近似2.比例检验的
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 统计学 假设检验 概念 方法
限制150内