统计学假设检验概念和方法精品文稿.ppt
《统计学假设检验概念和方法精品文稿.ppt》由会员分享,可在线阅读,更多相关《统计学假设检验概念和方法精品文稿.ppt(105页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、统计学假设检验概念和方法第1页,本讲稿共105页假设检验在统计方法中的地位第2页,本讲稿共105页学习目标1.了解假设检验的基本思想了解假设检验的基本思想 2.掌握假设检验的步骤掌握假设检验的步骤3.对实际问题作假设检验对实际问题作假设检验4.利用置信区间进行假设检验利用置信区间进行假设检验5.利用利用P-值进行假设检验值进行假设检验第3页,本讲稿共105页6.1 假设检验的基本问题一一.假设问题的提出假设问题的提出二二.假设的表达式假设的表达式三三.两类错误两类错误四四.假设检验中的值假设检验中的值五五.假设检验的另一种方法假设检验的另一种方法六六.单侧检验单侧检验第4页,本讲稿共105页让
2、我们先看一个例子让我们先看一个例子.基本概念基本概念第5页,本讲稿共105页 生产流水线上罐装可乐不生产流水线上罐装可乐不断地封装,然后装箱外运断地封装,然后装箱外运.怎怎么知道么知道这批罐装可乐的容量这批罐装可乐的容量是否合格是否合格呢?呢?罐装可乐的容量按标准应为罐装可乐的容量按标准应为355毫升毫升.基本概念基本概念第6页,本讲稿共105页 每隔一定时间,抽查若干罐每隔一定时间,抽查若干罐.如每隔如每隔1小时,小时,抽查抽查5罐,得罐,得5个容量的值个容量的值X1,X5,根据,根据这些值来判断生产是否正常这些值来判断生产是否正常.通常的办法是进行抽样检查通常的办法是进行抽样检查.基本概念
3、基本概念第7页,本讲稿共105页根根据据样样本本的的信信息息检检验验关关于于总总体体的的某某个个命命题题是是否否正确正确.这类问题称作这类问题称作假设检验假设检验问题问题.基本概念基本概念第8页,本讲稿共105页什么是假设?(hypothesis)对总体参数的的数值所作的一种陈述总体参数包括总总体体均均值值、比例比例、方差方差等分析之前之前必需陈述我认为该地区新生婴儿的平均我认为该地区新生婴儿的平均体重为体重为31903190克克!第9页,本讲稿共105页什么是假设检验?(hypothesis testing)1.事先对总体参数或分布形式作出某种假设,然后利用样本信息来判断原假设是否成立2.有
4、参数假设检验和非参数假设检验3.采用逻辑上的反证法,依据统计上的小概率原理第10页,本讲稿共105页假设检验的基本思想.因此我们拒因此我们拒因此我们拒因此我们拒绝假设绝假设绝假设绝假设 =50=50.如果这是如果这是如果这是如果这是如果这是如果这是总体的真实均总体的真实均总体的真实均总体的真实均总体的真实均总体的真实均值值值值值值样本均值样本均值 =50抽样分布抽样分布抽样分布抽样分布H H0 0这个值不像我这个值不像我这个值不像我这个值不像我们应该得到的们应该得到的们应该得到的们应该得到的样本均值样本均值样本均值样本均值.2020第11页,本讲稿共105页总体总体总体总体假设检验的过程抽取随
5、机样本抽取随机样本抽取随机样本抽取随机样本均值均值均值均值 X X=20=20我认为人口的平我认为人口的平均年龄是均年龄是5050岁岁 提出假设提出假设提出假设提出假设 拒绝假设拒绝假设!别无选择别无选择.作出决策作出决策作出决策作出决策第12页,本讲稿共105页假设检验的步骤假设检验的步骤提出假设提出假设提出假设提出假设确定适当的检验统计量确定适当的检验统计量确定适当的检验统计量确定适当的检验统计量规定显著性水平规定显著性水平 计算检验统计量的值计算检验统计量的值计算检验统计量的值计算检验统计量的值作出统计决策作出统计决策作出统计决策作出统计决策第13页,本讲稿共105页提出原假设和备择假设
6、 什么是原假设?什么是原假设?(null hypothesis)1.待检验的假设,又称“0假设”2.研究者想收集证据予以反对的假设3.总是有等号 ,或 4.表示为 H0H0:某一数值 指定为=号,即 或 例如,H0:3190(克)为什么叫为什么叫为什么叫0 00假设假设假设?第14页,本讲稿共105页为什么叫为什么叫 0 假设?假设?之所以用零来修饰原假设,其原因是原假设的内容总是没有差异或没有改变,或变量间没有关系等等零假设总是一个与总体参数有关的问题,所以总是用希腊字母表示。关于样本统计量如样本均值或样本均值之差的零假设是没有意义的,因为样本统计量是已知的,当然能说出它们等于几或是否相等第
7、15页,本讲稿共105页 什么是备择假设?什么是备择假设?(alternative hypothesis)1.与原假设对立的假设,也称“研究假设”2.研究者想收集证据予以支持的假设总是有不等号:,或 3.表示为 H1H1:某一数值,或 某一数值例如,H1:3910(克),或3910(克)提出原假设和备择假设提出原假设和备择假设第16页,本讲稿共105页 什么检验统计量?什么检验统计量?1.用于假设检验决策的统计量2.选择统计量的方法与参数估计相同,需考虑是大样本还是小样本总体方差已知还是未知3.检验统计量的基本形式为确定适当的检验统计量确定适当的检验统计量第17页,本讲稿共105页规定显著性水
8、平(significant level)什么显著性水平?什么显著性水平?1.是一个概率值2.原假设为真时,拒绝原假设的概率被称为抽样分布的拒绝域3.表示为(alpha)常用的 值有0.01,0.05,0.104.由研究者事先确定第18页,本讲稿共105页作出统计决策1.计算检验的统计量2.根据给定的显著性水平,查表得出相应的临界值z或z,t或t3.将检验统计量的值与 水平的临界值进行比较4.得出拒绝或不拒绝原假设的结论第19页,本讲稿共105页假设检验中的小概率原理 什么小概率?什么小概率?1.在一次试验中,一个几乎不可能发生的事件发生的概率2.在一次试验中小概率事件一旦发生,我们就有理由拒绝
9、原假设3.小概率由研究者事先确定什么是小什么是小什么是小概率?概率?概率?第20页,本讲稿共105页什么是小概率?什么是小概率?概率是从0到1之间的一个数,因此小概率就应该是接近0的一个数著名的英国统计家Ronald Fisher 把20分之1作为标准,这也就是0.05,从此0.05或比0.05小的概率都被认为是小概率Fisher没有任何深奥的理由解释他为什么选择0.05,只是说他忽然想起来的第21页,本讲稿共105页假设检验中的两类错误1.第一类错误(弃真错误)第一类错误(弃真错误)原假设为真时拒绝原假设会产生一系列后果第一类错误的概率为被称为显著性水平2.第二类错误(取伪错误)第二类错误(
10、取伪错误)原假设为假时接受原假设第二类错误的概率为(Beta)第22页,本讲稿共105页H H0 0:无罪无罪无罪无罪假设检验中的两类错误假设检验中的两类错误(决策结果)(决策结果)陪审团审判陪审团审判裁决裁决实际情况实际情况无罪无罪有罪有罪无罪无罪正确正确错误错误有罪有罪错误错误正确正确H0 检验检验决策决策实际情况实际情况H0为真为真H0为假为假接受接受H0正确决策正确决策(1 )第二类错第二类错误误()拒绝拒绝H0第一类错第一类错误误()正确决策正确决策(1-(1-)假设检验就好像一场审判过程假设检验就好像一场审判过程统计检验过程统计检验过程第23页,本讲稿共105页 错误和 错误的关系
11、 你不能同时减你不能同时减少两类错误少两类错误!和和和和 的关系就像的关系就像的关系就像的关系就像翘翘板,翘翘板,翘翘板,翘翘板,小小小小 就就就就大,大,大,大,大大大大 就小就小就小就小第24页,本讲稿共105页影响 错误的因素1.总体参数的真值随着假设的总体参数的减少而增大2.显著性水平 当减少时增大3.总体标准差 当增大时增大4.样本容量 n当 n 减少时增大第25页,本讲稿共105页什么是P 值?(P-value)1.是一个概率值2.如果原假设为真,P-值是抽样分布中大于或小于样本统计量的概率左侧检验时,P-值为曲线上方小于等于小于等于检验统计量部分的面积右侧检验时,P-值为曲线上方
12、大于等于大于等于检验统计量部分的面积3.被称为观察到的(或实测的)显著性水平H0 能被拒绝的的最小值第26页,本讲稿共105页双侧检验的P 值 /2 2 /2 2 Z Z拒绝拒绝拒绝拒绝拒绝拒绝拒绝拒绝H HH0 00值值值临界值临界值临界值计算出的样本统计量计算出的样本统计量计算出的样本统计量计算出的样本统计量计算出的样本统计量计算出的样本统计量计算出的样本统计量计算出的样本统计量计算出的样本统计量计算出的样本统计量计算出的样本统计量计算出的样本统计量临界值临界值临界值1/2 1/2 1/2 P P P 值值值1/2 1/2 1/2 P P P 值值值第27页,本讲稿共105页左侧检验的P
13、值H HH0 00值值值临界值临界值临界值 样本统计量样本统计量样本统计量拒绝域拒绝域拒绝域抽样分布抽样分布抽样分布抽样分布1-1-置信水平置信水平置信水平置信水平计算出的样本统计量计算出的样本统计量计算出的样本统计量计算出的样本统计量计算出的样本统计量计算出的样本统计量P P P 值值值第28页,本讲稿共105页右侧检验的P 值H H0 0值值临界值临界值 拒绝域拒绝域抽样分布抽样分布抽样分布抽样分布1-1-置信水平置信水平置信水平置信水平计算出的样本统计量计算出的样本统计量计算出的样本统计量计算出的样本统计量P P 值值第29页,本讲稿共105页利用 P 值进行检验(决策准则)1.单侧检验
14、若p-值 ,不拒绝 H0若p-值 ,拒绝 H02.双侧检验若p-值 ,不拒绝 H0若p-值 ,拒绝 H0第30页,本讲稿共105页双侧检验与单侧检验(假设的形式)假设假设研究的问题研究的问题双侧检验双侧检验左侧检验左侧检验右侧检验右侧检验H0=0 0 0 0 0 0H1 0 0 0 0第31页,本讲稿共105页双侧检验(原假设与备择假设的确定)1.属于决策中的假设检验决策中的假设检验2.不论是拒绝H0还是不拒绝H0,都必需采取相应的行动措施3.例如,某种零件的尺寸,要求其平均长度为10cm,大于或小于10cm均属于不合格我们想要证明(检验)大于或小于这两种可能性中的任何一种是否成立4.建立的原
15、假设与备择假设应为 H0:10 H1:10第32页,本讲稿共105页双侧检验(显著性水平与拒绝域)抽样分布抽样分布抽样分布抽样分布抽样分布抽样分布H HH000值值值临界值临界值临界值临界值临界值临界值 /2/2 /2/2/2 样本统计量样本统计量样本统计量拒绝域拒绝域拒绝域拒绝域拒绝域拒绝域1-1-1-置信水平置信水平置信水平置信水平置信水平置信水平第33页,本讲稿共105页双侧检验(显著性水平与拒绝域)H H0 0值值临界值临界值临界值临界值/2 /2/2 样本统计量样本统计量拒绝域拒绝域拒绝域拒绝域抽样分布抽样分布抽样分布抽样分布1-1-置信水平置信水平置信水平置信水平第34页,本讲稿共
16、105页双侧检验(显著性水平与拒绝域)H H0 0值值临界值临界值临界值临界值 /2 /2/2 样本统计量样本统计量拒绝域拒绝域拒绝域拒绝域抽样分布抽样分布抽样分布抽样分布1-1-置信水平置信水平置信水平置信水平第35页,本讲稿共105页双侧检验(显著性水平与拒绝域)H H0 0值值临界值临界值临界值临界值/2 /2/2 样本统计量样本统计量拒绝域拒绝域拒绝域拒绝域抽样分布抽样分布抽样分布抽样分布1-1-置信水平置信水平置信水平置信水平第36页,本讲稿共105页单侧检验(原假设与备择假设的确定)1.将研究者想收集证据予以支持的假设作为备择假设H1例如,一个研究者总是想证明自己的研究结论是正确的
17、一个销售商总是想正确供货商的说法是不正确的备择假设的方向与想要证明其正确性的方向一致2.将研究者想收集证据证明其不正确的假设作为原假设H03.先确立备择假设H1第37页,本讲稿共105页单侧检验(原假设与备择假设的确定)q一项研究表明,采用新技术生产后,将会使产品的使用寿命明显延长到1500小时以上。检验这一结论是否成立研究者总是想证明自己的研究结论(寿命延长)是正确的备择假设的方向为“”(寿命延长)建立的原假设与备择假设应为 H0:1500 H1:1500第38页,本讲稿共105页单侧检验(原假设与备择假设的确定)q一项研究表明,改进生产工艺后,会使产品的废品率降低到2%以下。检验这一结论是
18、否成立研究者总是想证明自己的研究结论(废品率降低)是正确的备择假设的方向为“”(废品率降低)建立的原假设与备择假设应为 H0:2%H1:2%第39页,本讲稿共105页单侧检验(原假设与备择假设的确定)q某灯泡制造商声称,该企业所生产的灯泡的平均使用寿命在1000小时以上。如果你准备进一批货,怎样进行检验检验权在销售商一方作为销售商,你总是想收集证据证明生产商的说法(寿命在1000小时以上)是不是正确的备择假设的方向为“1020 =0.05n=16临界值临界值(s):检验统计量检验统计量检验统计量检验统计量:在在 =0.05=0.05的水平上拒绝的水平上拒绝H H0 0有证据表明这批灯泡的使用寿
19、有证据表明这批灯泡的使用寿命有显著提高命有显著提高决策决策决策决策:结论结论结论结论:Z Z0 0拒绝域拒绝域拒绝域拒绝域0.050.051.6451.645第54页,本讲稿共105页2 未知大样本均值的检验(例题分析)【例例】某电子元件批量生产的质量标准为平均使用寿命1200小时。某厂宣称他们采用一种新工艺生产的元件质量大大超过规定标准。为了进行验证,随机抽取了100件作为样本,测得平均使用寿命1245小时,标准差300小时。能否说该厂生产的电子元件质量显著地高于规定标准?(0.05)单侧检验单侧检验第55页,本讲稿共105页2 未知大样本均值的检验(例题分析)H0:1200H1:1200
20、=0.05n=100临界值临界值(s):检验统计量检验统计量检验统计量检验统计量:在在 =0.05=0.05的水平上不拒绝的水平上不拒绝H H0 0不能认为该厂生产的元件寿命显不能认为该厂生产的元件寿命显著地高于著地高于12001200小时小时决策决策决策决策:结论结论结论结论:Z Z0 0拒绝域拒绝域拒绝域拒绝域0.050.051.6451.645第56页,本讲稿共105页总体均值的检验(2未知小样本)1.假定条件总体为正态分布2未知,且小样本2.使用t 统计量第57页,本讲稿共105页2 未知小样本均值的检验(例题分析)【例例】某机器制造出的肥皂厚度为5cm,今欲了解机器性能是否良好,随机
21、抽取10块肥皂为样本,测得平均厚度为5.3cm,标准差为0.3cm,试以0.05的显著性水平检验机器性能良好的假设。双侧检验双侧检验第58页,本讲稿共105页2 未知小样本均值的检验(例题分析)H0:=5H1:5 =0.05df=10-1=9临界值临界值(s):检验统计量检验统计量检验统计量检验统计量:在在 =0.05=0.05的水平上拒绝的水平上拒绝H H0 0说明该机器的性能不好说明该机器的性能不好 决策:决策:决策:决策:结论:结论:结论:结论:t t0 02.2622.262-2.262-2.262.025025拒绝拒绝拒绝拒绝 H H0 0拒绝拒绝拒绝拒绝 H H0 0.025025
22、第59页,本讲稿共105页2 未知小样本均值的检验(P 值的计算与应用)第1步:进入Excel表格界面,选择“插入”下拉菜单第2步:选择“函数”点击,并在函数分类中点击“统 计”,然后,在函数名的菜单中选择字符 “TDIST”,确定第3步:在弹出的X栏中录入计算出的t值3.16 在自由度(Deg-freedom)栏中录入9 在Tails栏中录入2,表明是双侧检验(单测 检验则在该栏内录入1)P值的结果为0.011550.025,拒绝H0第60页,本讲稿共105页2 未知小样本均值的检验(例题分析)【例例】一个汽车轮胎制造商声称,某一等级的轮胎的平均寿命在一定的汽车重量和正常行驶条件下大于400
23、00公里,对一个由20个轮胎组成的随机样本作了试验,测得平均值为41000公里,标准差为5000公里。已知轮胎寿命的公里数服从正态分布,我们能否根据这些数据作出结论,该制造商的产品同他所说的标准相符?(=0.05)单侧检验!单侧检验!第61页,本讲稿共105页均值的单尾 t 检验(计算结果)H0:40000H1:40000 =0.05df=20-1=19临界值临界值(s):检验统计量检验统计量检验统计量检验统计量:在在 =0.05=0.05的水平上不拒绝的水平上不拒绝H H0 0不能认为制造商的产品同他所说不能认为制造商的产品同他所说的标准不相符的标准不相符决策决策决策决策:结论结论结论结论:
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 统计学 假设检验 概念 方法 精品 文稿
限制150内