第6章假设检验22年课件.ppt
《第6章假设检验22年课件.ppt》由会员分享,可在线阅读,更多相关《第6章假设检验22年课件.ppt(118页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、6-1统计学统计学STATISTICS(第四版第四版)第6章假设检验22年课件 Still waters run deep.流静水深流静水深,人静心深人静心深 Where there is life,there is hope。有生命必有希望。有生命必有希望第第 6 章章 假设检验假设检验6.1 假设检验的基本原理假设检验的基本原理 6.2 一个总体参数的检验一个总体参数的检验6.3 两个总体参数的检验两个总体参数的检验yyyy-M-6-3统计学统计学STATISTICS(第四版第四版)学习目标学习目标l假设检验的基本思想和原理假设检验的基本思想和原理 l假设检验的步骤假设检验的步骤l一个总体
2、参数的检验一个总体参数的检验l两个总体参数的检验两个总体参数的检验lP值的计算与应用值的计算与应用l用用Excel进行检验进行检验yyyy-M-6-4统计学统计学STATISTICS(第四版第四版)正常人的平均体温是正常人的平均体温是37oC吗?吗?当当问问起起健健康康的的成成年年人人体体温温是是多多少少时时,多多数数人人 的的 回回 答答 是是3737o oC C,这这似似乎乎已已经经成成了了一一种种共共识识。下下面面是是一一个个研研究究人人员员测测量量的的5050个个健健康康成成年年人人的的体体温数据温数据 37.136.936.937.136.436.936.636.236.736.93
3、7.636.737.336.936.436.137.136.636.536.737.136.236.337.536.937.036.736.937.037.136.637.236.436.637.336.137.137.036.636.936.737.236.337.136.736.837.037.036.137.0yyyy-M-6-5统计学统计学STATISTICS(第四版第四版)正常人的平均体温是正常人的平均体温是37oC吗?吗?根根据据样样本本数数据据计计算算的的平平均均值值是是36.836.8o oC C ,标标准准差差为为0.360.36o oC C 根根据据参参数数估估计计方方法法
4、得得到到的的健健康康成成年年人人平平均均体体温温的的95%95%的的置置信信区区间间为为(36.7(36.7,36.9)36.9)。研研究究人人员员发发现现这个区间内并没有包括这个区间内并没有包括3737o oC C 因因此此提提出出“不不应应该该再再把把3737o oC C作作为为正正常常人人体体温温的的一个有任何特定意义的概念一个有任何特定意义的概念”我我们们应应该该放放弃弃“正正常常人人的的平平均均体体温温是是3737o oC”C”这这个个共共识识吗吗?本本章章的的内内容容就就将将提提供供一一套套标标准准统统计计程程序序来检验这样的观点来检验这样的观点yyyy-M-6.1 假设检验的基本
5、原理假设检验的基本原理 6.1.1 怎样提出假设?怎样提出假设?6.1.2 怎样做出决策?怎样做出决策?6.1.3 怎样表述决策结果?怎样表述决策结果?第第 6 章章 假设检验假设检验yyyy-M-6.1.1 怎样提出假设?怎样提出假设?6.1 假设检验的基本原理假设检验的基本原理yyyy-M-6-8统计学统计学STATISTICS(第四版第四版)什么是假设什么是假设?(hypothesis)在参数检验中,对总体参数的具体数值所作的陈述n n就就一一个个总总体体而而言言,总总体体参参数数包包括括总总总总体体体体均均均均值值值值、比例比例比例比例、方差方差方差方差等等n n分析分析之前之前之前之
6、前必需陈述必需陈述我认为这种新药的疗效我认为这种新药的疗效比原有的药物更有效比原有的药物更有效!yyyy-M-6-9统计学统计学STATISTICS(第四版第四版)什么是假设检验什么是假设检验?(hypothesis test)1.先先对对总总体体的的参参数数(或或分分布布形形式式)提提出出某某种种假假设设,然然后后利利用用样样本本信信息息判判断断假假设设是是否否成成立立的的统统计计方方法法2.有参数检验和有参数检验和非非参数检验参数检验3.逻辑上运用反证法,统计上依据小概率原理逻辑上运用反证法,统计上依据小概率原理n n小小概概率率是是在在一一次次试试验验中中,一一个个几几乎乎不不可可能能发
7、发生生的的事件发生的概率事件发生的概率n n在在一一次次试试验验中中小小概概率率事事件件一一旦旦发发生生,我我们们就就有有理理由拒绝原假设由拒绝原假设yyyy-M-6-10统计学统计学STATISTICS(第四版第四版)原假设原假设(null hypothesis)1.1.又称又称“0“0假设假设”,研,研究者想收集证据予以反对的假究者想收集证据予以反对的假设,用设,用H H0 0表示表示2.2.所表达的含义总是指所表达的含义总是指参数没有变化或变量之间没有参数没有变化或变量之间没有参数没有变化或变量之间没有参数没有变化或变量之间没有关系关系关系关系 3.3.最初被假设是成立的,之后根据样本数
8、据确定是否最初被假设是成立的,之后根据样本数据确定是否有足够的证据拒绝它有足够的证据拒绝它 4.4.总是有符号总是有符号 ,或或 n nH H0 0:=某一数值某一数值n nH H0 0:某一数值某一数值n nH H0 0:某一数值某一数值l l例如例如,H H0 0:10cm 10cmyyyy-M-6-11统计学统计学STATISTICS(第四版第四版)1.1.也也称称“研研究究假假设设”,”,研研究究者者想想收收集集证证据据予予以以支支持持的的假设,用假设,用H H1 1或或H Ha a表示表示2.2.所所表表达达的的含含义义是是总总体体参参数数发发生生了了变变化化或或变变量量之之间间有某
9、种关系有某种关系3.3.备备择择假假设设通通常常用用于于表表达达研研究究者者自自己己倾倾向向于于支支持持的的看看法法,然然后后就就是是想想办办法法收收集集证证据据拒拒绝绝原原假假设设,以以支持备择假设支持备择假设 4.4.总是有符号总是有符号 ,或或 n nH H1 1:某一数值某一数值n nH H1 1:某一数值某一数值n nH H1 1:”或“”的假设检验,称为单侧检验或单尾检验(one-tailed test)n n备择假设的方向为备择假设的方向为“”,称为,称为右侧检验右侧检验右侧检验右侧检验 双侧检验与单侧检验双侧检验与单侧检验yyyy-M-6-13统计学统计学STATISTICS(
10、第四版第四版)双侧检验与单侧检验双侧检验与单侧检验(假设的形式假设的形式)假假设双双侧检验单侧检验单侧检验左左侧检验右右侧检验原假设原假设H0:=0 0H0:0 0H0:0 0备择假设备择假设H1:0 0H1:0 0以总体均值的检验为例以总体均值的检验为例以总体均值的检验为例以总体均值的检验为例yyyy-M-6-14统计学统计学STATISTICS(第四版第四版)【例例例例6-16-1】一一种种零零件件的的生生产产标标准准是是直直径径应应为为10cm10cm,为为对对生生产产过过程程进进行行控控制制,质质量量监监测测人人员员定定期期对对一一台台加加工工机机床床检检查查,确确定定这这台台机机床床
11、生生产产的的零零件件是是否否符符合合标标准准要要求求。如如果果零零件件的的平平均均直直径径大大于于或或小小于于10cm10cm,则则表表明明生生产产过过程程不不正正常常,必必须须进进行行调调整整。试试陈陈述述用用来检验生产过程是否正常的原假设和被择假设来检验生产过程是否正常的原假设和被择假设提出假设提出假设(例题分析例题分析)解解解解解解:研研研究究究者者者想想想收收收集集集证证证据据据予予予以以以证证证明明明的的的假假假设设设应应应该该该是是是“生生生产产产过过过程程程不不不正正正常常常”。建建建立立立的的的原原原假假假设设设和和和备备备择择择假假假设为设为设为 H HH0 0 0:10cm
12、 10cm 10cm H HH1 1 1:10cm 10cm 10cm yyyy-M-6-15统计学统计学STATISTICS(第四版第四版)【例例例例6-26-2】某某品品牌牌洗洗涤涤剂剂在在它它的的产产品品说说明明书书中中声声称称:平平均均净净含含量量不不少少于于500500克克。从从消消费费者者的的利利益益出出发发,有有关关研研究究人人员员要要通通过过抽抽检检其其中中的的一一批批产产品品来来验验证证该该产产品品制制造造商商的的说说明明是是否否属属实实。试试陈陈述述用用于于检验的原假设与备择假设检验的原假设与备择假设提出假设提出假设(例题分析例题分析)解解解解解解:研研研究究究者者者抽抽抽
13、检检检的的的意意意图图图是是是倾倾倾向向向于于于证证证实实实这这这种种种洗洗洗涤涤涤剂剂剂的的的平平平均均均净净净含含含量量量并并并不不不符符符合合合说说说明明明书书书中中中的的的陈陈陈述述述 。建建建立立立的的的原原原假假假设设设和备择假设为和备择假设为和备择假设为 H H H0 0 0:500 500 500 H H H1 1 1:500 500 500500g500g500g绿叶绿叶绿叶洗涤剂洗涤剂洗涤剂yyyy-M-6-16统计学统计学STATISTICS(第四版第四版)【例例例例6-36-3】一一家家研研究究机机构构估估计计,某某城城市市中中家家庭庭拥拥有有汽汽车车的的比比例例超超过
14、过30%30%。为为验验证证这这一一估估计计是是否否正正确确,该该研研究究机机构构随随机机抽抽取取了了一一个个样样本本进进行行检检验验。试试陈述用于检验的原假设与备择假设陈述用于检验的原假设与备择假设提出假设提出假设(例题分析例题分析)解:解:解:解:解:解:研究者想收集证据予以支持的假研究者想收集证据予以支持的假研究者想收集证据予以支持的假设是设是设是“该城市中家庭拥有汽车的比例该城市中家庭拥有汽车的比例该城市中家庭拥有汽车的比例超过超过超过30%30%30%”。建立的原假设和备择假设。建立的原假设和备择假设。建立的原假设和备择假设为为为 H H H0 0 0:30%30%30%H H H1
15、 1 1:30%30%30%yyyy-M-6-17统计学统计学STATISTICS(第四版第四版)1.原假设和备择假设是一个完备事件组,而且相互对立n n在在一一项项假假设设检检验验中中,原原假假设设和和备备择择假假设设必必有有一一个成立,而且只有一个成立个成立,而且只有一个成立2.先确定备择假设,再确定原假设 3.等号“=”总是放在原假设上 4.因研究目的不同,对同一问题可能提出不同的假设(也可能得出不同的结论)提出假设提出假设(结论与建议结论与建议)yyyy-M-6.1.2 怎样做出决策?怎样做出决策?6.1 假设检验的基本原理假设检验的基本原理yyyy-M-6-19统计学统计学STATI
16、STICS(第四版第四版)两类错误与显著性水平两类错误与显著性水平1.1.研究者总是希望能做出正确的决策,但由于决策是建立研究者总是希望能做出正确的决策,但由于决策是建立在样本信息的基础之上,而样本又是随机的,因而就有在样本信息的基础之上,而样本又是随机的,因而就有可能犯错误可能犯错误2.2.原假设和备择假设不能同时成立,决策的结果要么拒绝原假设和备择假设不能同时成立,决策的结果要么拒绝H H0 0,要么不拒绝,要么不拒绝H H0 0。决策时总是希望当原假设正确时没。决策时总是希望当原假设正确时没有拒绝它,当原假设不正确时拒绝它,但实际上很难保有拒绝它,当原假设不正确时拒绝它,但实际上很难保证
17、不犯错误证不犯错误 3.3.第第类错误类错误(错误错误)n n原假设为正确时拒绝原假设原假设为正确时拒绝原假设n n第第类错误的概率记为类错误的概率记为,被称为显著性水平被称为显著性水平2.2.第第类错误类错误(错误错误)n n原假设为错误时未拒绝原假设原假设为错误时未拒绝原假设n n第第类错误的概率记为类错误的概率记为 (Beta)(Beta)yyyy-M-6-20统计学统计学STATISTICS(第四版第四版)两类错误的控制两类错误的控制1.1.一般来说,对于一个给定的样本,如果犯第一般来说,对于一个给定的样本,如果犯第 类错误类错误的代价比犯第的代价比犯第类错误的代价相对较高,则将犯第类
18、错误的代价相对较高,则将犯第类错误的概率定得低些较为合理;反之,如果犯第类错误的概率定得低些较为合理;反之,如果犯第 类错误的代价比犯第类错误的代价比犯第类错误的代价相对较低,则将类错误的代价相对较低,则将犯第犯第类错误的概率定得高些类错误的概率定得高些2.2.一般来说,发生哪一类错误的后果更为严重,就应该一般来说,发生哪一类错误的后果更为严重,就应该首要控制哪类错误发生的概率。但由于犯第首要控制哪类错误发生的概率。但由于犯第 类错误类错误的概率是可以由研究者控制的,因此在假设检验中,的概率是可以由研究者控制的,因此在假设检验中,人们往往先控制第人们往往先控制第 类错误的发生概率类错误的发生概
19、率yyyy-M-6-21统计学统计学STATISTICS(第四版第四版)显著性水平显著性水平 (significant level)1.事先确定的用于拒绝原假设事先确定的用于拒绝原假设H H0 0时所必须的证据时所必须的证据2.能够容忍的犯第能够容忍的犯第类错误的最大概率类错误的最大概率(上限值上限值)2.2.原假设为真时,拒绝原假设的概率原假设为真时,拒绝原假设的概率n n 抽样分布的拒绝域抽样分布的拒绝域3.3.表示为表示为 (alpha)(alpha)n n 常用的常用的 值有值有0.01,0.05,0.100.01,0.05,0.104.4.由研究者事先确定由研究者事先确定yyyy-M
20、-6-22统计学统计学STATISTICS(第四版第四版)依据什么做出决策?依据什么做出决策?1.若假设为H0:=500,H1:I 临界值,拒绝临界值,拒绝H H0 0n n左侧检验:左侧检验:统计量统计量 -临界值,拒绝临界值,拒绝H H0 0yyyy-M-6-28统计学统计学STATISTICS(第四版第四版)用用P 值决策值决策(P-value)1.如果原假设为真,所得到的样本结果会像实际观测结果那么极端或更极端的概率P P值值值值告告告告诉诉诉诉我我我我们们们们:如如果果原原假假设设是是正正确确的的话话,我我们们得得到到得得到到目目前前这这个个样样本本数数据据的的可可能能性性有有多多大
21、大,如果这个可能性很小,就应该拒绝原假设如果这个可能性很小,就应该拒绝原假设 2.被称为观察到的(或实测的)显著性水平3.决策规则:若p值,拒绝 H0yyyy-M-6-29统计学统计学STATISTICS(第四版第四版)双侧检验的双侧检验的P 值值 /2 2 /2 2 Z Z拒绝拒绝拒绝拒绝H H0 0拒绝拒绝拒绝拒绝H H0 00 0 0临界值临界值临界值计算出的样本统计量计算出的样本统计量计算出的样本统计量计算出的样本统计量计算出的样本统计量计算出的样本统计量计算出的样本统计量计算出的样本统计量计算出的样本统计量计算出的样本统计量计算出的样本统计量计算出的样本统计量临界值临界值临界值1/2
22、 1/2 1/2 P P P 值值值1/2 1/2 1/2 P P P 值值值yyyy-M-6-30统计学统计学STATISTICS(第四版第四版)左侧检验的左侧检验的P 值值 Z Z拒绝拒绝拒绝拒绝H H0 00 0 0临界值临界值临界值计算出的样本统计量计算出的样本统计量计算出的样本统计量计算出的样本统计量计算出的样本统计量计算出的样本统计量P P P 值值值yyyy-M-6-31统计学统计学STATISTICS(第四版第四版)右侧检验的右侧检验的P 值值 Z Z拒绝拒绝拒绝拒绝H H0 00 0 0计算出的样本统计量计算出的样本统计量计算出的样本统计量计算出的样本统计量计算出的样本统计量
23、计算出的样本统计量临界值临界值临界值P P P 值值值yyyy-M-6-32统计学统计学STATISTICS(第四版第四版)P值是关于数据的概率值是关于数据的概率1.1.P P值值原假设的对或错的概率无关原假设的对或错的概率无关2.2.它它反反映映的的是是在在某某个个总总体体的的许许多多样样本本中中某某一一类类数数据据出出现现的的经经常常程程度度,它它是是当当原原假假设设正正确确时时,得得到到目目前前这这个样本数据的概率个样本数据的概率n n比比如如,要要检检验验全全校校学学生生的的平平均均生生活活费费支支出出是是否否等等于于500500元元,检检验验的的假假设设为为H H0 0:=500=5
24、00;H H0 0:500 500。假假定定抽抽出出一一个个样样本本算算出出的的样样本本均均值值600600元元,得得到到的的值值为为P=0.02P=0.02,这这个个0.020.02是是指指如如果果平平均均生生活活费费支支出出真真的的是是500500元元的的话话,那那么么,从从该该总总体体中中抽抽出出一一个个均均值值为为600600的的样样本本的的概概率率仅仅为为0.020.02。如如果果你你认认为为这这个个概概率率太太小小了了,就就可可以以拒拒绝绝原原假假设设,因因为为如如果果原原假假设设正正确确的的话话,几几乎乎不不可可能能抓抓到到这这样样的的一一个个样样本本,既既然然抓抓到到了了,就表
25、明这样的样本不在少数,所以原假设是不对的就表明这样的样本不在少数,所以原假设是不对的3.3.值越小,你拒绝原假设的理由就越充分值越小,你拒绝原假设的理由就越充分yyyy-M-6-33统计学统计学STATISTICS(第四版第四版)要要证证明明原原假假设设不不正正确确,P P值值要要多多小小,才才能能令令人人信信服呢?服呢?n n原原原原假假假假设设设设的的的的可可可可信信信信度度度度又又又又多多多多高高高高?如如果果H H0 0所所代代表表的的假假设设是是人人们们多多年年来来一一直直相相信信的的,就就需需要要很很强强的的证证据据(小的小的P P值值)才能说服他们才能说服他们n n拒拒拒拒绝绝绝
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 假设检验 22 课件
限制150内