第 6 章 假设检验课件.ppt
《第 6 章 假设检验课件.ppt》由会员分享,可在线阅读,更多相关《第 6 章 假设检验课件.ppt(137页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、第第6 6章章 假设检验假设检验假设检验在统计方法中的地位假设检验在统计方法中的地位统计方法统计方法描述统计描述统计推断统计推断统计参数估计参数估计假设检验假设检验学习学习内容内容6.1 6.1 假设检验的基本问题假设检验的基本问题 6.2 6.2 一个总体参数的检验一个总体参数的检验6.3 6.3 两个总体参数的检验两个总体参数的检验学习目标学习目标假设检验的基本思想和原理假设检验的基本思想和原理 假设检验的步骤假设检验的步骤一个总体参数的检验一个总体参数的检验两个总体参数的检验两个总体参数的检验P P值的计算与应用值的计算与应用用用ExcelExcel进行检验进行检验6.1 6.1 假设检
2、验的基本问题假设检验的基本问题6.1.1 6.1.1 假设的陈述假设的陈述6.1.2 6.1.2 两类错误与显著性水平两类错误与显著性水平6.1.3 6.1.3 统计量与拒绝域统计量与拒绝域6.1.4 6.1.4 利用利用P P值进行决策值进行决策假设的陈述假设的陈述什么是假设什么是假设? ?(hypothesis)(hypothesis) 对总体参数的具体数值所作的陈述 总体参数包括总体总体均值均值、比例比例、方差方差等 分析之前之前必须陈述什么是假设检验什么是假设检验? ? (hypothesis test) (hypothesis test)先对总体的参数先对总体的参数( (或分布形式或
3、分布形式) )提出某种假提出某种假设,然后利用样本信息判断假设是否成立设,然后利用样本信息判断假设是否成立的过程的过程有参数检验和有参数检验和非非参数检验参数检验逻辑上运用反证法,统计上依据小概率原逻辑上运用反证法,统计上依据小概率原理理假设检验的基本思想假设检验的基本思想m m = 50假设检验的过程假设检验的过程我认为人口的平我认为人口的平均年龄是均年龄是5050岁岁 拒绝假设拒绝假设 别无选择别无选择! 原假设与备择假设原假设与备择假设原假设原假设(null hypothesis)(null hypothesis)研究者想收集证据予以反对的假设又称“0假设”总是有符号 , 或 4. 表示
4、为 H0H0 : m = 某一数值 指定为符号 =, 或 例如, H0 : m 10cm为什么叫为什么叫 0 0 假设?假设? 之所以用零来修饰原假设,其原因是原假设的之所以用零来修饰原假设,其原因是原假设的内容总是表示没有差异或没有改变,或变量间内容总是表示没有差异或没有改变,或变量间没有关系等等没有关系等等 零假设总是一个与总体参数有关的问题,所以零假设总是一个与总体参数有关的问题,所以总是用希腊字母表示。关于样本统计量如样本总是用希腊字母表示。关于样本统计量如样本均值或样本均值之差的零假设是没有意义的,均值或样本均值之差的零假设是没有意义的,因为样本统计量是已知的,当然能说出它们等因为样
5、本统计量是已知的,当然能说出它们等于几或是否相等于几或是否相等也称也称“研究假设研究假设”总是有符号总是有符号 , 或或 表示为表示为 H1研究研究者想收集证据予以支持的假设者想收集证据予以支持的假设H1 :m m 某一数值,或某一数值,或m m 某一数值某一数值例如例如, H1 :m m ”或或“”的假设检验,称为单侧检验或的假设检验,称为单侧检验或单尾检验单尾检验(one-tailed test)(one-tailed test) 备择假设的方向为备择假设的方向为“”,称为,称为右侧检右侧检验验 双侧检验与单侧检验双侧检验与单侧检验 ( (假设的形式假设的形式) )假设假设双侧检验双侧检验
6、单侧检验单侧检验左侧检验左侧检验右侧检验右侧检验原假设原假设H0 : : m m =m m0 0H0 : : m m m m0 0H0 : : m m m m0 0备择假设备择假设H1 : : m m m m0 0H1 : : m m m m0 0两类错误与显著性水平两类错误与显著性水平假设检验中的两类错误假设检验中的两类错误 1.第第类错误类错误( (弃真错误弃真错误) ) 原假设为正确时拒绝原假设 第类错误的概率记为 被称为显著性水平 2.第第类错误类错误( (取伪错误取伪错误) ) 原假设为错误时未拒绝原假设 第类错误的概率记为 (Beta)陪审团审判陪审团审判裁决裁决实际情况实际情况无
7、罪无罪有罪有罪无罪无罪正确正确错误错误有罪有罪错误错误正确正确H0 检验检验决策决策实际情况实际情况H0为真为真H0为假为假未拒绝未拒绝H0正确决策正确决策(1 )第第类错类错误误( )拒绝拒绝H0第第类错类错误误( )正确决策正确决策(1-1- ) 错误和错误和 错误的关系错误的关系你要同时减少两类你要同时减少两类错误的惟一办法是错误的惟一办法是增加样本容量增加样本容量!两类错误的控制两类错误的控制一般来说,对于一个给定的样本,如果犯第一般来说,对于一个给定的样本,如果犯第类错误的代价比犯第类错误的代价比犯第类错误的代价相对较类错误的代价相对较高,则将犯第高,则将犯第类错误的概率定得低些较为
8、类错误的概率定得低些较为合理;反之,如果犯第合理;反之,如果犯第类错误的代价比犯第类错误的代价比犯第类错误的代价相对较低,则将犯第类错误的代价相对较低,则将犯第类错类错误的概率定得高些误的概率定得高些一般来说,发生哪一类错误的后果更为严重,一般来说,发生哪一类错误的后果更为严重,就应该首要控制哪类错误发生的概率。但由就应该首要控制哪类错误发生的概率。但由于犯第于犯第类错误的概率是可以由研究者控制的,类错误的概率是可以由研究者控制的,因此在假设检验中,人们往往先控制第因此在假设检验中,人们往往先控制第类错类错误的发生概率误的发生概率影响影响 错误的因素错误的因素 1.1. 总体参数的真值总体参数
9、的真值 随着假设的总体参数的减少而增大 2.2. 显著性水平显著性水平 当 减少时增大 3.3. 总体标准差总体标准差 当 增大时增大 4.4. 样本容量样本容量 n n当 n 减少时增大检验能力检验能力(power of test)(power of test)拒绝一个错误的原假设的能力根据 的定义, 是指没有拒绝一个错误的原假设的概率。这也就是说,1- 则是指拒绝一个错误的原假设的概率,这个概率被称为检验能力,也被称为检验的势或检验的功效(power)可解释为正确地拒绝一个错误的原假设的概率显著性水平显著性水平 (significant level)(significant level)
10、1.是一个概率值是一个概率值 2.原假设为真时,拒绝原假设的概率原假设为真时,拒绝原假设的概率 抽样分布的拒绝域抽样分布的拒绝域 3.表示为表示为 (alpha) 常用的常用的 值有值有0.01, 0.05, 0.10 4.由研究者事先确定由研究者事先确定我们可以在事先确定用于拒绝原假设我们可以在事先确定用于拒绝原假设H H0 0的证的证据必须强到何种程度。这等于说我们要求多据必须强到何种程度。这等于说我们要求多小的小的P P值。而这个值。而这个P P值就叫显著性水平,用值就叫显著性水平,用 表示表示显著性水平表示总体中某一类数据出现的经常程度假如我们选择=0.05,样本数据能拒绝原假设的证据
11、要强到:当H0正确时,这种样本结果发生的频率不超过5%;如果我们选择=0.01,就是要求拒绝H0的证据要更强,这种样本结果发生的频率只有1%如果如果P P值小于或等于值小于或等于 ,我们称该组数据不,我们称该组数据不利于原假设的证据有利于原假设的证据有 的显著性水平的显著性水平显著性水平显著性水平 (significant level)(significant level)significant(显著的)一词的意义在这里并不是“重要的重要的”,而是指“非偶然的非偶然的”在假设检验中,如果样本提供的证据拒绝原假设,我们说检验的结果是显著的,如果不拒绝原假设,我们则说结果是不显著的一项检验在统计上
12、是“显著的显著的”,意思是指:这样的(样本)结果不是偶然得到的,或者说,不是靠机遇能够得到的拒绝原假设,表示这样的样本结果并不是偶然得到的;不拒绝原假设(拒绝原假设的证据不充分) ,则表示这样的样本结果只是偶然得到的统计显著性统计显著性 (significant)(significant)假设检验中的小概率原理假设检验中的小概率原理 什么小概率?什么小概率? 1. 在一次试验中,一个几乎不可能发生的事件发生的概率 2. 在一次试验中小概率事件一旦发生,我们就有理由拒绝原假设 3. 小概率由研究者事先确定统计量与拒绝域统计量与拒绝域根据样本观测结果计算得到的,并据以对原根据样本观测结果计算得到的
13、,并据以对原假设和备择假设作出决策的某个样本统计量假设和备择假设作出决策的某个样本统计量对样本估计量的标准化结果对样本估计量的标准化结果原假设H0为真点估计量的抽样分布 点估计量假设值标准化检验统计量点估计量的抽样标准差显著性水平和拒绝域显著性水平和拒绝域( (双侧检验双侧检验 ) ) /2 显著性水平和拒绝域显著性水平和拒绝域( (双侧检验双侧检验 ) ) 显著性水平和拒绝域显著性水平和拒绝域( (双侧检验双侧检验 ) ) 显著性水平和拒绝域显著性水平和拒绝域( (双侧检验双侧检验 ) ) 显著性水平和拒绝域显著性水平和拒绝域( (单侧检验单侧检验 ) )显著性水平和拒绝域显著性水平和拒绝域
14、( (左侧检验左侧检验 ) )显著性水平和拒绝域显著性水平和拒绝域( (左侧检验左侧检验 ) )显著性水平和拒绝域显著性水平和拒绝域( (右侧检验右侧检验 ) )显著性水平和拒绝域显著性水平和拒绝域( (右侧检验右侧检验 ) )决策规则决策规则给定显著性水平给定显著性水平 ,查表得出相应的临界值查表得出相应的临界值z 或或z /2 /2, t 或或t /2 /2将检验统计量的值与将检验统计量的值与 水平的临界值进行比较水平的临界值进行比较作出决策作出决策双侧检验:|统计量| 临界值,拒绝H0左侧检验:统计量 临界值,拒绝H0什么是什么是P P 值值? ? ( (P P-value)-value
15、)如果原假设为真,所得到的样本结果会像实际观测结果那么极端或更极端的概率P值告诉我们:值告诉我们:如果原假设是正确的话,我们得到得到目前这个样本数据的可能性有多大,如果这个可能性很小,就应该拒绝原假设 被称为观察到的(或实测的)显著性水平决策规则:若p值, 拒绝 H0双侧检验的双侧检验的P P 值值左侧检验的左侧检验的P P 值值右侧检验的右侧检验的P P 值值原假设的可信度有多高?原假设的可信度有多高?如果H0所代表的假设是人们多年来一直相信的,就需要很强的证据(小的P值)才能说服他们拒绝的结论是什么?拒绝的结论是什么?如果拒绝H0而肯定H1 ,就需要有很强的证据显示要支持H1。比如,H1代
16、表要花很多钱把产品包装改换成另一种包装,你就要有很强的证据显示新包装一定会增加销售量(因为拒绝H0要花很高的成本)有了P值,我们并不需要用5%或1%这类传统的显著性水平。P值提供了更多的信息,它让我们可以选择任意水平来评估结果是否具有统计上的显著性,从而可根据我们的需要来决定是否要拒绝原假设只要你认为这么大的P值就算是显著了,你就可以在这样的P值水平上拒绝原假设传统的显著性水平,如1%、5%、10%等等,已经被人们普遍接受为“拒绝原假设足够证据”的标准,我们大概可以说:10%代表有“一些证据一些证据”不利于原假设;5%代表有“适度证据适度证据”不利于原假设;1%代表有“很强证据很强证据”不利于
17、原假设用用P P值进行检验比根据统计量检验提供更多值进行检验比根据统计量检验提供更多的信息的信息统计量检验是我们事先给出的一个显著性水统计量检验是我们事先给出的一个显著性水平,以此为标准进行决策,无法知道实际的平,以此为标准进行决策,无法知道实际的显著性水平究竟是多少显著性水平究竟是多少比如,根据统计量进行检验时,只要统计量的值落在拒绝域,我们拒绝原假设得出的结论都是一样的,即结果显著。但实际上,统计量落在拒绝域不同的地方,实际的显著性是不同的。比如,统计量落在临界值附近与落在远离临界值的地方,实际的显著性就有较大差异。而P值给出的是实际算出的显著水平,它告诉我们实际的显著性水平是多少P P
18、值决策与统计量的比较值决策与统计量的比较与其人为地把显著性水平与其人为地把显著性水平 固定按固定按某一水平上,不如干脆选取检验统某一水平上,不如干脆选取检验统计量的计量的P P值值与其大致知道犯第与其大致知道犯第错误的概率,错误的概率,不如干脆知道一个确切的犯第不如干脆知道一个确切的犯第类类错误的概率错误的概率(P(P值值) )与其为选取与其为选取“适当的适当的”的的 而而苦恼,苦恼,不如干脆把真正的不如干脆把真正的 (P(P值值) )算出来算出来样本容量对检验结果的影响样本容量对检验结果的影响这个结果出这个结果出乎预料吗?乎预料吗?假设检验结论的表述假设检验结论的表述(“(“显著显著”与与“
19、不显著不显著”) )当拒绝原假设时,我们称样本结果是统计上显著的统计上显著的拒绝原假设时结论是清楚的当不拒绝原假设时,我们称样本结果是统计上不显著的统计上不显著的不拒绝原假设时,并未给出明确的结论,不能说原假设是正确的,也不能说它不是正确的假设检验结论的表述假设检验结论的表述(“(“接受接受”与与“不拒绝不拒绝”) )假设检验的目的在于试图找到证据拒绝原假设,而不在于证明什么是正确的当没有足够证据拒绝原假设时,不采用“接受原假接受原假设设”的表述,而采用“不拒绝原假设不拒绝原假设”的表述。“不拒绝”的表述实际上意味着并未给出明确的结论,我们没有说原假设正确,也没有说它不正确“接受”的说法有时会
20、产生误导,因为这种说法似乎暗示着原假设已经被证明是正确的了。但事实上,H0的真实值我们永远也无法知道,H0只是对总体真实值的一个假定值,由样本提供的信息也就自然无法证明它是否正确假设检验结论的表述假设检验结论的表述 ( (为什么不说为什么不说“接受接受”) ) 【例】【例】比如原假设为比如原假设为H0: m m =10,从该总体中抽出,从该总体中抽出一个随机样本,得到一个随机样本,得到 x=9.8,在,在 =0.05的水平上,的水平上,样本提供的证据没有推翻这一假设,我们说样本提供的证据没有推翻这一假设,我们说“接接受受”原假设,这意味着样本提供的证据已经证明原假设,这意味着样本提供的证据已经
21、证明m m=10是正确的。如果我们将原假设改为是正确的。如果我们将原假设改为H0: m m =10.5,同样,在,同样,在 =0.05的水平上,样本提供的的水平上,样本提供的证据也没有推翻这一假设,我们又说证据也没有推翻这一假设,我们又说“接受接受”原原假设。但这两个原假设究竟哪一个是假设。但这两个原假设究竟哪一个是“真实的真实的”呢?我们不知道呢?我们不知道假设检验结论的表述假设检验结论的表述 ( (为什么不说为什么不说“接受接受”) )表述为表述为“接受接受”一个原假设,应该注意到一个原假设,应该注意到另一个原假设也可能同样地与数据相符。另一个原假设也可能同样地与数据相符。因此,我们宁愿说
22、因此,我们宁愿说“不拒绝不拒绝”当然,在实际检验中,针对一个具体问题,当然,在实际检验中,针对一个具体问题,将检验结果表述为将检验结果表述为“不拒绝不拒绝”原假设,这原假设,这似乎让人感到无所适从似乎让人感到无所适从比如,你想购买一批产品,检验的结果没有拒绝原假设,即达到合同规定的标准要求,你是否购买这批产品呢?这时,你可以对检验的结果采取某种默认态度,退一步说,你可以将检验结果表述为“可以接可以接受受”原假设,但这并不等于说你“确实接确实接受受”它假设检验步骤的总结假设检验步骤的总结陈述原假设和备择假设陈述原假设和备择假设从所研究的总体中抽出一个随机样本从所研究的总体中抽出一个随机样本确定一
23、个适当的检验统计量,并利用样本数确定一个适当的检验统计量,并利用样本数据算出其具体数值据算出其具体数值确定一个适当的显著性水平,并计算出其临确定一个适当的显著性水平,并计算出其临界值,指定拒绝域界值,指定拒绝域将统计量的值与临界值进行比较,作出决策将统计量的值与临界值进行比较,作出决策统计量的值落在拒绝域,拒绝H0,否则不拒绝H0也可以直接利用P值值作出决策6.2 6.2 一个总体参数的检验一个总体参数的检验6.2.1 6.2.1 总体均值的检验总体均值的检验6.2.2 6.2.2 总体比例的检验总体比例的检验6.2.3 6.2.3 总体方差的检验总体方差的检验一个总体参数的检验一个总体参数的
24、检验z 检验检验(单尾和双尾单尾和双尾) t 检验检验(单尾和双尾单尾和双尾)z 检验检验(单尾和双尾单尾和双尾) 2 2 检验检验(单尾和双尾单尾和双尾)均值均值总体参数总体参数比例比例方差方差总体总体均值的检验均值的检验总体均值的检验总体均值的检验( (作出判断作出判断) ) 是否已是否已知知样本容量样本容量n 是否已是否已知知 t 检验检验nsxt0mz 检验检验nsxz0mz 检验检验 nxzm0z 检验检验nxzm0总体均值的检验总体均值的检验( (大样本大样本) )总体均值的检验总体均值的检验 ( (大样本大样本) )1.1.假定条件假定条件正态总体或非正态总体大样本(n30)2.
25、 2. 使用使用z z检验统计量检验统计量 2 已知: 2 未知:) 1 , 0(0Nnxzm) 1 , 0(0Nnsxzm总体均值的检验总体均值的检验( ( 2 已知已知) )( (例题分析例题分析) )【例】一种罐装饮料采用自动生产【例】一种罐装饮料采用自动生产线生产,每罐的容量是线生产,每罐的容量是255ml255ml,标准差为标准差为5ml5ml。为检验每罐容量是。为检验每罐容量是否符合要求,质检人员在某天生否符合要求,质检人员在某天生产的饮料中随机抽取了产的饮料中随机抽取了4040罐进行罐进行检 验 , 测 得 每 罐 平 均 容 量 为检 验 , 测 得 每 罐 平 均 容 量 为
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 假设检验课件 假设检验 课件
限制150内