2022年概率论与数理统计第八章假设检验 .pdf
《2022年概率论与数理统计第八章假设检验 .pdf》由会员分享,可在线阅读,更多相关《2022年概率论与数理统计第八章假设检验 .pdf(22页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、第八章假设检验第一节概述统计推断中的另一类重要问题是假设检验(Hypothesis testing).当总体的分布函数未知,或只知其形式而不知道它的参数的情况时,我们常需要判断总体是否具有我们所感兴趣的某些特性 .这样,我们就提出某些关于总体分布或关于总体参数的假设,然后根据样本对所提出的假设作出判断:是接受还是拒绝.这就是本章所要讨论的假设检验问题.我们先从下面的例子来说明假设检验的一般提法. 例 8. 1某工厂用包装机包装奶粉,额定标准为每袋净重0.5kg.设包装机称得奶粉重量X 服从正态分布N(,2).根据长期的经验知其标准差=0.015(kg). 为检验某台包装机的工作是否正常;随机抽
2、取包装的奶粉9 袋,称得净重(单位:kg)为0.499 0.515 0.508 0.512 0.498 0.515 0.516 0.513 0.524 问该包装机的工作是否正常?由于长期实践表明标准差比较稳定,于是我们假设XN(,0.0152).如果奶粉重量X的均值 等于 0.5kg,我们说包装机的工作是正常的.于是提出假设:H0:=0=0.5;H1:0=0.5.这样的假设叫统计假设. 1. 统计假设关于总体 X 的分布(或随机事件之概率)的各种论断叫统计假设,简称假设,用“H”表示,例如:(1) 对于检验某个总体X 的分布,可以提出假设:H0:X 服从正态分布,H1: X 不服从正态分布.
3、H0:X 服从泊松分布,H1: X 不服从泊松分布. (2) 对于总体 X 的分布的参数,若检验均值,可以提出假设:H0: =0;H1:0. H0: 0;H1:0. 若检验标准差,可提出假设:H0:=0;H1: 0. H0: 0;H1:0. 这里 0,0是已知数,而 =E( X) ,2=D(X)是未知参数 . 上面对于总体X 的每个论断,我们都提出了两个互相对立的(统计)假设:H0和 H1,显然,H0与 H1只有一个成立, 或 H0真 H1假, 或 H0假 H1真, 其中假设 H0, 称为原假设 (Original hypothesis)(又叫零假设、基本假设),而 H1称为 H0的对立假设(
4、又叫备择假设). 在处理实际问题时,通常把希望得到的陈述视为备择假设,而把这一陈述的否定作为原假设 .例如在上例中,H0:=0=0.5 为原假设,它的对立假设是H1:0=0.5.统计假设提出之后,我们关心的是它的真伪.所谓对假设H0的检验,就是根据来自总体的样本,按照一定的规则对H0作出判断:是接受,还是拒绝,这个用来对假设作出判断的规则叫做检验准则,简称检验, 如何对统计假设进行检验呢?我们结合上例来说明假设检验名师资料总结 - - -精品资料欢迎下载 - - - - - - - - - - - - - - - - - - 名师精心整理 - - - - - - - 第 1 页,共 22 页
5、- - - - - - - - - 的基本思想和做法. 2. 假设检验的基本思想在例 8. 1 中所提假设是H0:=0=0.5(备择假设 H1:0).由于要检验的假设涉及总体均值, 故首先想到是否可借助样本均值这一统计量来进行判断 .从抽样的结果来看,样本均值x=19(0.499+0.515+0.508+0.512+0.498+0.515+0.516+0.513+0.524 )=0.5110,与=0.5 之间有差异 .对于与 0之间的差异可以有两种不同的解释. ( 1) 统计假设 H0是正确的,即 =0=0.5,只是由于抽样的随机性造成了与0之间的差异;( 2) 统计假设 H0是不正确的,即0
6、=0.5,由于系统误差,也就是包装机工作不正常,造成了与 0之间的差异 . 对于这两种解释到底哪一种比较合理呢?为了回答这个问题,我们适当选择一个小正数(=0.1,0.05 等) ,叫做显著性水平(Level of significance). 在假设 H0 成立的条件下,确定统计量X-0的临界值,使得事件 X-0 为小概率事件,即PX-0= . (8. 1)例如,取定显著性水平=0.05.现在来确定临界值0.05.因为 XN(,2) ,当 H0:=0=0.5 为真时,有XN(0,2) ,于是2011,niiXXNnn,Z=002/XXnnN(0,1) ,所以PZ z/2= .由( 8. 1)
7、式,有/PZn=,因此22,/zznn0.05=z0.0250.0159=1.96 0.015/3=0.0098 .故有P X-0 0.0098=0.05 .因为 =0.05 很小,根据实际推断原理,即“小概率事件在一次试验中几乎是不可能发生的”原理,我们认为当H0为真时,事件 X-0 0.0098 是小概率事件,实际上是名师资料总结 - - -精品资料欢迎下载 - - - - - - - - - - - - - - - - - - 名师精心整理 - - - - - - - 第 2 页,共 22 页 - - - - - - - - - 不可能发生的 .现在抽样的结果是x-0=0.5110-0.
8、5=0.01100.0098.也就是说,小概率事件X-0 0.0098 居然在一次抽样中发生了,这说明抽样得到的结果与假设H0不相符,因而不能不使人怀疑假设H0的正确性,所以在显著性水平=0.05下,我们拒绝H0,接受 H1,即认为这一天包装机的工作是不正常的. 通过上例的分析,我们知道假设检验的基本思想是小概率事件原理,检验的基本步骤是:(1) 根据实际问题的要求,提出原假设H0及备择假设H1;(2) 选取适当的显著性水平(通常 =0.10,0.05 等)以及样本容量n;(3) 构造检验用的统计量U,当 H0为真时, U 的分布要已知,找出临界值使 P U= .我们称 U所确定的区域为H0的
9、拒绝域 (Rejection region) ,记作 W;(4) 取样,根据样本观察值,计算统计量U 的观察值U0;(5) 作出判断,将U 的观察值U0与临界值比较,若U0落入拒绝域W 内,则拒绝H0接受 H1;否则就说H0相容(接受H0). 3. 两类错误由于我们是根据样本作出接受H0或拒绝 H0的决定, 而样本具有随机性,因此在进行判断时,我们可能会犯两个方面的错误:一类错误是,当H0为真时,而样本的观察值U0落入拒绝域 W 中,按给定的法则,我们拒绝了H0,这种错误称为第一类错误.其发生的概率称为犯第一类错误的概率或称弃真概率,通常记为,即P拒绝 H0H0为真= ;另一种错误是,当H0不
10、真时,而样本的观察值落入拒绝域W 之外,按给定的检验法则,我们却接受了H0. 这种错误称为第二类错误,其发生的概率称为犯第二类错误的概率或取伪概率,通常记为 ,即P接受 H0H0不真= .显然这里的 就是检验的显著性水平.总体与样本各种情况的搭配见表8-1. 表 8-1 H0判断结论犯错误的概率真接受正确0 拒绝犯第一类错误假接受犯第二类错误拒绝正确0 对给定的一对H0和 H1,总可以找到许多拒绝域W.当然我们希望寻找这样的拒绝域W,使得犯两类错误的概率与都很小 .但是在样本容量n 固定时,要使 与都很小是不可能的, 一般情形下, 减小犯其中一类错误的概率,会增加犯另一类错误的概率,它们之间的
11、关系犹如区间估计问题中置信水平与置信区间的长度的关系那样.通常的做法是控制犯第一类错误的概率不超过某个事先指定的显著性水平(01) ,而使犯第二类错误的概率也尽可能地小.具体实行这个原则会有许多困难,因而有时把这个原则简化成只要求犯第一类错误的概率等于,称这类假设检验问题为显著性检验问题,相应的检验为显著性检验.在一般情况下,显著性检验法则是较容易找到的,我们将在以下各节中详细讨论. 在实际问题中,要确定一个检验问题的原假设,一方面要根据问题要求检验的是什么,另一方面要使原假设尽量简单,这是因为在下面将讲到的检验法中,必须要了解某统计量在名师资料总结 - - -精品资料欢迎下载 - - - -
12、 - - - - - - - - - - - - - - 名师精心整理 - - - - - - - 第 3 页,共 22 页 - - - - - - - - - 原假设成立时的精确分布或渐近分布. 下面各节中, 我们先介绍正态总体下参数的几种显著性检验,再介绍总体分布函数的假设检验 . 第二节单个正态总体的假设检验1. 单个正态总体数学期望的假设检验(1) 2已知关于 的假设检验( Z 检验法 (Z-test))设总体 XN(,2) ,方差 2已知,检验假设H0:=0;H1:0 (0为已知常数)由XN(,n) ,/XnN(0,1) ,我们选取Z=/Xn(8.2)作为此假设检验的统计量,显然当假
13、设H0为真(即 =0正确)时, ZN(0,1) ,所以对于给定的显著性水平,可求 z/2使PZ z/2= ,见图 8-1,即P Z-z/2+ PZz/2= .从而有PZz/2= /2,PZz/2=1- /2. 图 8-1 利用概率 1-/2,反查标准正态分布函数表,得双侧分位点(即临界值)z/2. 另一方面,利用样本观察值x1,x2, xn计算统计量Z 的观察值z0=0/xSn. (8. 3)如果: ( a) z0 z/2,则在显著性水平下,拒绝原假设H0(接受备择假设H1) ,所以 z0 z/2便是 H0 的拒绝域 . (b) z0z/2,则在显著性水平下,接受原假设H0,认为 H0正确 .
14、 这里我们是利用H0 为真时服从N(0,1)分布的统计量Z 来确定拒绝域的,这种检验法称为 Z 检验法 (或称 U 检验法) .例 8. 1 中所用的方法就是Z 检验法 .为了熟悉这类假设检验的具体作法,现在我们再举一例. 例 8. 2根据长期经验和资料的分析,某砖厂生产的砖的 “抗断强度” X 服从正态分布,方差 2=1.21.从该厂产品中随机抽取6 块,测得抗断强度如下(单位:kgcm-2) :32.56 29.66 31.64 30.00 31.87 31.03 检验这批砖的平均抗断强度为32.50kgcm-2是否成立(取 =0.05,并假设砖的抗断强度的名师资料总结 - - -精品资料
15、欢迎下载 - - - - - - - - - - - - - - - - - - 名师精心整理 - - - - - - - 第 4 页,共 22 页 - - - - - - - - - 方差不会有什么变化)?解 提出假设 H0:=0=32.50;H1:0. 选取统计量Z=0/Xn,若 H0为真,则ZN(0,1). 对给定的显著性水平=0.05,求 z/2使PZ z/2= ,这里 z/2=z0.025=1.96. 计算统计量Z 的观察值:z0=0/xn=31.13 32.501.1 63.05. 判断:由于 z0=3.05z0.025=1.96,所以在显著性水平=0. 05 下否定 H0,即不能
16、认为这批产品的平均抗断强度是32.50 kgcm-2. 把上面的检验过程加以概括,得到了关于方差已知的正态总体期望值的检验步骤:( a) 提出待检验的假设H0:=0;H1:0. ( b) 构造统计量Z,并计算其观察值z0:Z=0/Xn,z0=0/xn.( c) 对给定的显著性水平,根据PZ z/2= ,PZz/2= /2,P Zz/2=1- /2 查标准正态分布表,得双侧分位点 z/2.(d) 作出判断:根据H0的拒绝域若 z0 z/2,则拒绝 H0,接受 H1;若 z0 z/2,则接受 H0. (2) 方差 2未知,检验 (t 检验法 (t-test))设总体 XN(,2) ,方差 2未知,
17、检验H0:=0;H1:0.由于 2未知,0/Xn便不是统计量,这时我们自然想到用2的无偏估计量样本方差 S2代替2,由于/Xnt(n-1) ,故选取样本的函数t=0/XSn(8.4)图 8-2 作为统计量,当H0为真( =0)时 tt(n-1) ,对给定的检验显著性水平,由名师资料总结 - - -精品资料欢迎下载 - - - - - - - - - - - - - - - - - - 名师精心整理 - - - - - - - 第 5 页,共 22 页 - - - - - - - - - Pt t/2(n-1)= ,P tt/2(n-1)= /2,见图 8-2,直接查 t 分布表,得t 分布分位
18、点t/2(n-1). 利用样本观察值,计算统计量t 的观察值t0=0/xsn,因而原假设H0 的拒绝域为t0=0/xsnt/2(n-1). (8. 5)所以,若 t0t/2(n-1) ,则拒绝 H0,接受 H1;若 t0 t/2(n-1) ,则接受原假设H0. 上述利用 t 统计量得出的检验法称为t 检验法 . 在实际中, 正态总体的方差常为未知,所以我们常用t 检验法来检验关于正态总体均值的问题. 例 8. 3用某仪器间接测量温度,重复5 次,所得的数据是1250,1265, 1245,1260, 1275,而用别的精确办法测得温度为1277(可看作温度的真值) ,试问此仪器间接测量有无系统
19、偏差?这里假设测量值X 服从 N(,2)分布 . 解问题是要检验H0:=0=1277;H1:0.由于 2未知(即仪器的精度不知道),我们选取统计量t=0/XSn.当 H0为真时, tt(n-1) ,t 的观察值为t0=012591277185.399/(570) /(45)xsn3.对于给定的检验水平=0.05,由Pt t/2(n-1)= ,P tt/2(n-1)= /2,P tt0.025(4)=0.025 ,查 t 分布表得双侧 分位点t/2(n-1)=t0.025(4)=2.776 .因为 t0 3t0.025(4)=2.776,故应拒绝H0,认为该仪器间接测量有系统偏差. (3) 双边
20、检验与单边检验上面讨论的假设检验中,H0为=0,而备择假设H1:0意思是 可能大于 0,也可能小于 0,称为双边备择假设,而称形如H0:=0,H1:0的假设检验为双边检验 .有时我们只关心总体均值是否增大,例如,试验新工艺以提高材料的强度,这时所考虑的总体的均值应该越大越好,如果我们能判断在新工艺下总体均值较以往正常生产的大,则可考虑采用新工艺.此时,我们需要检验假设H0: =0;H1:0. (8. 6)(我们在这里作了不言而喻的假定,即新工艺不可能比旧的更差),形如(8. 6)的假设检验,名师资料总结 - - -精品资料欢迎下载 - - - - - - - - - - - - - - - -
21、 - - 名师精心整理 - - - - - - - 第 6 页,共 22 页 - - - - - - - - - 称为右边检验,类似地,有时我们需要检验假设H0:=0;H1:0. (8. 7)形如( 8. 7)的假设检验,称为左边检验,右边检验与左边检验统称为单边检验. 下面来讨论单边检验的拒绝域. 设总体 XN(,2) ,2为已知, x1,x2, xn是来自X 的样本观察值.给定显著性水平 ,我们先求检验问题H0:=0;H1: 0. 的拒绝域 . 取检验统计量Z=0/Xn,当 H0为真时, Z 不应太大,而在H1为真时,由于X 是的无偏估计,当 偏大时, X 也偏大,从而Z 往往偏大,因此拒
22、绝域的形式为Z=0/Xnk,k 待定 .因为当 H0为真时,0/XnN(0,1) ,由P拒绝 H0H0为真 = P0/Xkn=得 k=z,故拒绝域为Z=0/Xnz. (8. 8)类似地,左边检验问题H0:=0;H1: 0. 的拒绝域为Z=0/Xn-z. 8. 9)例 8. 4从甲地发送一个信号到乙地,设发送的信号值为,由于信号传送时有噪声迭加到信号上,这个噪声是随机的,它服从正态分布N(0,22) ,从而乙地接到的信号值是一个服从正态分布N(,22)的随机变量 .设甲地发送某信号5 次,乙地收到的信号值为:8.4 10.5 9.1 9.6 9.9 由以往经验,信号值为8,于是乙方猜测甲地发送的
23、信号值为8,能否接受这种猜测?取=0.05. 解按题意需检验假设H0:=8;H1:8.这是右边检验问题,其拒绝域如(8. 8)式所示,即Z= 0/Xnz0.05=1.645.而现在名师资料总结 - - -精品资料欢迎下载 - - - - - - - - - - - - - - - - - - 名师精心整理 - - - - - - - 第 7 页,共 22 页 - - - - - - - - - z0=9.582/5=1.681.645,所以拒绝 H0,认为发出的信号值8. 2. 单个正态总体方差的假设检验(2检验法 (2- test))(1) 双边检验设总体 XN(,2) ,未知,检验假设H0
24、:2=02;H1: 202. 其中 02为已知常数 . 由于样本方差S2是2的无偏估计, 当 H0为真时, 比值220S一般来说应在1 附近摆动,而不应过分大于1 或过分小于1,由第六章知当H0为真时2=220(1)nS2(n-1). (8. 10)所以对于给定的显著性水平有(图 8-3)图 8-3 P21/ 2(n-1)22/ 2(n-1)=1- . (8. 11)对于给定的 ,查2分布表可求得2分布分位点21/ 2(n-1)与2/ 2(n-1). 由( 8. 11)知, H0的接受域是21/ 2(n-1)22/ 2(n-1);(8. 12) H0的拒绝域为221/ 2(n-1)或22/2(
25、n-1). (8. 13)这种用服从2分布的统计量对个单正态总体方差进行假设检验的方法,称为2检验法 . 例 8. 5某厂生产的某种型号的电池,其寿命长期以来服从方差2=5000(小时2)的正态分布, 现有一批这种电池,从它的生产情况来看,寿命的波动性有所改变,现随机抽取26 只电池,测得其寿命的样本方差s2=9200(小时2).问根据这一数据能否推断这批电池的寿命的波动性较以往有显著的变化(取=0.02)? 解本题要求在 =0.02 下检验假设H0:2=5000;H1:25000.现在 n=26,2/2(n-1)=20.01(25)=44.314,21/ 2(n-1)=20.99(25)=1
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 2022年概率论与数理统计第八章假设检验 2022 概率论 数理统计 第八 假设检验
限制150内