《数理统计假设检验.ppt》由会员分享,可在线阅读,更多相关《数理统计假设检验.ppt(54页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、数理统计假设检验 Still waters run deep.流静水深流静水深,人静心深人静心深 Where there is life,there is hope。有生命必有希望。有生命必有希望例例怎么知道这批罐装可乐的容量是否合格呢?怎么知道这批罐装可乐的容量是否合格呢?罐装可乐的容量按标准应是罐装可乐的容量按标准应是355355毫升毫升.通常的办法是进行抽样检查通常的办法是进行抽样检查.每隔一定时间,抽查若干罐每隔一定时间,抽查若干罐.如每隔如每隔1 1小时,抽查小时,抽查5 5罐,罐,得得5 5个容量的值个容量的值X X1 1,X X5 5,根据这些值来判断生产是,根据这些值来判断生产
2、是否正常否正常.很明显,不能由很明显,不能由5 5罐容量的数据,在把握不大的情罐容量的数据,在把握不大的情况下就判断生产况下就判断生产 不正常,不正常,也不能总认为正常,也不能总认为正常,有了问题不能及时发现,这也要造成损失有了问题不能及时发现,这也要造成损失.如何处理这两者的关系,假设检验面对的就如何处理这两者的关系,假设检验面对的就是这种矛盾是这种矛盾.在正常生产条件下,由于种种随机因素在正常生产条件下,由于种种随机因素的影响,每罐可乐的容量应在的影响,每罐可乐的容量应在355355毫升上下波毫升上下波动动.这些因素中没有哪一个占有特殊重要的这些因素中没有哪一个占有特殊重要的地位地位.因此
3、,根据中心极限定理,假定每罐因此,根据中心极限定理,假定每罐容量服从正态分布是合理的容量服从正态分布是合理的.现在我们就来讨论这个问题现在我们就来讨论这个问题.称称H H0 0为原假设为原假设(或零假设);(或零假设);H H1 1为备选假设为备选假设(或对立假设)(或对立假设).在实际工作中,在实际工作中,往往把不轻易往往把不轻易否定的命题作否定的命题作为原假设为原假设.H H0 0:(=355 =355)H H1 1:X1,X5是取自正态总体是取自正态总体的样本,的样本,是一个常数是一个常数.当生产比较稳定时,当生产比较稳定时,检验假设:检验假设:可从历史资料获得可从历史资料获得 的值的值
4、.那么,如何判断原假设那么,如何判断原假设H H0 0 是否成立呢?是否成立呢?较小时,可以认为较小时,可以认为H0是成立的;是成立的;当当-|生产已不正常生产已不正常.当当较大时,应认为较大时,应认为H0不成立,即不成立,即-|问题归结为对差异作定量的分析,以确定其性质问题归结为对差异作定量的分析,以确定其性质.差异可能是由抽样的随机性引起的,称为差异可能是由抽样的随机性引起的,称为“抽样误差抽样误差”或或 随机误差随机误差这种误差反映偶然、非本质的因素所引起的随机波动这种误差反映偶然、非本质的因素所引起的随机波动.然而,这种随机性的波动是有一定限度的,然而,这种随机性的波动是有一定限度的,
5、如果差异超过了这个限度,则我们就不能用抽样的如果差异超过了这个限度,则我们就不能用抽样的随机性来解释了随机性来解释了.必须认为这个差异反映了事物的本质差别,即必须认为这个差异反映了事物的本质差别,即反映了生产已不正常反映了生产已不正常.这种差异称作这种差异称作“系统误差系统误差”是是“抽样误差抽样误差”还是还是“系统误差系统误差”所引起的?所引起的?根据所观察到的差异,根据所观察到的差异,这里用到人们在实践中普遍采用的一个原则:这里用到人们在实践中普遍采用的一个原则:小概率事件在一次试验中基本上小概率事件在一次试验中基本上不会发生不会发生.实际推断原理(小概率原理)实际推断原理(小概率原理)通
6、过大量实践,通过大量实践,人们对小概率事件(即在一次试验中发人们对小概率事件(即在一次试验中发生的概率很小的事件)总结出一条原理:生的概率很小的事件)总结出一条原理:小概率事件在一次试验中几乎不会发生小概率事件在一次试验中几乎不会发生并称此为实际推断原理,并称此为实际推断原理,其为判断假设的根据。其为判断假设的根据。在假设检验时,在假设检验时,若一次试验中小概率事件发生了,就若一次试验中小概率事件发生了,就认为是不合理的。认为是不合理的。小概率事件在一次试验中发生的概率小概率事件在一次试验中发生的概率记为记为,一般取,一般取在假设检验中,称小概率在假设检验中,称小概率为显著水平、检验水平。为显
7、著水平、检验水平。一、假设检验的思想方法一、假设检验的思想方法信息看在信息看在H0成立下会不会发生矛盾。成立下会不会发生矛盾。最后对最后对H0成立成立与否作出判断:与否作出判断:中居然发生,中居然发生,若小概率事件发生了,若小概率事件发生了,则否定则否定H0。若不发生,则接受若不发生,则接受H0,并称并称 H0相容。相容。概率反证法的逻辑是:概率反证法的逻辑是:如果小概率事件在一次试验如果小概率事件在一次试验我们就以很大的把握否定原假设我们就以很大的把握否定原假设.假设检验使用的方法是概率论的反证法:假设检验使用的方法是概率论的反证法:即先对所关心的问题提出原假设即先对所关心的问题提出原假设
8、H0,然后运用样本然后运用样本 不否定不否定H0并不是肯定并不是肯定H0一定对,而只是一定对,而只是说差异还不够显著,还没有达到足以否定说差异还不够显著,还没有达到足以否定H0的程度的程度.所以假设检验又叫所以假设检验又叫“显著性检验显著性检验”由于作出结论的依据是下述由于作出结论的依据是下述小概率原理小概率原理小概率事件在一次试验中基本上不会发生小概率事件在一次试验中基本上不会发生.不是一定不发生不是一定不发生 如果如果H0成立,但统计量的实测值落入否定域,从成立,但统计量的实测值落入否定域,从而作出否定而作出否定H0的结论,那就犯了的结论,那就犯了“以真为假以真为假”的错误的错误.如果如果
9、H0不成立,但统计量的实测值未落入否定域,不成立,但统计量的实测值未落入否定域,从而没有作出否定从而没有作出否定H0的结论,即接受了错误的的结论,即接受了错误的H0,那就,那就犯了犯了“以假为真以假为真”的错误的错误.两类错误:假设检验会不会犯错误呢两类错误:假设检验会不会犯错误呢 假设检验的两类错误假设检验的两类错误H H0 0为真为真实际情况实际情况决定决定拒绝拒绝H H0 0接受接受H H0 0H H0 0不真不真弃真弃真正确正确正确正确取伪取伪P P 拒绝拒绝H H0 0|H H0 0真真=,=,P P 接受接受H H0 0|H H0 0不真不真=.=.犯两类错误的概率犯两类错误的概率
10、:显著性水平显著性水平 为犯第一类错误的概率为犯第一类错误的概率.P P 第一类错误第一类错误=P P 第二类错误第二类错误=对给定的显著性水平对给定的显著性水平,H H0 0关于关于 的接受域:的接受域:H0关于关于 的拒绝域:的拒绝域:把本来正确的东西给丢弃了这就范了把本来正确的东西给丢弃了这就范了“弃真弃真”的错误,的错误,其概率是其概率是P拒绝拒绝H0|真真=而结论是:若而结论是:若 落在落在H0的接受域内,就接受的接受域内,就接受H0,但结论是:若但结论是:若 落在落在H0的拒绝域内,就拒绝的拒绝域内,就拒绝H0,(1)在)在H0正确的情况下,正确的情况下,落在落在R上的每一点都是可
11、能的上的每一点都是可能的范了范了“取伪取伪”的错误,的错误,注意:积分区间长度不变:注意:积分区间长度不变:但积分区间的中心但积分区间的中心(2 2)要同时降低两类错误的概率要同时降低两类错误的概率 或者要在或者要在 不变的条件下降低不变的条件下降低 ,需要增加样本容量,需要增加样本容量.(1 1)当样本容量固定时,一类错误概率的减少导致)当样本容量固定时,一类错误概率的减少导致另一类错误概率的增加另一类错误概率的增加.因因 减少,减少,积分区间长度:积分区间长度:实际问题中,我们希望两类错误都能得到控制。一实际问题中,我们希望两类错误都能得到控制。一般多是控制第般多是控制第I I类错误的概率
12、到适当程度而不管第类错误的概率到适当程度而不管第II II类类错误的大小,这种检验叫显著性检验。错误的大小,这种检验叫显著性检验。4.2 单个正态总体均值与方差的假设检验单个正态总体均值与方差的假设检验设总体设总体为为X的样本。的样本。我们对我们对,2 2作显著性检验作显著性检验一、总体均值一、总体均值的假设检验的假设检验1、已知、已知2 2,检验,检验(H1可以不写)可以不写)其中其中0 0是已知常数,是已知常数,在实际工作中,往往把不轻易否定的命题作为原假设在实际工作中,往往把不轻易否定的命题作为原假设.提出原假设和备择假设提出原假设和备择假设 第一步:第一步:1.1.已知已知已知,已知,
13、第二步:第二步:取统计量,在取统计量,在H H0 0成立下求出它的分布成立下求出它的分布第三步:第三步:查表确定临界值查表确定临界值,使使对给定的显著性水平对给定的显著性水平检验假设检验假设的过程分为五个步骤:的过程分为五个步骤:或或得得H0否定域否定域第四步:第四步:将样本值将样本值 代入算出统计量代入算出统计量选择假设选择假设H1 表示表示Z Z可能大于可能大于0 0,也可能小于,也可能小于0 0。这称为双边假设检验。这称为双边假设检验。由于取用的统计量服从由于取用的统计量服从 Z(U)Z(U)分布,分布,第五步:判断第五步:判断则否定则否定H0,接受,接受H1则则H0相容,接受相容,接受
14、H0故称其为故称其为Z(U)检验法。检验法。0例例1 某车间生产铜丝,某车间生产铜丝,X的大小。的大小。铜丝的主要质量指标是折断力铜丝的主要质量指标是折断力由资料可认为由资料可认为今换了一批原料,今换了一批原料,从性能上看,从性能上看,估计折断力的方差不会有变换,估计折断力的方差不会有变换,但不知但不知折断力的大小有无差别。折断力的大小有无差别。解解 方差已知方差已知抽出抽出10个样品,测得其折断力(斤)为个样品,测得其折断力(斤)为进行检验。进行检验。提出假设提出假设(=0.05=0.05)第一步:第一步:第二步:第二步:取统计量,在取统计量,在H H0 0成立下求出它的分布成立下求出它的分
15、布第三步:第三步:查表确定临界值查表确定临界值,使使对给定的显著性水平对给定的显著性水平得得H0否定域否定域第四步:第四步:将样本值将样本值 代入算出统计量代入算出统计量第五步:判断第五步:判断说明小概率事件竟在一次试验中发生了,说明小概率事件竟在一次试验中发生了,故否定故否定H0.可以接受可以接受H1。2、未知、未知2 2,检验,检验(H1可以不写)可以不写)未知未知2 2,可用样本方差,可用样本方差代替代替2 2检验步骤检验步骤提出原假设和备择假设提出原假设和备择假设 第一步:第一步:第二步:第二步:取一检验统计量,在取一检验统计量,在H H0 0成立下求出它的分布成立下求出它的分布第三步
16、:第三步:查表确定临界值查表确定临界值,使使对给定的显著性水平对给定的显著性水平确定确定H0的否定域。的否定域。即即“”“”是一个小概率事件是一个小概率事件.或或由于取用的统计量服从由于取用的统计量服从t t分布,分布,第四步:第四步:得得 H0否定域否定域将样本值将样本值 代入算出统计量代入算出统计量第五步:判断第五步:判断则否定则否定H0,接受,接受H1则则H0相容,接受相容,接受H0故称其为故称其为t 检验法。检验法。抽取抽取6 6件件,得尺寸数据如下得尺寸数据如下:32.56,29.66,31.64,30.00,31.87,31.0332.56,29.66,31.64,30.00,31
17、.87,31.03问这批产品是否合格问这批产品是否合格?某工厂生产的一种螺钉,某工厂生产的一种螺钉,标准要求长度是标准要求长度是32.532.5毫米毫米.实际生产的产品其长度实际生产的产品其长度 X X 假定服从正态分布假定服从正态分布 ,未知,未知,现从该厂生产的一批产品中现从该厂生产的一批产品中例例2 2(=0.01=0.01)提出假设提出假设解解 已知已知未知未知.取一检验统计量,在取一检验统计量,在H H0 0 成立下求出它的分布成立下求出它的分布得否定域得否定域对给定的显著性水平对给定的显著性水平查表确定查表确定故不能拒绝故不能拒绝H H0 0.将样本值代入算出将样本值代入算出 T
18、T0 0的值的值,没有落入没有落入拒绝域拒绝域正态总体均值的假设检验小结正态总体均值的假设检验小结H0接受域接受域H0接受域接受域0测量值测量值X X服从正态分布服从正态分布,取取 =0.05=0.05)?)?解解:提出假设提出假设 H H0 0:=112.6112.6;H H1 1:112.6112.6用热敏电阻测温仪间接测量地热勘探井底温度用热敏电阻测温仪间接测量地热勘探井底温度,重复测量重复测量7 7次,测得温度次,测得温度():():112.0 113.4 111.2 112.0 114.5 112.9 113.6112.0 113.4 111.2 112.0 114.5 112.9
19、113.6而用某种精确办法测得温度为而用某种精确办法测得温度为112.6(112.6(可看作真值可看作真值),),试问用热敏电阻测温仪间接测温有无系统偏差试问用热敏电阻测温仪间接测温有无系统偏差(设温度设温度因为未知方差因为未知方差2 2,故采用,故采用t t检验法。检验法。取统计量取统计量例例3 3查表查表由样本算得由样本算得这里这里H H0 0相容,接受相容,接受H H0 0。即即用热敏电阻测温仪间接测温无系统偏差。用热敏电阻测温仪间接测温无系统偏差。由于由于S2为为2 2的无偏估计,自然想用的无偏估计,自然想用S2与与2 2进行比较进行比较若若过大或过于接近过大或过于接近0,则说明则说明
20、2 2 偏离偏离0 02 2较大。较大。因此有理由否定因此有理由否定H0。三、关于三、关于2 2假设检验假设检验在显著性水平在显著性水平 条件下检验假设条件下检验假设其中其中0 0是已知常数,是已知常数,取统计量取统计量提出原假设和备择假设提出原假设和备择假设 第一步:第一步:第二步:第二步:取一检验统计量,取一检验统计量,第三步:第三步:查表确定临界值查表确定临界值对给定的显著性水平对给定的显著性水平确定确定H0的否定域。的否定域。或或H0否定域否定域第四步:第四步:在样本值在样本值下计算下计算第五步:判断第五步:判断若若或或则否定则否定H0。若若则接受则接受H0。例例1 已知某种延期药静止
21、燃烧时间已知某种延期药静止燃烧时间T,今从一批延期药中任取今从一批延期药中任取10副测得静止燃烧时间(单位副测得静止燃烧时间(单位秒)数据为秒)数据为问:是否可信这批延期药的静止燃烧时间问:是否可信这批延期药的静止燃烧时间T的方差为的方差为我们的任务是根据所得的样本值检验我们的任务是根据所得的样本值检验提出假设提出假设第一步:第一步:第二步:第二步:取统计量,取统计量,第三步:第三步:查表确定临界值查表确定临界值对给定的显著性水平对给定的显著性水平或或得得 H0否定域否定域解解根据样本值算得根据样本值算得则则H0相容,接受相容,接受H0。可信这批延期药的静止燃烧时间可信这批延期药的静止燃烧时间
22、T的方差为的方差为显然显然第四步:第四步:第五步:判断第五步:判断(=0.05=0.05)解解:提出假设提出假设某次统考后随机抽查某次统考后随机抽查2626份试卷份试卷,测得平均成绩测得平均成绩:试分析该次考试成绩标准差是否为试分析该次考试成绩标准差是否为已知该次考试成绩已知该次考试成绩取统计量取统计量例例2 2查表查表根据样本值算得根据样本值算得则则H0相容,故接受相容,故接受H0。显然显然表明考试成绩标准差与表明考试成绩标准差与12无显著差异。无显著差异。关于关于2 2假设检验假设检验已知,已知,其中其中0 0是已知常数,是已知常数,取统计量取统计量或或H0否定域否定域分别是分别是且且X
23、X与与Y Y独立独立,X X1 1,X X2 2,是取自是取自X X的样本的样本,取自取自Y Y的样本的样本,分别是样本方差分别是样本方差,均值均值,1.1.Y Y1 1,Y Y2 2,是是样本样本提出假设提出假设 H H0 0:1 1=2 2 ;H H1 1:1 1 2 2 四四.检验两正态总体均值相等检验两正态总体均值相等取统计量,取统计量,拒绝域的形式拒绝域的形式对给定对给定查表确定查表确定1.1.提出假设提出假设 H H0 0:1 1=2 2 ;H H1 1:1 1 2 2 则否定则否定H0,接受,接受H1则接受则接受H0即认为两个正态母体均值无显著差异即认为两个正态母体均值无显著差异
24、即认为两个正态母体均值有显著差异,显著性水平即认为两个正态母体均值有显著差异,显著性水平为为由样本值由样本值 代入算出统计量代入算出统计量H H0 0:1 1=2 2 ;H H1 1:1 1 2 2 取统计量取统计量提出假设提出假设拒绝域的形式拒绝域的形式给定显著性水平给定显著性水平且且X与与Y独立独立,1.提出假设提出假设 检验两正态总体均值之差检验两正态总体均值之差取统计量取统计量拒绝域的形式拒绝域的形式给定给定算出统计量算出统计量则否定则否定H0,接受,接受H1则接受则接受H0即认为两个正态母体均值无显著差异即认为两个正态母体均值无显著差异注意注意 在关于在关于的假设检验中的假设检验中,
25、通常遇到的情况是通常遇到的情况是,即检验,即检验与与是否相等是否相等.例例3 3 某苗圃用两种育苗方案对杨树进行育苗试验某苗圃用两种育苗方案对杨树进行育苗试验,已知在两组育苗试验中苗高的标准差分别为已知在两组育苗试验中苗高的标准差分别为cm,cm,cm.cm.cm,cm,设杨树苗高服从正态分布设杨树苗高服从正态分布,试在显著性水平试在显著性水平下下,判断两种试验方案对平均苗高有无显著影响?判断两种试验方案对平均苗高有无显著影响?现各抽取现各抽取80株树苗作为样本株树苗作为样本,算得苗高的样本均值分别为算得苗高的样本均值分别为cm.解解 设第一种方案的苗高为设第一种方案的苗高为第二种方案的苗高为
26、第二种方案的苗高为则则,检验假设检验假设选取检验统计量选取检验统计量 该拒绝域为该拒绝域为现在现在,统计量统计量的值的值因为因为所以拒绝原假设所以拒绝原假设即这两种试验方案对苗高有显著影响即这两种试验方案对苗高有显著影响.五、五、检验两正态总体方差相等检验两正态总体方差相等 F检验检验取统计量取统计量分别是样本方差分别是样本方差,由样本值算出统计量由样本值算出统计量F F的值,并查表得的值,并查表得判断判断拒绝域的形式拒绝域的形式给定给定 例例4 4 为比较两台自动机床的精度,分别取容量为为比较两台自动机床的精度,分别取容量为1010和和8 8的两个样本,测量某个指标的尺寸的两个样本,测量某个
27、指标的尺寸(假定服从正假定服从正态分布态分布),得到下列结果:,得到下列结果:在在 =0.1 =0.1时,时,问这两台机床是否有同样的精度问这两台机床是否有同样的精度?车床甲:车床甲:1.08,1.10,1.12,1.14,1.15,1.25,1.08,1.10,1.12,1.14,1.15,1.25,1.36,1.38,1.40,1.42 1.36,1.38,1.40,1.42车床乙车床乙:1.11,1.12,1.18,1.22,1.33,1.35,1.36,1.38:1.11,1.12,1.18,1.22,1.33,1.35,1.36,1.38解解:设设两台自动机床的方差分别为两台自动机床的方差分别为在在 =0.1 =0.1下检验假设下检验假设:取统计量取统计量拒绝域为拒绝域为或或分别是样本方差分别是样本方差,由样本值可计算得由样本值可计算得F的实测值为的实测值为:F=1.51由于由于 0.3041.513.68,故接受故接受H0 .查表得查表得
限制150内