《数理统计之假设检验.ppt》由会员分享,可在线阅读,更多相关《数理统计之假设检验.ppt(99页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、第四章 假设检验,基本要求 理解假设检验的概念及其基本思想。 理解拒绝域、临界值、显著水平等概念。 掌握假设检验的基本步骤。 了解假设检验可能产生的两类错误。,假设检验基本概念,例,对某产品进行了工艺改造或研制了新产品,,要比较原产品和新产品在某一项指标上的差异, 这样我们面临选择是否接受假设,必须作一些试验,也就是抽样。,根据得到的样本观察值,来作出决定。,假设检验问题就是根据样本的信息,检验,关于总体的某个假设是否正确。,“新产品的某一项指标优于老产品”。,假设检验是一种统计推断方法 为了了解总体的某些性质,首先作出某种假设,然后进行试验,取得样本,根据样本值,构造统计方法,判断是否接受这
2、个假设,即检验这种假设是否合理,合理则接受,否则拒绝。,小概率事件在一次试验中发生的概率记为,,一般取,在假设检验中,称为显著水平、检验水平。,解决办法与基本思想,1 明确所要处理的问题,答案只能是“是”或“否” 2 取得样本,同时要知道样本的分布 3 把“是”转化到分布上得到一个命题或假设 4 根据样本值,按照一定的规则,作出接受或拒绝假设的决定。 基本思想(规则或前提) 小概率事件在一次试验中几乎不会发生。,带概率性质的反证法 通常的反证法设定一个假设以后,如果出现的事实与之矛盾,(即如果这个假设是正确的话,出现一个概率等于0的事件)则绝对地否定假设.,带概率性质的反证法的逻辑是: 如果假
3、设H0是正确的话,一次试验出现一个概率很小的事件,则以很大的把握否定假设H0.,检验一个H0时,是根据检验统计量来判决是否接受H0的,而检验统计量是随机的,这就有可能判决错误.这种错误有以下两类: H0事实上是正确的,但被我们拒绝了,称犯了“弃真”的(或称第一类)错误. H0事实上是不正确的,但被我们接受了,称犯了“存伪”的(或称第二类)错误.,假设检验的两类错误,P拒绝H0|H0为真= ,P接受H0|H0不真= .,犯两类错误的概率:,显著性水平 为犯第一类错误的概率.,当样本容量n固定时,一类错误概率的减少导致另一类错误概率的增加.要同时降低两类错误,必须增加样本容量. 在统计学中,通常控
4、制犯第一类错误的概率.一般事先选定一个数,(01),要求犯第一类错误的概率.,显著性检验:,只对犯第一类错误的概率加以控制,,而不考虑犯第二类错误的概率。,称 为显著性水平。,P拒绝 | 为真,参数假设检验解题步骤,1 根据问题提出原假设H0,同时给出对立假设H1(备选假设); 2 在H0成立的前提下,选择合适的统计量,这个统计量要包含待检的参数,并求得其分布; 3 给定显著性水平 ,按分布写出小概率事件及其概率表达式; 4 由样本计算出需要的数值; 5 判断小概率事件是否发生,是则拒绝,否接受,二 单个正态总体参数的假设检验,在实际中,往往把不轻易否定的命题作为原假设.,-原假设(零假设),
5、-备选假设(对立假设),一、总体均值 的假设检验,其中 是已知常数,已知时,,的检验,例1 某车间生产铜丝,,X的大小。,主要质量指标是折断力,由资料可认为,今换了一批,原料,从性能上看,,估计折断力的方差不会有变化,,但不知折断力的大小有无差别。,解 此问题就是已知方差,检验假设,抽出10个样品进行检验,测得其折断力为,(=0.05),看在H0条件下会不会产生不合理的现象,,能较好反映 的大小.,当 为真时,,差异不能过大。,有较大偏差,较小,若差异较大,即小概率事件发生,,则拒绝假设,当 为真时,,衡量 的大小,设一临界值 k0,若,就认为有较大偏差;,则认为 不真,拒绝,则接受,若,显著
6、性检验:,P拒绝 | 为真,拒绝域,由样本值求出,这说明小概率事件竟在一次试验中发生了,,故拒绝H0,,可以接受H1。,即认为折断力大小有差别,已知,已知,,第二步:,选取统计量,检验假设,的过程分为六个步骤:,第三步:,拒绝域为,第四步:,查表确定临界值,第六步:判断,则否定H0,接受H1,则H0相容,接受H0,第五步:计算,/2,/2,接受域,P(|Z|z/2)=,拒绝域,拒绝域,z/2,- z/2,双侧统计检验,Z检验,某车间用一台包装机包装葡萄糖.包得的袋装糖,当机器正常时,某日开工后为检验包装机是否正常,包装的糖9袋,称得净重为(公斤):,0.497 0.506 0.518 0.52
7、4 0.498,0.511 0.520 0.515 0.512,问机器是否正常?,例2,重是一个随机变量X,且,其均值为=0.5公斤,标准差=0.015公斤.,随机地抽取它所,解:先提出假设,(=0.05),选取统计量:,拒绝域:,计算得,于是拒绝 ,,认为包装机工作不正常。,选择假设H1表示Z可能大于0,也可能小于0,这称为双边假设检验。,单边检验,右边检验,左边检验,右边检验,(2)选取统计量:,(3)拒绝域为,(5)计算,则拒绝 ,接受,反之,接受,左边检验,(2)选取统计量:,(3)拒绝域为,(5)计算,则拒绝 ,接受,反之,接受,例3,(2)选取统计量:,某大学男生身高,今测得9名男
8、生身高,平均为,问是否可以认为该校男生平均身高,超过170cm呢?,(3)拒绝域为,解,查表确定临界值,(4)取,(5)计算,可以认为该校男生平均身高超过170cm.,则拒绝 ,,如题目问:是否有明显提高,是否有明显下降,(2)选取统计量:,(3)拒绝域为,例4 设某厂灯泡平均寿命为2000小时,标准差为250小时,从技术改造后的灯泡中随机抽取 n=25只,测得平均,寿命为2250小时,问此产品寿命是否较前有显著提高.,查表确定临界值,(4)取,(5)计算,则拒绝 ,,即认为这些产品较以往有显著提高.,提出原假设和备择假设,第一步:,第二步:,选取统计量,第四步:,查表确定临界值,第三步:,拒
9、绝域为,未知时,,的检验,未知 ,可用样本方差,代替,选择假设H1表示Z可能大于0,也可能小于0,这称为双边假设检验。,第六步:判断,则否定H0,接受H1,则H0相容,接受H0,第五步:计算,显著差别?爆破压力X服从正态分布 =0.05,解: 提出假设 H0:=549; H1:549,对一批新的某种液体存储罐进行耐裂试验,重复测量5次,测得爆破压力数据为(单位斤/寸2):,545 545 530 550 545,过去该种液体存储罐的平均爆破压力为549斤寸(可,看作真值),因为未知方差2,故采用t检验法。,取统计量,例5,试问这批新罐的平均爆破压力与过去有无,由样本算得,这里,接受H0。新罐的
10、平均爆破压力与过去无显著差别。,拒绝域,查表,32.56, 29.66, 31.64, 30.00, 31.87, 31.03,例6,解(1),(2),(3)拒绝域,取统计量,某工厂生产一种螺钉,标准要求是长度是32.5毫米,实际生产的产品其长度X服从正态分布,未知,现从该厂生产的一批产品中抽取6件,得,尺寸数据如下:,问这批产品是否合格?,(5),将样本值代入算出统计量 T0的实测值,没有落入 拒绝域,故接受 为真,即可认为产品是合格的。,(4),查表,右边检验,查表确定临界值,(4)取,(2)选取统计量:,(3)拒绝域为,(5)计算,则拒绝 ,接受,反之,接受,左边检验,查表确定临界值,(
11、4)取,(2)选取统计量:,(3)拒绝域为,(5)计算,则拒绝 ,接受,反之,接受,4.28;4.40;4.42;4.35;4.37.如果标准差不变,解:,拒绝H0,例1,某日测得5炉铁水含碳量如下:,该日铁水的平均含碳量是否显著偏低? =0.05,已知某炼铁厂的铁水含碳量 在正常情况下,(2)取统计量,某次考试的考生成绩,从中随机地抽取36位考生的成绩,平均成绩为63.5分,,未知,,例2,标准差 s =15分,问在显著水平0.05下是否可以认为,全体考生的平均成绩为70分?求的置信水平为,0.95的置信区间。,拒绝域为,解 先提出假设,计算,故落在拒绝域之内,拒绝H0 ,接受H1,即不能认
12、为全体考生的平均成绩为70分。, 的置信水平为0.95的置信区间为,设总体,已知时,,的检验,第二步:,在假设成立前提下取统计量,第三步:,拒绝域为,第四步,第五步,计算,最后,设总体,为X 的,样本。对2 作显著性检验(,,其中,检验),引例 已知某种延期药静止燃烧时间,今从一批延期药中任取10副测得静止燃烧时间(单位,秒)数据为,问:是否可信这批延期药的静止燃烧时间T的方差为,未知时,,的检验,解 提出假设,取统计量,为 的无偏估计,,的观察值应集中在1附近,说明,和,在H0成立的条件下都是,小概率事件。,因此,,在样本值,下计算,若,或,则拒绝H0。,若,则接受H0。,根据样本值算得,双
13、边假设检验,的拒绝域为,或,则接受H0 。,即可信延期药的静止燃烧时间T的方差为,显然,由上例可得,第二步:,取统计量,的过程分为六个步骤:,第三步:,拒绝域为,第六步:判断,若,则拒绝H0,接受H1,第五步:计算,反之则接受H0。,第四步:,查表确定临界值,接受域,/2,/2,1,2,拒绝域,拒绝域,(=0.05),某次统考后随机抽查26份试卷,测得平均成绩,成绩标准差是否为,已知该次考试成绩,例2,(2)选取统计量,(3)拒绝域为,解(1) 假设,分,样本方差,试分析该次考试,分左右。,(4)查表确定临界值,(5)计算,故接受H0。,即可认为该次考试成绩标准差为,分左右。,三 两个正态总体
14、参数的假设检验,分别是这两个样本的均值,且 X 与 Y 独立,X1 , X2 , ,是取自X 的样本,Y 的样本,分别是这两个样本的样本方差,则有,Y1,Y2,是取自,和,分别是,且X与Y独立,X1,X2,是取自X的样本,取自Y的样本,分别是样本方差,均值,1.,Y1,Y2,是,样本,提出假设,检验两正态总体均值相等,独立,H0成立时取统计量,,取统计量,,拒绝域的形式,对给定,查表确定,则否定H0,接受H1,则接受H0,即认为两个正态母体均值无显著差异,即认为两个正态母体均值有显著差异,显著性水平为,由样本值 代入算出统计量,且X与Y独立,1.,提出假设,检验两正态总体均值之差,取统计量,给
15、定 查表,2.,提出假设,取统计量,拒绝域的形式,给定,算出统计量,则否定H0,接受H1,则接受H0,即认为两个正态母体均值无显著差异,取统计量,,其余步骤相同,例3 某苗圃用两种育苗方案对杨树进行育苗试验, 已知在两组育苗试验中苗高的标准差分别为,cm,cm.,cm,设杨树苗高服从正态分布, 试在显著性水平,下, 判断两种试验方案对平均苗高有无显著影响?,现各抽取80株作为样本, 算得苗高的样本均值分别为,cm.,解 设方案一的苗高为,方案二的苗高为,则,检验假设,选取检验统计量,该拒绝域为,现在, 统计量,的值,因为,所以拒绝原假设,即这两种试验方案对苗高有显著影响.,拒绝域,拒绝域,未知
16、,,的单边检验,五、 检验两正态总体方差相等 F检验,取统计量,分别是样本方差,(4),查表,则否定H0,接受H1,(2)选取统计量,(3)拒绝域,(5)计算,拒绝域,拒绝域,例1 两家银行分别对21个储户和16个储户的年存款余额进行抽样调查,测得其平均年存款余额分别为,元和,元.样本标准差相应为,元和,试比较两家银行的储户的平均年存款余额有无显著 差异。(取显著性水平,),元。假设年存款余额服从正态分布,,解 设两家银行的储户的平均年存款余额分别为,X,Y,则,是否相等。,拒绝域,查表,选取统计量,(1)检验假设,F的值为,因为,所以接受,选取统计量,(2)检验假设,(3)拒绝域,(4),查
17、表,因为,,所以拒绝,这说明两家银行的储户的平均年存款余额有显著差异,正如在数学上我们不能用一个例子去证明一个结论一样,用一个样本(例子)不能证明一个命题(假设)是成立的,但可以用一个例子(样本)推翻一个命题。,非正态总体参数的假设检验,1)总体不服从正态分布 2)不知道总体服从什么分布 当n很大时,由中心极限定理保证,不管总体服从什么分布,样本均值都服从正态分布,采用大容量样本,按正态分布处理 大样本一般取n50,n100,设总体 X 服从参数为 p 的(0-1)分布, 即,1(0-1)分布参数的假设检验,由于,因此由中心极限定理可知, 当,成立且样本容量,n充分大时,统计量,服从标准正态分
18、布N(0,1).,拒绝域为,近似地,例1 某种产品在通常情况下次品率为5%. 现在从生产出的一批产品中随机地抽取50件进行检验, 发现有4件次品. 问能否认为这批产品的次品率为5%? (=0.05),解 设这批产品的次品率为 p.,在这批产品中任,任意取一件产品,定义随机变量 X 如下,检验假设,该假设检验问题的拒绝域为,现在,统计量U的值为,=接受假设,=可以认为这批产品的次品率为5%,2.总体均值的假设检验,假设总体X 的均值为,方差为,为 X 的样本,检验假设,由中心极限定理知,当样本容量n充分大时,,近似地服从标准正态分布N(0,1),由于样本方差,为,的无偏估计量,,且样本容量n充分
19、大时,统计量,仍近似地服从标准正态分布N(0,1),拒绝域为,例2 某电器元件的平均电阻一直保持在2.64. 改变加工工艺后, 测得100个元件的电阻, 计算得平均电阻为 2.58 , 样本标准差为0.04 . 在显著性水平 =0.05下, 判断新工艺对此元件的平均电阻有无显著影响.,解 设该电器元件的电阻为X, 其均值为,检验假设,拒绝域为,现在,统计量U的值为,=拒绝假设,接受假设,新工艺对电子元件的平均电阻有显著影响.,3.两个总体均值的假设检验,设总体,和,相互独立,,的样本,是,是 Y 的样本. 记,设总体 X的均值为,,方差为,总体 Y的均值为,,方差为,的拒绝域.,由中心极限定理
20、知,当样本容量,和,都充分大时,,近似地服从标准正态分布,由于样本方差,和,分别为,和,的无偏估计量,因此,可以,分别用,和,近似代替,和,,并且当,求假设检验问题,和,近似地服从标准正态分布,,从而当原假设,成立时,,统计量,仍近似地服从标准正态分布.,都充分大时,,统计量U的值应该在零附近摆动,,当,过大时就认为,不成立.,=该假设检验问题的拒绝域为,例3 两台机床加工同一中轴承,现在从他们加工的轴承中分别随机地抽取200根和100根,测量其椭圆度(单位:mm),经计算得,能否认为这两台机床加工的轴承的平均椭圆度是相同的(=0.05),解设这两台机床加工的轴承的椭圆度分别为X,Y,且,检验
21、假设,由于题目给出的两个样本都是大样本,因此该假设检验问题的拒绝域为,现在,=拒绝原假设,即认为这两台机床加工的,轴承的平均椭圆度是不相同的.,非参数假设检验,一、拟合优度检验 1 多项分布的检验法 设总体设取m个可能值的离散型随机变量,不妨假定取值为1,2,m. 且,检验假设,定理4.1 当H0为真时,即(p10,p20,pm0)是总体的真实概率分布时,当n充分大时,可以近似认为,当总体X不具有多项分布,但其分布函数具有明确表达式F(x),检验假设,2 分布中含有未知参数的 拟合优度检验法,注意:拟合优度检验要求n必须足够大,且npi不太小(10以上),否则应适当合并区间,一般解题步骤,1)找出样本的最大值、最小值,确定样本的取值范围 2) 确定分组数k(等间距) 3)确定 4)列出样本观察值的分组频数表,两端样本点较少的可适当合并; 5)画出直方图;6)估计分布;7)假设检验,柯尔莫哥洛夫检验,斯米尔诺夫检验,比较两个总体的分布函数是否相同,
限制150内