概率论与数理统计第八章-优秀课件.ppt
概率论与数理统计第八章-第1页,本讲稿共45页推断统计:推断统计:推断统计:推断统计:利用样本统计量对总体某些性质或数量特征利用样本统计量对总体某些性质或数量特征进行推断。进行推断。随机原则随机原则总体参数总体参数统计量统计量推断估计推断估计参数估计参数估计检验检验假设检验假设检验抽样分布抽样分布第2页,本讲稿共45页 假设检验假设检验 基本思想基本思想 检验规则检验规则 检验步骤检验步骤 常见的假设检验常见的假设检验第3页,本讲稿共45页 基本思想基本思想小概率原理:小概率原理:如果对总体的某种假设是如果对总体的某种假设是真实真实真实真实的,那么不利于的,那么不利于或不能支持这一假设的事件或不能支持这一假设的事件A(小概率事件)(小概率事件)在一次试验中几乎不可能发生的;在一次试验中几乎不可能发生的;要是要是在一次在一次在一次在一次试验试验试验试验中中中中A A竟然发生了竟然发生了竟然发生了竟然发生了,就有理由怀疑该假设的就有理由怀疑该假设的真实性,真实性,拒绝拒绝拒绝拒绝这一假设。这一假设。总总 体体(某种假设)(某种假设)抽样抽样样样 本本(观察结果)(观察结果)检验检验(接受)(接受)(拒绝)(拒绝)小概率事件小概率事件未未 发发 生生小概率事件小概率事件发发 生生第4页,本讲稿共45页 检验规则检验规则 确定检验规则确定检验规则确定检验规则确定检验规则检验过程是比较样本观察结果与总体假设的差异。差异显著,检验过程是比较样本观察结果与总体假设的差异。差异显著,超过了临界点,拒绝超过了临界点,拒绝H0;反之,差异不显著,接受;反之,差异不显著,接受H0差差 异异临界点临界点临界点临界点拒绝拒绝拒绝拒绝HH0 0接受接受接受接受HH0 0c cc c判判判判 断断断断两类错误两类错误接受或拒绝接受或拒绝H0,都可能犯错误,都可能犯错误I类错误类错误弃真错误,弃真错误,发生发生 的概率为的概率为 II类错误类错误取伪错误,发生取伪错误,发生 的概率为的概率为检验决策检验决策 H0为真为真 H0非真非真拒绝拒绝H0 犯犯I类错误(类错误()正确正确接受接受H0 正确正确 犯犯II类错误(类错误()怎样确定怎样确定c?第5页,本讲稿共45页大大就小,就小,小小就大就大基本原则:力求在控制基本原则:力求在控制基本原则:力求在控制基本原则:力求在控制 前提下减少前提下减少前提下减少前提下减少 显著性水平,取值:显著性水平,取值:0.1,0.05,0.01,0.005等。如果犯等。如果犯I类类错误损失更大,为减少损失,错误损失更大,为减少损失,值取小;如果犯值取小;如果犯II类错误损失更,类错误损失更,值取大。值取大。确定确定,就确定了临界点,就确定了临界点c。设有总体:设有总体:设有总体:设有总体:XNXN(,2 2),),),),2 2已知。已知。已知。已知。随机抽样:样本均值随机抽样:样本均值随机抽样:样本均值随机抽样:样本均值标准化:标准化:标准化:标准化:确定确定确定确定 值,值,值,值,查概率表,知临界值查概率表,知临界值查概率表,知临界值查概率表,知临界值计算计算计算计算Z Z值,作出判断值,作出判断值,作出判断值,作出判断0 0接受区接受区接受区接受区拒绝区拒绝区拒绝区拒绝区拒绝区拒绝区拒绝区拒绝区第6页,本讲稿共45页 当检验判断为接受原假设当检验判断为接受原假设H0时,就有可能犯取伪的错误即时,就有可能犯取伪的错误即II类错误。犯类错误。犯II类错误的概率计算:类错误的概率计算:(1)先求出拒绝先求出拒绝H0的临界值;的临界值;(2)再求得在统计量真实的抽样分布下达到临界值的概率再求得在统计量真实的抽样分布下达到临界值的概率。统计中,称不犯取伪错误的概率统计中,称不犯取伪错误的概率1-为统计检验的能力或效为统计检验的能力或效力。力。II类错误的概率类错误的概率的计算的计算第7页,本讲稿共45页 检验步骤检验步骤建立总体假设建立总体假设H0,H1抽样得到样抽样得到样本观察值本观察值12选择统计量选择统计量确定确定H0为真为真时的抽样分布时的抽样分布3根据具体决策根据具体决策要求确定要求确定确定分布上的临确定分布上的临界点界点C和检验规则和检验规则计算检验统计算检验统计量的数值计量的数值比较并作出检验判断比较并作出检验判断7456第8页,本讲稿共45页8.1假设检验的基本概念和思想假设检验的基本概念和思想一、基本概念一、基本概念(一一)两类问题两类问题1、参数假设检验 总体分布已知,参数未知,由观测值x1,xn检验假设H0:=0;H1:02、非参数假设检验 总体分布未知,由观测值x1,xn检验假设H0:F(x)=F0(x;);H1:F(x)F0(x;)第9页,本讲稿共45页 以样本(X1,Xn)出发制定一个法则,一旦观测值(x1,xn)确定后,我们由这个法则就可作出判断是拒绝H0还是接受H1,这种法则称为H0对H1的一个检验法则,简称检验法。样本观测值的全体组成样本空间S,把S分成两个互不相交的子集W和W*,即S=W W*,WW*=假设当(x1,xn)W时,我们就拒绝H0;当(x1,xn)W*时,我们就接受H0。子集W S就称为检验的拒绝域(或临界域)。(二二)检验法则与拒绝域检验法则与拒绝域第10页,本讲稿共45页(三三)检验的两类错误检验的两类错误称 H0真而被拒绝的错误为第一类错误或弃真错误;称 H0假而被接受的错误为第二类错误或取伪错误。记 p(I)=p拒绝H0|H0真;=p 接受H0|H0假对于给定的一对H0和H1,总可找出许多临界域,人们自然希望找到这种临界域W,使得犯两类错误的概率都很小。奈曼皮尔逊(NeymanPearson)提出了一个原则:“在控制犯第一类错误的概率不超过指定值 的条件下,尽量使犯第二类错误 小”按这种法则做出的检验称为“显著性检验”,称为显著性水平或检验水平。第11页,本讲稿共45页怎样构造的拒绝域方可满足上述法则?如:对总体XN(,1),要检验H0:=0;H1:=1显著性检验的思想和步骤:显著性检验的思想和步骤:(1)根据实际问题作出假设H0与H1;(2)构造统计量,在H0真时其分布已知;(3)给定显著性水平 的值,参考H1,令 P拒绝H0|H0真=,求出拒绝域W;(4)计算统计量的值,若统计量W,则拒绝H0,否则接受H0第12页,本讲稿共45页8.2 单正态总体的假设检验单正态总体的假设检验一、单总体均值的假设检验一、单总体均值的假设检验1、2已知的情形-U检验 对于假设H0:=0;H1:0,构造查表,计算,比较大小,得出结论第13页,本讲稿共45页说明:说明:(1)H0:=0;H1:0称为双边HT问题;而 H0:=0;H1:0(或 0 或H0:0;H1:u 0,第14页,本讲稿共45页现考虑完备的右边HT问题H0:0;H1:0,若取拒绝域为则犯第一类错误的概率为第15页,本讲稿共45页于是故是H0:0;H1:0,的水平为的拒绝域第16页,本讲稿共45页 例例1 1:设某厂生产一种灯管,其寿命X N(X N(,200,2002 2),),由以往经验知平均寿命 =1500=1500小时,现采用新工艺后,在所生产的灯管中抽取2525只,测得平均寿命16751675小时,问采用新工艺后,灯管寿命是否有显著提高。(=0.05)解:这里拒绝H0第17页,本讲稿共45页左边HT问题H0:=0;H1:0,或或H0:0;H1:1.96,|U|=3.781.96,故拒绝故拒绝H H0 0,说明可以认为该日铁说明可以认为该日铁水的平均含碳量显著异于水的平均含碳量显著异于4.55.4.55.但无法说明是显著但无法说明是显著高于还是低于高于还是低于4.55.4.55.不合题意不合题意若用右边检验若用右边检验,H,H0 0:4.554.55;H H1 1:4.554.55,则拒绝域为则拒绝域为由由U=-3.78-1.96,U=-3.78 0,或或H0:0;H1:0,由pT t(n 1)=,得水平为的拒绝域为T t(n 1),第23页,本讲稿共45页例例4 4:某厂生产镍合金线,其抗拉强度的均值为10620(kg/mm2)今改进工艺后生产一批镍合金线,抽取10根,测得抗拉强度(kg/mm2)为:10512,10623,10668,10554,10776,10707,10557,10581,10666,10670.认为抗拉强度服从正态分布,取=0.05,问新生产的镍合金线的抗拉强度是否比过去生产的合金线抗拉强度要高?解解:H0:=10620;H1:10620由pT t0.05(9)=0.05,得拒绝域为T t0.05(9)=1.8331这里接受H0第24页,本讲稿共45页左边HT问题 H0:=0;H1:0,或或H0:0;H1:0,由pT -t(n 1)=,得水平为的拒绝域为T -t(n 1)第25页,本讲稿共45页例例5 5 设正品镍合金线的抗拉强度服从均值不低于设正品镍合金线的抗拉强度服从均值不低于10620 10620(kg/mm(kg/mm2 2)的正态分布的正态分布,今从某厂生产的镍合金线中抽取今从某厂生产的镍合金线中抽取1010根根,测测得平均抗拉强度得平均抗拉强度10600(kg/mm10600(kg/mm2 2),),样本标准差为样本标准差为80.,80.,问该厂的镍问该厂的镍合金线的抗拉强度是否不合格合金线的抗拉强度是否不合格?(?(=0.1)=0.1)解解:H0:10620;H1:10620由pT -t0.1(9)=0.1,得拒绝域为T -t0.1(9)=1.383这里接受H0第26页,本讲稿共45页二、单总体方差的假设检验二、单总体方差的假设检验假定假定 未知,双边检验:对于假设第27页,本讲稿共45页得水平为的拒绝域为第28页,本讲稿共45页例6 电工器材厂生产一批保险丝,取10根测得其熔化时间(min)为42,65,75,78,59,57,68,54,55,71.问是否可以认为整批保险丝的熔化时间的方差小于等于80?(=0.05),熔化时间为正态变量.)得水平为=0.05的拒绝域为这里接受H0第29页,本讲稿共45页设设保保险险丝丝的的融融化化时时间间服服从从正正态态分分布布,取取9 9根根测测得得其其熔熔化时间(化时间(minmin)的样本均值为)的样本均值为62,62,标准差为标准差为 10.10.(1)(1)是是否否可可以以认认为为整整批批保保险险丝丝的的熔熔化化时时间间服服从从N(60,N(60,9 92 2)?(=0.05)=0.05)(2)(2)是是否否可可以以认认为为整整批批保保险险丝丝的的熔熔化化时时间间的的方方差差显显著著大大于于70?(70?(=0.05)=0.05)答:(1)|t|=0.62.306,接受60;2.18X2=9.87717.535,接受 10(2)X2=11.421.3304,故拒绝故拒绝H H0,0,认为认为甲安眠药比乙安眠药疗效甲安眠药比乙安眠药疗效显著显著上题中,试检验是否乙安眠药比甲安眠药疗效显著?第35页,本讲稿共45页二、方差比的假设检验二、方差比的假设检验两样本独立,给定检验水平 ,由观测值假定假定 1,2未知第36页,本讲稿共45页由pF F1/2(n1 1,n2 1)或F F/2(n1 1,n2 1)=F1/2F/2得拒绝域F F1/2(n1 1,n2 1)或F F/2(n1 1,n2 1)第37页,本讲稿共45页而对应的单边问题拒绝域为F F(n1 1,n2 1)F F1(n1 1,n2 1)拒绝域为第38页,本讲稿共45页例例8 8:有甲乙两种机床:有甲乙两种机床,加工同样产品加工同样产品,从这两台机床加工的产品从这两台机床加工的产品中中 随随 机机 地地 抽抽 取取 若若 干干 产品产品,测得产品直径为测得产品直径为(单位单位:mm):mm):甲甲:20.5,19.8,19.7,20.4,20.1,20.9,19.6,19.9.:20.5,19.8,19.7,20.4,20.1,20.9,19.6,19.9.乙乙:19.7,20.8,20.5,19.8,19.4,20.6,19.2.:19.7,20.8,20.5,19.8,19.4,20.6,19.2.假定甲假定甲,乙乙 两台机床的产品直径都服从正态分布两台机床的产品直径都服从正态分布,试比较甲试比较甲,乙两乙两台机床加工的精度有无显著差异台机床加工的精度有无显著差异?(?(=0.05=0.05)解:拒绝域为F F1 0.025(7,6)=1/5.12=0.1953或F F0.025(7,6)=5.7这里:接受H0第39页,本讲稿共45页 几种常见的假设检验几种常见的假设检验条件条件检验条件量检验条件量拒绝域拒绝域H0、H1(1)H0:=0 H1:0z(2)H0:0 H1:0(3)H0:0 H1:0z0z0正态总正态总体体2已已知知第40页,本讲稿共45页条件条件检验条件量检验条件量拒绝域拒绝域H0、H1(1)H0:=0 H1:0t(2)H0:0 H1:0(3)H0:0 H1:0t0t00正态总正态总体体2未未知知第41页,本讲稿共45页条件条件检验条件量检验条件量拒绝域拒绝域H0、H1总体服总体服从正态从正态分布分布第42页,本讲稿共45页条件条件检验条件量检验条件量拒绝域拒绝域H0、H1(1)H0:1=2 H1:1 2 z(2)H0:1 2 H1:1 2(3)H0:1 2 H1:1 2 z0z00两个正两个正态总体态总体已知已知第43页,本讲稿共45页条件条件检验条件量检验条件量拒绝域拒绝域H0、H1(1)H0:1=2 H1:1 2 t(2)H0:1 2 H1:1 2(3)H0:1 2 H1:1 2 t0t00两个正两个正态总体态总体未知,未知,但相等但相等第44页,本讲稿共45页条件条件检验条件量检验条件量拒绝域拒绝域H0、H1总体服总体服从正态从正态分布分布FFF第45页,本讲稿共45页