莆田学院 概率论与数理统计(8).ppt
《莆田学院 概率论与数理统计(8).ppt》由会员分享,可在线阅读,更多相关《莆田学院 概率论与数理统计(8).ppt(163页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、第一节 假设检验问题 第二节 正态总体均值的假设检验 第三节 正态总体方差的检验 第四节 大样本检验法第五节 p值检验法第六节 假设检验的两类错误 第七节 非参数假设检验 第八章第八章 假设检验假设检验第一节 假设检验问题 前一章我们讨论了统计推断中的参数估计问题,本章将讨论另一类统计推断问题假设检验.在参数估计中我们按照参数的点估计方法建立了参数 的估计公式,并利用样本值确定了一个估计值 ,认为参数真值 。由于参数 是未知的,只是一个假设(假说,假想),它可能是真,也可能是假,是真是假有待于用样本进行验证(检验).下面我们先对几个问题进行分析,给出假设检验的有关概念,然后总结给出检验假设的思
2、想和方法.一、一、统计假设统计假设 某大米加工厂用自动包装机将大米装袋,每袋的标准重量规定为10kg,每天开工时,需要先检验一下包装机工作是否正常.根据以往的经验知道,自动包装机装袋重量X服从正态分布N()某日开工后,抽取了8袋,如何根据这8袋的重量判断“自动包装机工作是正常的”这个命题是否成立?请看以下几个问题:问题问题1 引号内的命题可能是真,也可能是假,只有通过验证才能确定如果根据抽样结果判断它是真,则我们接受这个命题,否则就拒绝接受它,此时实际上我们接受了“机器工作不正常”这样一个命题若用H0表示“”,用H1表示其对立面,即“”,则问题等价于检验H0:是否成立,若H0不成立,则H1:成
3、立问题问题2 2记H0:=10-4,H1:,则问题等价于检验H0成立,还是H1成立 一架天平标定的误差方差为10-4(g2),重量为 的物体用它称得的重量X服从N()某人怀疑天平的精度,拿一物体称n次,得n个数据,由这些数据(样本)如何判断“这架天平的精度是10-4(g2)”这个命题是否成立?某种电子元件的使用寿命X服从参数为 的指数分布,现从一批元件中任取n个,测得其寿命值(样本),如何判定“元件的平均寿命不小于5000小时”这个命题是否成立?记问题问题3 3则问题等价于检验H0成立,还是H1成立 某种疾病,不用药时其康复率为 ,现发明一种新药(无不良反应),为此抽查n位病人用新药的治疗效果
4、,设其中有s人康复,根据这些信息,能否断定“该新药有效”?记问题问题4 4则问题等价于检验H0成立,还是H1成立 自1965年1月1日至1971年2月9日共2231天中,全世界记录到震级4级及以上的地震共计162次,问相继两次地震间隔的天数X是否服从指数分布?问题问题5 5记 服从指数分布,不服从指数分布则问题也等价于检验H0成立,还是H1成立 在很多实际问题中,我们常常需要对关于总体的分布形式或分布中的未知参数的某个陈述或命题进行判断,数理统计学中将这些有待验证的陈述或命题称为统计假设统计假设,简称假设 如上述各问题中的H0和H1都是假设.利用样本对假设的真假进行判断称为假设检验假设检验。在
5、总体的概率分布已知情形下,对分布中的未未知参数知参数作假设并进行检验,称为参数假设检验参数假设检验 若总体的分布未知,对总体的分布形式或参数作假设并进行检验,称为非参数假设检验非参数假设检验 如上述问题14为参数假设检验问题,问题5为非参数假设检验问题值得注意的是,当给定原假设后,其对立假设的形式可以有多个,如H0:其对立形式有 在假设检验问题中,常把一个被检验的假设称为原假设原假设或零假设零假设,而其对立面就称为对立假设对立假设上述各问题中,H0为原假设,H1为对立假设当H0不成立时,就拒绝接受H0而接受其对立假设H1 选择哪一种需根据实际问题确定,因而对立假设往往也称为备选假设备选假设,即
6、在拒绝原假设后可供选择的假设.在假设检验问题中,必须同时给出原假设和对立假设.在参数假设中,不论是原假设还是对立假设,若其中只含有一个参数值,则称为简单假设简单假设,否则称为复合假设复合假设,如H0:,H1:为简单假设;而H0:,H1:为复合假设二、二、假设检验的思想方法假设检验的思想方法 如何利用从总体中抽取的样本来检验一个关于总体的假设是否成立呢?由于样本与总体同分布,样本包含了总体分布的信息,因而也包含了假设H0是否成立的信息,如何来获取并利用样本信息是解决问题的关键.统计学中常用“概率反证法”和“小概率原理”来解决这个问题小概率原理小概率原理概率很小的事件在一次试验中不会发生.如果小概
7、率事件在一次试验中竟然发生了,则事属反常,定有导致反常的特别原因,有理由怀疑试验的原定条件不成立概率反证法概率反证法欲判断假设H0的真假,先假定H0真,在此前提下构造一个能说明问题的小概率事件A试验取样,由样本信息确定A是否发生,若A发生,这与小概率原理相违背,说明试验的前定条件H0不成立,拒绝H0,接受H1;若小概率事件A没有发生,没有理由拒绝H0,只好接受H0 反证法的关键是通过推理,得到一个与常理(定理、公式、原理)相违背的结论“概率反证法”依据的是“小概率原理”那么多小的概率才算小概率呢?这要由实际问题的不同需要来决定以后用符号 记小概率,一般取 等在假设检验中,若小概率事件的概率不超
8、过 ,则称 为检验水平检验水平或显著性水平显著性水平 已知某炼铁厂的铁水含碳量XN(4.55,0.062),现改变了工艺条件,又测得10炉铁水的平均含碳量 ,假设方差无变化,问总体的均值 是否有明显改变?(取 =0.05)下面举例说明以上检验的思想与方法。例例1 1则 与4.55应很接近事件 较大,待定)不太可能发生解解 由问题提出假设H0:,H1:若H0成立由于 未知用其无偏估计 来代替用 来衡量 与4.55之间的差异如果 较大 则可认为所以在H0成立的前提下即P(A)很小令P(A)=,确定d是解决问题的关键由此确定了小概率事件由 可知因此在H0成立的前提下,统计量显然因此即由标准正态分布上
9、分位点的定义可知由 =0.05,得 由于说明小概率事件A未发生,因此接受假设H0即认为总体均值 等于4.55在随机试验中,小概率事件有许多,关键是要找一个能说明问题的小概率事件,由P(A)=同样可确定d本例中,若取最后的检验将出现这样一种倾向越与4.55接近,越要拒绝这样的判别方法显然不合理,错误在于:在H0成立的前提下,这样取小概率事件A不合理在本例中,若设则A:(X1,X2,X10)D是使小概率事件A发生的所有10维样本值(x1,x10)构成的集合则拒绝接受H0等价于一般地,若拒绝接受其中D是n维空间Rn中的区域,则称D为假设H0的拒绝拒绝域域或否定域否定域、临界域临界域.检验中所用的统计
10、量称为检验统计量检验统计量样本观测值(x1,x2,x10)样本观测值(x1,x2,xn)称D的补集 为H0的接受域接受域执行统计判决:求统计量的值,并查表求出有关数据,判断小概率事件是否发生,由此作出判决.提出假设:根据问题的要求,提出原假设H0与对立假设H1,给定显著水平 及样本容量n总结前面例1处理问题的思想与方法,可得处理参数假设检验问题的步骤如下:(1)(2)(3)确定拒绝域:用参数的一个好的估计量 (通常取为 的无偏估计)来代替 ,分析拒绝域D的形式,构造检验统计量g(),在H0成立的前提下确定g()的概率分布,通过等式 确定D.其中确定拒绝域是关键.拒绝域的形式一般由原假设与对立假
11、设共同确定,对同一原假设H0,不同的对立假设所得到的H0的拒绝域可能不同请看下例。例例2 2数据同前面例1,问总体的均值 是否明显大于4.55?在统计学中,只有当 与4.55的偏差大到一定程度时才可认为在本例中,拒绝H0时接受的是 ,因而H0的拒绝取为 较合理此问题的合理假设为解的无偏估计 是 的一个很好的近似值用代替在例8.1中,拒绝H0时接受的是H1:两个数的偏差用其差的绝对值来衡量因而其拒绝域设为较合理 与例1中的拒绝域 不同在H0成立的条件下,事件发生的概率应很小设P(A)=,统计量由得所以拒绝域为所以判决结果为:接受H0三、三、参数假设检验与区间估计的关系参数假设检验与区间估计的关系
12、 参数的区间估计则是找一个随机区间I,使I包含待估参数 是个大概率事件参数假设检验的关键是要找一个确定性的区域(拒绝域),使得当H0成立时,事件是一个小概率事件一旦抽样结果使小概率事件发生,就否定原假设H0对此两类问题,都是利用样本对参数作判断:一个是由小概率事件否定参数 属于某范围,另一个则是依大概率事件确信某区域包含参数 的真值.两者本质上殊途同归,一类问题的解决,导致解决另一类问题类比方案的形成为 的置信区间如设总体已知,给定容量n的样本则参数 的置信度为样本均值为的置信区间为假设检验问题的拒绝域为接受域为时,接受也就是说,当即 在区间内,此区间正是 的置信度习题811何谓统计假设?2试
13、述普通反证法与概率反证法的异同点3试述检验统计假设的步骤4设总体 ,为未知参数,为其一个样本,对下述假设检验问题 取拒绝域为:试求常数c,使得该检验的显著水平为0.05 m第二节第二节 正态总体均值的假设检验正态总体均值的假设检验 本节讨论有关正态总体的均值的假设检验问题构造合适的检验统计量并确定其概率分布是解决检验问题的关键若检验统计量服从标准正态分布(分布,F分布)则所得到的相应检验法称为U 检验法(检验法,F 检验法)一、U 检验法(方差已知)在方差已知的条件下,对一个正态总体的均值或两个正态总体均值差的假设检验常用U 检验法若X1,X2,Xn为取自总体X的样本设总体已知,给定显著水平
14、检验以下不同形式的假设问题:下面我们来求H03的拒绝域前两个为简单假设检验问题,我们已在例1及例2中求出其拒绝域分别为和其中(1)H03的拒绝域形式为等价形式为(k待定)若H03成立,则要控制只需令由此得此处所以H03的拒绝域为(2)比较两种假设检验问题:对于后面将要讨论的有关正态总体的参数假设检验问题也有类似结果可以看出尽管两 者原假设形式不同,实际意义也不一样,但对于相同的显著水平 ,它们的拒绝域是相同的。因此,遇到H03与H13的检验问题,可归结为H02与H12来讨论下面求两个正态总体均值差检验的拒绝域。设总体X与Y相互独立 已知从两总体中分别取容量为n1、n2的样本用 ,分别表示样本均
15、值、给定显著水平检验假设的无偏估计分别为显然,H0的拒绝形式应为 (k待定)由于若H0真,则统计量由得拒绝域为(3)例例1 一种燃料的辛烷等级服从正态分布 ,其平均等级 ,标准差 现抽取25桶新油,测试其等级,算得平均等级为97.7假定标准差与原来一样,问新油的辛烷平均等级是否比原燃料的辛烷平均等级偏低?()解解 按题意需检验假设检验统计量拒绝域(参阅表8-1)查正态分布表得计算统计值执行统计判决故拒绝H0,即认为新油的辛烷平均等级比原燃料辛烷的平均等级确实偏低二、二、t 检验法(方差未知)检验法(方差未知)设总体未知对显著水平 检验假设拒绝域形式(k待定)注意到S2是 的无偏估计,用S代替由
16、于 未知,现在不能用 来作为检验统计量采用作为检验统计量当H0真时,由得所以拒绝域为(4)类似可给出假设的拒绝域为(5)对正态总体关于 的各种形式的假设检验的拒绝域列于表8-1 例例2 一手机生产厂家在其宣传广告中声称他们生产的某种品牌的手机的待机时间的平均值至少为71.5小时,一质检部门检查了该厂生产的这种品牌的手机6部,得到的待机时间为 69,68,72,70,66,75 设手机的待机时间 ,由这些数据能否说明其广告有欺骗消费者之嫌疑?()解解 问题可归结为检验假设由于方差 未知,用t 检验。检验统计量拒绝域计算统计值查t分布表,得统计判决故接受H0,即不能认为该厂广告有欺骗消费者之嫌疑下
17、面求两个正态总体均值相等性检验的拒绝域。设总体独立,未知X1,Xn1取自总体X样本方差为其样本均值为Y1,Yn2取自总体Y其样本均值为 ,样本方差为给定显著水平,检验假设拒绝域形式为(k待定)由第六章第四节例2的结果知:当H0成立时,统计量由得例例3 对用两种不同热处理方法加工的金属材料做抗拉强度试验,得到的试验数据如下:方法:31,34,29,26,32,35,38,34,30,29,32,31 方法:26,24,28,29,30,29,32,26,31,29,32,28 设两种热处理加工的金属材料的抗拉强度都服从正态分布,且方差相等比较两种方法所得金属材料的平均抗拉强度有无显著差异()解解
18、 记两总体的正态分布为本题是要检验假设检验统计量为拒绝域为计算统计值查t分布表,得统计判决:由于故拒绝H0即认为两种热处理方法加工的金属材料的平均抗拉强度有显著差异习题8-21已知某炼铁厂的铁水含量在正常情况下服从正态分布N(4.55,10.82),现在测了5炉铁水,其含碳量为 4.28,4.40,4,42,4.35,4.37 若方差没有变,问总体均值是否有显著变化?()2有一种新安眠剂,据说在一定剂量下能比某种旧安眠剂平均增加睡眠时间3小时.为了检验新安眠剂的这种说法是否正确,收集到一组使用新安眠剂的睡眠时间(单位:h):26.7,22.0,24.1,21.0,27.2,25.0,23.4
19、根据资料,用某种旧安眠剂时平均睡眠时间为20.8h,假设用安眠剂后睡眠时间服从正态分布,试问这组数据能否说明新安眠剂已达到的疗效?()3某单位上年度排出的污水中,某种有害物质的平均含量为0.009%,污水经处理后,本年度抽测16次,得这种有害物质的含量(百分比)为 设有害物质含量服从正态分布,问是否可认为污水经处理后,这种有害物质的含量有显著降低?()0.008,0.007,0.006,0.008,0.009,0.007,0.004,0.007,0.003,0.009,0.010,0.005,0.007,0.009,0.011,0.008,4某弹壳直径 ,规定标准为 (mm),(mm)。某车间
20、新生产一批这种弹壳,已知这批弹壳直径的方差为标准值,但其均值未知,为了检验这批弹壳是否符合要求,抽测9枚弹壳,得直径数据为(单位:mm):试在水平 之下,检验这批弹壳是否合格7.947.917.937.927.927.937.907.947.925如果一个矩形的宽与长之比等于0.618,称这样的矩形为黄金比矩形,这种矩形给人良好的感觉,现代的建筑物构件(如窗架)、工艺品(如图片镜框),甚至司机的驾驶执照、商品的信用卡等都常常采用黄金比矩形.下面列出某工艺品工厂随机抽取的20个矩形的宽与长之比:设这一工厂生产的矩形的宽与长的比值总体服从正态分布 ,试检验 H0:=0.618,0.933,0.57
21、6,0.844,0.570,0.553,0.609,0.601,0.668,0.606,0.611,0.628,0.690,0.606,0.615,0.672,0.662,0.670,0.654,0.749,0.693,6对某种物品在处理前与处理后取样分析其含脂率如下:假定处理前后含脂率都服从正态分布,且它们的方差相等,问处理后平均含脂率有无显著降低?()0.120.200.080.040.190.240.240.070.000.130.15处理后处理后0.270.300.120.080.420.660.300.210.180.19处理前处理前7从两处煤矿各取一样本,测得其含灰率分别为 设矿中
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 莆田学院 概率论与数理统计8 莆田 学院 概率论 数理统计
限制150内