浙江大学概率论与数理统计(盛骤-第四版).ppt
《浙江大学概率论与数理统计(盛骤-第四版).ppt》由会员分享,可在线阅读,更多相关《浙江大学概率论与数理统计(盛骤-第四版).ppt(157页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、 数 理 统 计1第八章假设检验关键词:假设检验正态总体参数的假设检验分布拟合检验秩和检验21 假设检验统计推断的另一类重要问题是假设检验问题。它包括(1)已知总体分布的形式,但不知其参数的情况,提出参数的假设,并根据样本进行检验.(2)在总体的分布函数完全未知的情况下,提出总体服从某个已知分布的假设,并根据样本进行检验.3例1设某种清漆的9个样品,其干燥时间(以小时计)分别为:6.05.75.56.57.05.85.26.15.0根据以往经验,干燥时间的总体服从正态分布N(6.0,0.36),现根据样本检验均值是否与以往有显著差异?例2一种摄影药品被其制造商声称其贮藏寿命是均值180天、标准
2、差不多于10天的正态分布。某位使用者担心标准差可能超过10天。他随机选取12个样品并测试,得到样本标准差为14天。根据样本有充分证据证明标准差大于10天吗?例3孟德尔遗传理论断言,当两个品种的豆杂交时,圆的和黄的、起皱的和黄的、圆的和绿的、起皱的和绿的豆的频数将以比例9:3:3:1发生。在检验这个理论时,孟德尔分别得到频数315、101、108、32、这些数据提供充分证据拒绝该理论吗?4 参数的假设检验问题处理步骤1.根据实际问题的要求,提出原假设和备择假设;2.根据样本X_i,确定检验统计量T(X_i)以及拒绝域(拒绝原假设的区域)的形式;3.给定显著性水平,按照“在原假设H0成立时,拒绝原
3、假设的概率不大于显著性水平”这一原则,确定拒绝域;4根据样本观测值作出决策,接受原假设还是拒绝原假设。5例1设某种清漆的9个样品,其干燥时间(以小时计)分别为:6.05.75.56.57.05.85.26.15.0根据以往经验,干燥时间的总体服从正态分布N(6.0,0.36),现根据样本检验均值是否与以往有显著差异?由于作出决策的依据是一个样本,因此,可能出现“实际上原假设成立,但根据样本作出拒绝原假设”的决策。这种错误称为“第一类错误”,实际中常常将犯第一类错误的概率控制在一定限度内,即事先给定较小的数(01)(称为显著性水平),使得6上述检验法则符合实际推断原理。7注释1:假设检验中的4种
4、可能结果通常,犯第一类错误的概率、犯第二类错误的概率、样本容量可以看作为“三方拔河”。决策原假设H0真的假的不拒绝H0拒绝H0正确决策第二类错误第一类错误正确决策第一类错误:原假设H0成立时,作出拒绝原假设的决策;第二类错误:备择假设H1成立时,作出接受原假设的决策。8这是一对矛盾,要同时减少犯第一、第二类错误,只有增大样本容量。9注释2:假设检验与区间估计的比较。即拒绝域可以这样得到:将置信区间不等号反向,将原假设成立时的值代入到参数中即可。102 正态总体均值方差的假设检验11121314例2某种元件的寿命X(以小时记)服从正态分布均未知。现测得16只元件的寿命如下:15928010121
5、2224379179264160222362168250149260485170问是否有理由认为元件的平均寿命大于225(小时)?(取显著性水平为0.05)t没有落在拒绝域内,故接受原假设,认为元件的平均寿命不大于225小时。15例3要求某种元件的平均使用寿命不得低于1000小时,生产者从一批这种元件中随机抽取25件,测得其平均寿命为950小时,标准差为100小时。已知这批元件的寿命服从正态分布。试在显著性水平0.05下确定这批元件是否合格?t落在拒绝域内,故拒绝原假设,认为这批元件的平均寿命小于1000小时,不合格。16171819 例4:某厂使用两种不同的原料A,B生产同一类型产品。各在一
6、周的产品中取样分析。取用原料A生产的样品220件,测得平均重量为2.46(公斤),样本标准差s=0.57(公斤)。取用原料B生产的样品205件,测得平均重量为2.55(公斤),样本标准差为0.48(公斤)。设两样本独立,来自两个方差相同的独立正态总体。问在水平0.05下能否认为用原料B的产品平均重量较用原料A的为大。20 基于成对数据的检验例5:为了试验两种不同谷物种子的优劣,选取了十块土质不同的土地,并将每块土地分为面积相同的两部分,分别种植这两种种子。设在每块土地的两部分人工管理等条件完全一样。下面给出各块土地上的产量。土地 1 2 3 4 5 6 7 8 9 10种子A(xi)23 35
7、 29 42 39 29 37 34 35 28种子B(yi)26 39 35 40 38 24 36 27 41 27di=xi-yi -3 -4 -6 2 1 5 1 7 -6 1问:以这两种种子种植的谷物产量是否有显著的差异(取显著性水平为0.05)?21 2223 24(四)两个正态总体方差的检验25 例7:两台机床生产同一个型号的滚珠,从甲机床生产的滚珠中 抽取8个,从乙机床生产的滚珠中抽取9个,测得这些滚珠 的直径(毫米)如下:甲机床 15.0 14.8 15.2 15.4 14.9 15.1 15.2 14.8 乙机床 15.2 15.0 14.8 15.1 14.6 14.8
8、15.1 14.5 15.0262728待估参数 原假设枢轴量 检验统计量 分 布置信区间拒绝域 一个正态总体两个正态总体正态总体均值、方差的置信区间与假设检验定义若C是参数的某检验问题的一个检验法,称为检验法C的施行特征函数或OC函数,其图形称为OC曲线。3 样本容量的选取301。Z检验法的OC函数313233 例8(工业产品质量抽验方案)设有一大批产品,产品质量指标X服从 。以小者为佳,厂方要求所确定的验收方案对高质量的产品 能以高概率1为买方所接受。买方则要求低质产品 能以高概率1被拒绝。,有厂方与买方协商给出。并采取一次抽样以确定该批产品是否为买方所接受。问应怎样安排抽样方案。已知 且
9、由工厂长期经验知 。经商定=0.05。342。t检验法的OC函数3536 374.分布拟合检验 前面介绍的各种检验法都是在总体服从正态分布前提下,对参数进行假设检验的。实际中可能遇到这样的情形,总体服从何种理论分布并不知道,要求我们直接对总体分布提出一个假设。例如,要检验在计算机上产生随机数的一个程序。指令该程序产生0到9之间的100个单个数字。观察整数的频数如下表。那么以0.05的显著性水平,有充分的理由相信该批整数不是均匀产生的吗?整数0123456789频数118771010811141438 例如,从1500到1931年的432年间,每年爆发战争的次数可以看作一个随机变量,据统计,这4
10、32年间共爆发了299次战争,具体数据如下:战争次数X 0 1 2 3 4发生X次战争的年数 223 142 48 15 4 通常假设每年爆发战争的次数服从泊松分布。那么上面的数据是否有充分的理由推翻每年爆发战争的次数服从泊松分布假设?39它是在总体X 的分布未知时,根据来自总体的样本,检验关于总体分布的假设的一种检验方法。(一)拟合检验法40414243战争次数X 0 1 2 3 4发生X次战争的年数 223 142 48 15 4 例1,从1500到1931年的432年间,每年爆发战争的次数可以看作一个随机变量,据统计,这432年间共爆发了299次战争,具体数据如下:通常假设每年爆发战争的
11、次数服从泊松分布。那么上面的数据是否有充分的理由推翻每年爆发战争的次数服从泊松分布假设?战争次数x01234实测频数22314248154概率估计0.5020.3460.1190.0270.006理论频数2171495112344战争次数x01234实测频数22314248154概率估计0.5020.3460.1190.0270.006理论频数2171495145 例2孟德尔遗传理论断言,当两个品种的豆杂交时,圆的和黄的、起皱的和黄的、圆的和绿的、起皱的和绿的豆的频数将以比例9:3:3:1发生。在检验这个理论时,孟德尔分别得到频数315、101、108、32、这些数据提供充分证据拒绝该理论吗?
12、豆子状态x1234实测频数31510110832概率9/163/163/161/16理论频数312.75104.25104.2534.75461411481321381541421501461551581501401471481441501491451491581431411441441261401441421411401451351471461411361401461421371481541371391431401311431411491481351481521431441411431471461501321421421431531491461491381421491421371341441
13、46147140142140137152145 例3下面列出了84个伊特拉斯坎(Etruscan)人男子的头颅的最大宽度(mm),试检验这些数据是否来自正态总体(取=0.1)47解为粗略了解数据的分布情况,先画出直方图。步骤如下:1.找出数据的最小值、最大值为126、158,取区间124.5,159.5,它能覆盖126,158;2.将区间124.5,159.5等分为7个小区间,小区间的长度=(159.5-124.5)/7=5,称为组距,小区间的端点称为组限,建立下表:组组 限限频数频数 fi频率频率 fi/n累计频率累计频率124.5-129.5129.5-134.5134.5-139.513
14、9.5-144.5144.5-149.5149.5-154.5154.5-159.514103324930.01190.04760.11910.39290.28570.10710.03570.01190.05950.17860.57150.85720.95241483.自左向右在各小区间上作以fi/n为高的小矩形 如下图,即为直方图。注:直方图的小区间可以不等长,但小区间的长度不能太大,否则平均化作用突出,淹没了密度的细节部分;也不能太小,否则受随机化影响太大,产生极不规则的形状。49从本例的直方图看,有一个峰,中间高,两头低,较对称,样本象来自正态总体。于是检验50 x129.5129.5x
15、134.5134.5x139.5139.5x144.5144.5x149.5149.5x154.5154.5x2)个水平,n个对象参与了试验。假定对应于因素第j个水平的组中有个试验对象,响应变量数据为通常假定73检验假设假设等价于74(二)平方和分解75证明:767778方差来源平方和自由度均方F比因素As-1误差n-s总和n-1单因素试验方差分析表7980例1设有5种治疗荨麻疹的药,要比较它们的疗效。假设将30个病人分成5组,每组6人,令同组病人使用一种药,并记录病人从使用药物开始到痊愈所需时间,得到下面的记录:(=0.05)药物x治愈所需天数y15,8,7,7,10,824,6,6,3,5
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 浙江大学 概率论 数理统计 盛骤 第四
限制150内