浙江大学概率论与数理统计盛骤第四.pptx
《浙江大学概率论与数理统计盛骤第四.pptx》由会员分享,可在线阅读,更多相关《浙江大学概率论与数理统计盛骤第四.pptx(156页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、11 1 假设检验 统计推断的另一类重要问题是假设检验问题。它包括(1)已知总体分布的形式,但不知其参数的情况,提出参数的假设,并根据样本进行检验.(2)在总体的分布函数完全未知的情况下,提出总体服从某个已知分布的假设,并根据样本进行检验.第1页/共156页2例1 设某种清漆的设某种清漆的9个样品,其干燥时间(以小时计)个样品,其干燥时间(以小时计)分别分别 为:为:6.0 5.7 5.5 6.5 7.0 5.8 5.2 6.1 5.0根据以往经验,干燥时间的总体服从正态分布根据以往经验,干燥时间的总体服从正态分布N(6.0,0.36),现根据样本检验均值是否与以往有显著差异?现根据样本检验均
2、值是否与以往有显著差异?例2 一种摄影药品被其制造商声称其贮藏寿命是均值180天、标准差不多于10天的正态分布。某位使用者担心标准差可能超过10天。他随机选取12个样品并测试,得到样本标准差为14天。根据样本有充分证据证明标准差大于10天吗?例3 孟德尔遗传理论断言,当两个品种的豆杂交时,圆的和黄的、起皱的和黄的、圆的和绿的、起皱的和绿的豆的频数将以比例9:3:3:1发生。在检验这个理论时,孟德尔分别得到频数315、101、108、32、这些数据提供充分证据拒绝该理论吗?第2页/共156页3 参数的假设检验问题处理步骤1.根据实际问题的要求,提出原假设 和备择假设 ;2.根据样本X_i,确定检
3、验统计量T(X_i)以及拒绝域(拒 绝原假设的区域)的形式;3.给定显著性水平,按照“在原假设H0成立时,拒绝原假设的概率不大于显著性水平”这一原则,确定拒绝域;4根据样本观测值作出决策,接受原假设还是拒绝原假设。第3页/共156页4例1 设某种清漆的设某种清漆的9个样品,其干燥时间(以小时计)个样品,其干燥时间(以小时计)分别为:分别为:6.0 5.7 5.5 6.5 7.0 5.8 5.2 6.1 5.0根据以往经验,干燥时间的总体服从正态分布根据以往经验,干燥时间的总体服从正态分布N(6.0,0.36),现根据样本检验均值是否与以往有显著差异?现根据样本检验均值是否与以往有显著差异?由于
4、作出决策的依据是一个样本,因此,可能出现“实际上原假设成立,但根据样本作出拒绝原假设”的决策。这种错误称为“第一类错误”,实际中常常将犯第一类错误的概率控制在一定限度内,即事先给定较小的数(01)(称为显著性水平),使得第4页/共156页5上述检验法则符合实际推断原理。第5页/共156页6注释1:假设检验中的假设检验中的4种可能结果种可能结果通常,犯第一类错误的概率、犯第二类错误的概率、样本容量可以看作为“三方拔河”。决策 原假设H0真的 假的不拒绝H0拒绝H0正确决策 第二类错误第一类错误 正确决策 第一类错误:原假设H0成立时,作出拒绝原假设的决策;第二类错误:备择假设H1成立时,作出接受
5、原假设的决策。第6页/共156页7这是一对矛盾,要同时减少犯第一、第二类错误,只有增大样本容量。第7页/共156页8注释2:假设检验与区间估计的比较。假设检验与区间估计的比较。即拒绝域可以这样得到:将置信区间不等号反向,将原假设成立时的值代入到参数中即可。第8页/共156页9 22 正态总体均值方差的假设检验正态总体均值方差的假设检验第9页/共156页10第10页/共156页11第11页/共156页12 第12页/共156页13例2 某种元件的寿命X(以小时记)服从正态分布 均未知。现测得16只元件的寿命如下:159 280 101 212 224 379 179 264 222 362 16
6、8 250 149 260 485 170问是否有理由认为元件的平均寿命大于225(小时)?(取显著性水平为0.05)t没有落在拒绝域内,故接受原假设,认为元件的平均寿命不大于225小时。第13页/共156页14例3 要求某种元件的平均使用寿命不得低于1000小时,生产者从一批这种元件中随机抽取25件,测得其平均寿命为950小时,标准差为100小时。已知这批元件的寿命服从正态分布。试在显著性水平0.05下确定这批元件是否合格?t落在拒绝域内,故拒绝原假设,认为这批元件的平均寿命小于1000小时,不合格。第14页/共156页15第15页/共156页16第16页/共156页17第17页/共156页
7、18 例4:某厂使用两种不同的原料A,B生产同一类型产品。各在一周的产品中取样分析。取用原料A生产的样品220件,测得平均重量为2.46(公斤),样本标准差s=0.57(公斤)。取用原料B生产的样品205件,测得平均重量为2.55(公斤),样本标准差为0.48(公斤)。设两样本独立,来自两个方差相同的独立正态总体。问在水平0.05下能否认为用原料B的产品平均重量较用原料A的为大。第18页/共156页19 基于成对数据的检验例5:为了试验两种不同谷物种子的优劣,选取了十块土质不同的土地,并将每块土地分为面积相同的两部分,分别种植这两种种子。设在每块土地的两部分人工管理等条件完全一样。下面给出各块
8、土地上的产量。土地 1 2 3 4 5 6 7 8 9 10种子A(xi)23 35 29 42 39 29 37 34 35 28种子B(yi)26 39 35 40 38 24 36 27 41 27di=xi-yi -3 -4 -6 2 1 5 1 7 -6 1问:以这两种种子种植的谷物产量是否有显著的差异(取显著性水平为0.05)?第19页/共156页20 第20页/共156页21第21页/共156页22 第22页/共156页23(四)两个正态总体方差的检验第23页/共156页24 例7:两台机床生产同一个型号的滚珠,从甲机床生产的滚珠中 抽取8个,从乙机床生产的滚珠中抽取9个,测得这
9、些滚珠 的直径(毫米)如下:甲机床 15.0 14.8 15.2 15.4 14.9 15.1 15.2 14.8 乙机床 15.2 15.0 14.8 15.1 14.6 14.8 15.1 14.5 15.0第24页/共156页25第25页/共156页26第26页/共156页待估参数 原假设枢轴量 检验统计量 分 布置信区间拒绝域 一个正态总体两个正态总体正态总体均值、方差的置信区间与假设检验第27页/共156页28 定义 若C是参数的某检验问题的一个检验法,称为检验法C的施行特征函数或OC函数,其图形称为OC曲线。33 样本容量的选取样本容量的选取第28页/共156页29 1。Z检验法的
10、OC函数第29页/共156页30第30页/共156页31第31页/共156页32 例8(工业产品质量抽验方案)设有一大批产品,产品质量指标X服从 。以小者为佳,厂方要求所确定的验收方案对高质量的产品 能以高概率1为买方所接受。买方则要求低质产品 能以高概率1被拒绝。,有厂方与买方协商给出。并采取一次抽样以确定该批产品是否为买方所接受。问应怎样安排抽样方案。已知 且由工厂长期经验知 。经商定=0.05。第32页/共156页33 2。t检验法的OC函数第33页/共156页34第34页/共156页35 第35页/共156页364.4.分布拟合检验分布拟合检验 前面介绍的各种检验法都是在总体服从正态分
11、布前提下,对参数进行假设检验的。实际中可能遇到这样的情形,总体服从何种理论分布并不知道,要求我们直接对总体分布提出一个假设。例如,要检验在计算机上产生随机数的一个程序。指令该程序产生0到9之间的100个单个数字。观察整数的频数如下表。那么以0.05的显著性水平,有充分的理由相信该批整数不是均匀产生的吗?整数 0 1 2 3 4 5 6 7 8 9频数 11 8 7 7 10 10 8 11 14 14第36页/共156页37 例如,从1500到1931年的432年间,每年爆发战争的次数可以看作一个随机变量,据统计,这432年间共爆发了299次战争,具体数据如下:战争次数X 0 1 2 3 4发
12、生 X次战争的年数 223 142 48 15 4 通常假设每年爆发战争的次数服从泊松分布。那么上面的数据是否有充分的理由推翻每年爆发战争的次数服从泊松分布假设?第37页/共156页38它是在总体X 的分布未知时,根据来自总体的样本,检验关于总体分布的假设的一种检验方法。(一)拟合检验法第38页/共156页39第39页/共156页40第40页/共156页41第41页/共156页42战争次数X 0 1 2 3 4发生 X次战争的年数 223 142 48 15 4 例1,从1500到1931年的432年间,每年爆发战争的次数可以看作一个随机变量,据统计,这432年间共爆发了299次战争,具体数据
13、如下:通常假设每年爆发战争的次数服从泊松分布。那么上面的数据是否有充分的理由推翻每年爆发战争的次数服从泊松分布假设?战争次数x 0 1 2 3 4实测频数 223 142 48 15 4概率估计 0.502 0.346 0.119 0.027 0.006理论频数 217 149 51 12 3第42页/共156页43战争次数x 0 1 2 3 4实测频数 223 142 48 15 4概率估计 0.502 0.346 0.119 0.027 0.006理论频数 217 149 51第43页/共156页44 例2 孟德尔遗传理论断言,当两个品种的豆杂交时,圆的和黄的、起皱的和黄的、圆的和绿的、起
14、皱的和绿的豆的频数将以比例9:3:3:1发生。在检验这个理论时,孟德尔分别得到频数315、101、108、32、这些数据提供充分证据拒绝该理论吗?豆子状态x 1 2 3 4实测频数 315 101 108 32 概率 9/16 3/16 3/16 1/16理论频数 312.75 104.25 104.25 34.75第44页/共156页45141141 148148132132 138138154154142142150150146146155155158158150150 140140147147 148148144144 1501501491491451451491491581581431
15、43141141144144 144144126126 140140144144 142142141141140140145145135135147147146146141141 136136140140 146146142142 137137148148154154137137139139143143140140131131 143143141141 149149148148 135135148148152152143143144144141141143143147147 146146150150 132132142142 1421421431431531531491491461461491
16、49138138142142 149149142142 137137134134 144144146146147147140140142142140140137137152152 145145 例3下面列出了84个伊特拉斯坎(Etruscan)人男子的头颅的最大宽度(mm),试检验这些数据是否来自正态总体(取=0.1)第45页/共156页46解为粗略了解数据的分布情况,先画出直方图。步骤如下:1.找出数据的最小值、最大值为126、158,取区间124.5,159.5,它能覆盖126,158;2.将区间124.5,159.5等分为7个小区间,小区间的长度=(159.5-124.5)/7=5,称为
17、组距,小区间的端点称为组限,建立下表:组组 限限频数 fi频率率 fi/n累累计频率率124.5-129.5124.5-129.5129.5-134.5129.5-134.5134.5-139.5134.5-139.5139.5-144.5139.5-144.5144.5-149.5144.5-149.5149.5-154.5149.5-154.5154.5-159.5154.5-159.51 14 41010333324249 93 30.01190.01190.04760.04760.11910.11910.39290.39290.28570.28570.10710.10710.03570
18、.03570.01190.01190.05950.05950.17860.17860.57150.57150.85720.85720.95240.95241 1第46页/共156页473.自左向右在各小区间上作以fi/n为高的小矩形 如下图,即为直方图。注:直方图的小区间可以不等长,但小区间的长度不能太大,否则平均化作用突出,淹没了密度的细节部分;也不能太小,否则受随机化影响太大,产生极不规则的形状。第47页/共156页48从本例的直方图看,有一个峰,中间高,两头低,较对称,样本象来自正态总体。于是检验第48页/共156页49 x129.5 x129.5129.5x134.5129.5x134
19、.5134.5x139.5134.5x139.5139.5x144.5139.5x144.5144.5x149.5144.5x149.5149.5x154.5149.5x154.5154.5x154.5x2)个水平,n个对象参与了试验。假定对应于因素第j个水平的组中有个试验对象,响应变量数据为通常假定第71页/共156页72检验假设假设等价于第72页/共156页73(二)平方和分解第73页/共156页74证明:第74页/共156页75第75页/共156页76第76页/共156页77方差来源平方和自由度均方F比因素As-1误差n-s总和n-1单因素试验方差分析表第77页/共156页78第78页/
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 浙江大学 概率论 数理统计 第四
限制150内