概率论与数理统计教师用教案概率统计教案7章第3-4节.pdf
概率论与数理统计教案 第七章第三、四节 郑一,戚云松,陈倩华,陈健 编著 大连理工大学出版社出版 概率论与数理统计教案 第七章第三、四节 郑一,戚云松,陈倩华,陈健 编著 大连理工大学出版社出版 第第 240 页页 题目 与 课时题目 与 课时 第三节 区间估计 第四节 正态总体均值与方差的区间估计 课时:2.5 教学目的 教学目的 (1) 理解区间估计的概念; (2) 会求单个正态总体均值与方差的置信区间; (3) 会求两个正态总体均值差与方差比的置信区间. 内容 内容 置信区间的基本概念. 教学重点 教学重点 解决办法 解决办法 加强置信区间的基本概念的讲解与讲评,配备相关知识的例题详细讲解,布置作业训练巩固. 内容 内容 正态总体均值和方差在给定置信水平条件下的置信区间的求法. 教学难点 教学难点 解决办法 解决办法 加大难点知识的分析,加大例题讲解力度. 教学辅助 教学辅助 利用多媒体课件,板书配合分析. 习题布置 习题布置 P184:1、4; P193:1、3、4、7. 参考文献 参考文献 1 郑一,王玉敏,冯宝成. 概率论与数理统计. 大连理工大学出版社, 2015 年 8 月. 2 郑一,戚云松,王玉敏. 概率论与数理统计学习指导书. 大连理工大 学出版社,2015 年 8 月. 3 郑一,戚云松,陈倩华,陈健. 光盘:概率论与数理统计教案 作业册 与试卷考题及答案、数学实验视频. 大连理工大学出版社,2015 年 8 月. 4 王玉敏,郑一,林强. 概率论与数理统计教学实验教材. 中国科学技术 出版社, 2007 年 7 月. 联系方式: 概率论与数理统计教案 第七章第三、四节 郑一,戚云松,陈倩华,陈健 编著 大连理工大学出版社出版 概率论与数理统计教案 第七章第三、四节 郑一,戚云松,陈倩华,陈健 编著 大连理工大学出版社出版 第第 241 页页 教 学 内 容 教学笔记 教 学 内 容 教学笔记 内容简介内容简介 对于总体未知参数,除了求出它的点估计外,我们还希望估计出一个范围,并希望知道这个范围包含参数真值的可信程度,这样的范围通常以区间的形式给出,就是所谓的置信区间. 在第四节中详细给出了正态总体均值和方差的置信区间的求法. 预备知识 预备知识 统计量,分位点,样本及样本值,总体均值,总体方差,正态总体. 第三节 区间估计 第三节 区间估计 教师教学建议: (1)利用样本来研究总体的信息或特征是解决问题的一个方向,已知方法有点估计,能不能用区间估计呢? (2)教学问题引入: 1)怎样考察估计量的可信程度与精确程度呢? 2)怎样求未知参数的区间估计呢? 对于未知参数, 除了求出它的点估计外, 我们还希望估计出一个范围, 并希望知道这个范围包含参数真值的可信程度. 这样的范围通常以区间的形式给出, 同时还给出此区间包含参数真值的可信程度. 这种形式的估计称为区间估计区间估计, 这样的区间就是所谓的置信区间置信区间. 一、置信区间 定义 设总体一、置信区间 定义 设总体 X 的分布函数的分布函数);(xF中含有一个未知参数中含有一个未知参数, , ( (是未知参数是未知参数可能取值的范围), 对于给定的正数可能取值的范围), 对于给定的正数) 10(, 若由总体, 若由总体 X 的样本的样本12,nXXX确定的两个统计量 确定的两个统计量 = =( (12,nXXX) 和 ) 和 = =( (12,nXXX) 成立) 成立, 且对于任意的, 且对于任意的满足 满足 1212 (,)(,) 1nnPX XXX XX. (3.1) 则称随机区间( 则称随机区间(, ,)是)是的置信水平为的置信水平为 1- - 的置信区间的置信区间( (confidence interval), ), 和和分别称为置信水平为分别称为置信水平为1的双侧置信区间的置信下限和置的双侧置信区间的置信下限和置信上限信上限, , 1称为置信水平(称为置信水平(confidence level). ). 讲评 讲评 (1)应注意,(3.1) 式表示随机区间(,)包含的概率不低于1, 而 概率论与数理统计教案 第七章第三、四节 郑一,戚云松,陈倩华,陈健 编著 大连理工大学出版社出版 概率论与数理统计教案 第七章第三、四节 郑一,戚云松,陈倩华,陈健 编著 大连理工大学出版社出版 第第 242 页页 不能解释为落在随机区间(,)内的概率不低于1. 这是因为(,)是一个随机区间, 而是一个客观存在的数. 例如, 若P0.95, 可理解为: 若从总体中取 100 个样本观察值, 我们得到 100 个确定的区间(,), 其中平均有 95 个区间包含了未知参数的真值, 大约有 5 个区间不包含的真值. (2)通常取很小的正数,它代表进行区间估计时所犯错误的小概率, 比如0.1,0.05等. 一般来说, 如果越小, 则区间(,)包含的可信程度越大, 但这个区间也就越宽, 从而估计的误差也就越大,也就是估计的精度越低. 二、区间估计及其性能指标分析 例二、区间估计及其性能指标分析 例 7.3.1 设总体XN(,2),2为已知,为未知, 12,nXXX是来自总体X的样本, 求的置信水平为1的置信区间. 教学建议: (1) 此例是区间估计方法形成的首例, 要讲清楚解决问题的思路和求解步骤. (2) 置信区间公式应该熟记. 解解 因为X是的无偏估计, 且有/XnN(0, 1). /Xn服从的标准正态分布 N(0, 1)不依赖于任何未知参数. 参见图 7-1, 按标准正态分布上分位点的定义, 图 7-1 标准正态分布双侧置信区间 我们可取 /2/XPzn=1, 即 /2/2P XzXznn=1. 这样, 我们得到了的置信水平为1的一个置信区间 概率论与数理统计教案 第七章第三、四节 郑一,戚云松,陈倩华,陈健 编著 大连理工大学出版社出版 概率论与数理统计教案 第七章第三、四节 郑一,戚云松,陈倩华,陈健 编著 大连理工大学出版社出版 第第 243 页页 /2/2,XzXznn(). (3.2) 这样的置信区间也常简写成 /2Xzn(). (3.3) 如果我们取4, n=25, 同时取0.01, 查表得/20.0052.575zz,则得到一个置信水平为1=0.99 的置信区间 42.57525X (), 即 (2.06,2.06)XX. 由此可见,由于样本均值X是一个随机变量, 故(2.06,2.06)XX是 一个随机区间. 若由一组样本值算得样本均值的观察值3.62x , 则我们得到一个具体的置信区间(1.56, 5.68). 该区间包含的可信程度为 1-0.01=0.99. 讲评 讲评 (1) 此题在处理方法上具有普遍性,提示读者要自己分解解题过程; (2) (3.3)式作为结论使用,前提是:正态总体的方差已知. 要注意,在相同的置信水平1下, 所得置信区间并不唯一. 事实上, 如果我们又令(参见图 7-1) 0.0010.0090.99/XPzzn, 即 0.0090.0010.99P XzXznn, 得到另一个置信区间 0.0090.001,XzXznn(), 这个区间也是的置信水平同样是1=0.99 的一个置信区间. 我们分析一下这两个置信区间的估计误差: 第一个置信区间长度为 0.00525.15znn, 而第二个置信区间的长度为 0.0010.009()5.375zznn. 很明显, 前面给出的置信区间短一些, 即估计误差小,或说估计精确程度高, 所以前一个置信区间更优. 例例 7.3.2 深入解读上例:考察置信区间/ 2/ 2,XzXznn(). (1) 求置信区间的长度L. 概率论与数理统计教案 第七章第三、四节 郑一,戚云松,陈倩华,陈健 编著 大连理工大学出版社出版 概率论与数理统计教案 第七章第三、四节 郑一,戚云松,陈倩华,陈健 编著 大连理工大学出版社出版 第第 244 页页 (2) 估计使置信区间的长度不大于 L 的样本容量n. 建议:(1) 此例是区间估计涉及的估计精度和试验设计的试验次数; (2) 建议学生自看. 寻求未知参数的置信区间的具体做法如下: (1) 寻求一个样本12,nXXX的函数 12(,; )nWW XXX, 它包含未知参数, 而不含其它未知参数, 并且W的分布已知且不依赖于任何未知参数(也不依赖于未知参数); (2) 对于给定的置信水平1, 定出两个常数ba, 使 aP12(,; )nW XXXb1; (3) 从a12(,; )nW X XXb得到等价的不等式, 其中 =(12,nXXX), =(12,nXXX) 都是统计量, 那么(,)就是的置信水平为1的一个置信区间. 思考题思考题 1. 怎样理解置信区间和总体未知参数的关系? 2. 置信水平、结论可靠度和估计精确度的关系如何? 解题参考解题参考 1. 置信区间和总体未知参数的关系是: 置信区间(,)包含总体未知参数的概率不低于置信水平1, 而不能解释为总体未知参数落在随机区间(,)内的概率不低于置信水平1. 2. 置信水平、结论可靠度和估计精确度的关系:一般来说, 如果给定的常数越小,即置信水平1越大,则置信区间(,)包含的可靠度越大, 但这个区间也就越宽, 从而估计的误差也就越大,即估计的精确度越低. 第四节 正态总体均值与方差的区间估计第四节 正态总体均值与方差的区间估计 教师教学建议: (1)根据第五章中心极限定理知,正态分布具备“中心”的地位. (2)教学问题引入: 1)正态总体方差2为未知时如何分析未知参数的置信区间呢? 2)对两个正态总体如何分析总体均值差以及方差比的置信区间呢? 一、 单个正态总体一、 单个正态总体N(,2)的情形的情形 设给定置信水平为1, 并设12,nXXX为取自总体X的样本, 且总体XN(,2), X和2S分别是样本均值和样本方差. 1. 总体均值总体均值的置信区间的置信区间 概率论与数理统计教案 第七章第三、四节 郑一,戚云松,陈倩华,陈健 编著 大连理工大学出版社出版 概率论与数理统计教案 第七章第三、四节 郑一,戚云松,陈倩华,陈健 编著 大连理工大学出版社出版 第第 245 页页 (1) 总体方差 总体方差2已知时 已知时 由上节例题 7.3.1 知道, 利用/XnN(0, 1)样本函数, 已得到的置信水平为1的一个置信区间为 /2/2,XzXznn(). (4.1) 例例7.4.1 某 车 间 生 产 滚 珠 , 从 长 期 实 践 知 , 滚 珠 直 径22( ,),0.04XN . 从当天生产的产品中任取 6 个, 量得直径(单位: mm)如下: 14.70,15.21,14.90,14.91,15.32,15.32. 求此车间生产的滚珠直径的均值的置信区间(0.05)取. 教学建议: (1)题型是:正态总体,方差已知. (2)以后涉及到一些实际问题,嘱咐学生要从中学习“提出问题、分析问题和解决问题”的过程或方法,以培养自身的学习能力. (3)以后例题类似分析,不再多叙. 解解 由 (4.1)式知, 当2已知时均值的置信区间为 /2/2,XzXznn(). 由 6 个观测值计算得到样本均值15.06x. 对于0.05,查表得0.0251.96z. 所以均值 的置信水平为 0.95 的置信区间为 (14.9,15.22). 讲评讲评 (1) 此例是研究单个正态总体方差已知时的关于均值的区间估计问题,在实际问题中比较常见. (2) 结论“均值 的置信水平为 0.95 的置信区间为(14.9,15.22)”的实际意义是:在正态总体方差20.04条件下,该总体均值大小为 14.915.22,此结论的可信度达到 95%. (3)若以此区间内任一值作为的近似值,其估计误差不大于 0.261.962=0.320 1(mm), 这个误差的可信程度为 95%. (4) 注意查0.0251.96z:利用关系式0.025()1 0.0250.975z ,反查 概率论与数理统计教案 第七章第三、四节 郑一,戚云松,陈倩华,陈健 编著 大连理工大学出版社出版 概率论与数理统计教案 第七章第三、四节 郑一,戚云松,陈倩华,陈健 编著 大连理工大学出版社出版 第第 246 页页 表(见教材附表 4)得到0.0251.96z. (2) 总体方差 总体方差2未知时 未知时 此时, 正态总体方差2未知, 因此不能利用(4.1)式给出的置信区间, 这是因为其中含未知参数2. 考虑到样本方差2S是总体方差2的无偏估计, 将/Xn中的 换成S=2S, 由第六章第三节抽样分布定理 1 知, 样本函数 /XSn) 1( nt, 并且) 1( nt分布不依赖于任何未知参数. 参见 t 分布概率密度的对称性(见图 7-2), 图 7-2 t 分布的双侧置信区间 我们取 /2/2(1)(1)/XPtntnSn=1, 也就是 /2/2(1)(1)SSP XtnXtnnn=1. 这样, 我们得到了总体方差未知时的的置信水平为1的一个置信区间 / 2/2(1),(1)SSXtnXtnnn(). (4.2) 例例 7.4.2 有一大批糖果. 现从中随机地取 16 袋, 称得重量(单位:g)如下: 506, 508, 499, 503, 504, 510, 497, 512, 514, 505, 493, 496, 506, 502, 509, 496. 设袋装糖果的重量服从正态分布, 试求总体均值的置信水平为 0.95 的置信区间. 教学建议: (1) 题型是:正态总体,方差未知. (2) 此类型更加符合实际应用问题. (3) 用 MATLAB 计算可以看出 MATLAB 的强大功能, 建议学生好好结合此例学好 MATLAB 工具软件. 不会的,到网上去查解决办法. 概率论与数理统计教案 第七章第三、四节 郑一,戚云松,陈倩华,陈健 编著 大连理工大学出版社出版 概率论与数理统计教案 第七章第三、四节 郑一,戚云松,陈倩华,陈健 编著 大连理工大学出版社出版 第第 247 页页 解解 分析题设,可知正态总体方差未知,用(4.2)式求解. 因1=0.95,0.0252,151n, 查表得到0.025(15)2.1315t. 由给出的数据算得 75.503x,6.202 2s . 利用(4.2)式, 总体均值的置信水平为 0.95 的置信区间为 6.202 2(503.752.1315)16, 即 (500.4, 507.1). 讲评 讲评 (1) 此例是研究一个正态总体方差未知时的关于均值的区间估计问题,在实际问题中最为常见、常用. 提示读者一定给以重视. (2) 结论“均值的置信水平为 0.95 的置信区间为(500.4, 507.1)”的实际意义是:在正态总体方差未知的条件下,该总体均值大小为 500.4507.1,此结论的可信度达到 95%. (3) 若以此区间内任一值作为的近似值, 其估计误差不大于 6.2022162.131 52=6.61(g), 这个误差的可信程度为 95%. 2. . 总体方差总体方差2的置信区间的置信区间 根据实际问题的已知条件和需求, 在此我们只介绍总体期望未知的情况. 因为样本方差2S为总体方差2的无偏估计, 由第六章第三节抽样分布定理 1 知, 22) 1(Sn) 1(2n, 并且分布2(1)n不依赖于任何未知参数. 图 7-3 2分布双侧置信区间 参见 2分布的概率密度的图像(见图 7-3),我们仍取概率对等的分位点来确定置信区间, 就是令 概率论与数理统计教案 第七章第三、四节 郑一,戚云松,陈倩华,陈健 编著 大连理工大学出版社出版 概率论与数理统计教案 第七章第三、四节 郑一,戚云松,陈倩华,陈健 编著 大连理工大学出版社出版 第第 248 页页 P2221/2/22(1)(1)(1)1nSnn . 变形得到 P22222/21/2(1)(1)1(1)(1)nSnSnn . 因此, 方差2的置信水平为 1的一个置信区间为 2222/21/2(1)(1),(1)(1)nSnSnn(). (4.3) 同时, 还得到标准差的置信水平为 1的一个置信区间 22/21/211,(1)(1)nSnSnn(). (4.4) 注意注意 在概率密度图像不对称时, 如2分布和 F 分布, 习惯上仍取概率对等的分位点来确定置信区间, 但这样确定的置信区间的长度并不一定最短. 求最短置信区间的计算过于麻烦, 在实际应用时一般不去求解. 例例 7.4.3 假设某种香烟的尼古丁含量服从正态分布. 现随机抽取此种香烟 8 支为一组样本, 测得其尼古丁平均含量为 18.6 mg, 样本标准差 s=2.4 mg. 试求此种香烟尼古丁含量的总体方差的置信水平为 0.99 的置信区间,(已知20.995(7)0.989x) 教学建议: 题型是:正态总体,均值未知,求解关于方差或标准差的置信区间. 解 解 已知 n=8, s2 =2.42. 由置信水平 0.99 得 = 0.01, 查表可得 22/20.005(1)(7)20.278n, 2210.9952(1)(7)0.989n. 所以方差 2的置信区间为 2222122(1)(1)(,)(1)(1)nsnsnn22(81)2.4(81)2.4(,)20.2780.989=(1.988, 40.768). 讲评 讲评 (1) 此例是研究一个正态总体的均值未知时的关于均方差的大小问题,在实际问题中比较常见. (2)结论“总体方差的置信水平为 0.99 的置信区间为)”的实际意义是:在正态总体的均值未知条件下, 区间(1.998,40.768)包含了总体方差的可信度达到 99%;该总体标准差或均方差大小为 1.99840.768,此结论的可信度达到 99%. 概率论与数理统计教案 第七章第三、四节 郑一,戚云松,陈倩华,陈健 编著 大连理工大学出版社出版 概率论与数理统计教案 第七章第三、四节 郑一,戚云松,陈倩华,陈健 编著 大连理工大学出版社出版 第第 249 页页 二、 两个正态总体二、 两个正态总体N(1,21),N(2,22)的情形 的情形 教学建议: (1)两个正态总体均值差和方差比的区间估计在实际应用问题和科技论文写作中更加实用. (2)但限于学时少的限制,这部分内容往往不讲,而建议学生自学例题求解. 设已给定置信水平为1, 并且设112,nXXX是来自第一个正态总体XN(1,21)的样本; 212,nY YY是来自第二个正态总体 YN(2,22)的样本, 这两个样本相互独立. 再设X, Y分别为第一、第二个总体的样本均值, 21S, 22S分别是第一、第二个总体的样本方差. 1. 两个正态总体均值差两个正态总体均值差1- -2的置信区间的置信区间 (1) 两总体方差两总体方差21,22均已知时均已知时 因样本均值X,Y分别为总体均值1,2的无偏估计, 故X-Y是1-2的无偏估计. 由X,Y的独立性以及第六章第三节抽样分布定理 1 有 XN(1,211n),YN(2,222n), 所以得 X-YN(1-2, 121n+222n). 将其标准化, 得到 22212121)()(nnYXN(0, 1). 类同于(4.1)式推导过程, 我们即得1-2的置信水平为1的一个置信区间 22221212/2/21212XYzXYznnnn,(). (4.5) (2) 两总体方差两总体方差21=22=2, 但但2未知时未知时 由第六章第三节抽样分布的定理 2 知 1212()()11wXYSnn)2(21nnt, 其中222112212(1)(1)2wnSnSSnn, wS=2wS. 类同于(4.2)式推导过程, 我们可得1-2的置信水平为1的一个置信区间 概率论与数理统计教案 第七章第三、四节 郑一,戚云松,陈倩华,陈健 编著 大连理工大学出版社出版 概率论与数理统计教案 第七章第三、四节 郑一,戚云松,陈倩华,陈健 编著 大连理工大学出版社出版 第第 250 页页 /212/21212121111(2),(2)wwXYtnnSXYtnnSnnnn(). (4.6) 2. 两个正态总体方差比两个正态总体方差比2122的置信区间的置信区间 考虑到实际问题的需要, 我们在这里还是只讨论总体均值1,2未知时的情况. 由第六章第三节抽样分布定理 2 知 22122212/SS) 1, 1(21nnF, 并且分布12(1,1)F nn不依赖于任何未知参数. 参见 F 分布的概率密度的图像(见图 7-4). 图 7-4 F分布双侧置信区间 我们仍取概率对等的分位点来确定置信区间, 就是令 22121/212/2122212/(1,1)(1,1)1/SSP FnnFnn . 整理, 得到 P2221112222/212221/212111(1,1)(1,1)SSS FnnS Fnn . 这样我们就得到方差比2122的置信水平为 1的一个置信区间 2211222/21221/21211,(1,1)(1,1)SSSFnnSFnn(). (4.7) 例例7.4.4 用两种工艺或原料A和B生产同一种橡胶制品. 为比较两种工艺下产品的耐磨性,从两种工艺的产品中各随意抽取了若干件,测得如下数据: : 185.82, 175.10, 217.30, 213.86, 198.40,152.10, 139.89, 121.50, 129.96, 154.82, 165.60.AB工艺工艺 : 假设两种工艺下产品的耐磨性 X 和 Y 都服从正态分布: 22xxyy,XNYN . (1) 建立xy的置信水平为 0.95 的置信区间; (2) 建立 xy的置信水平为 0.95 的置信区间; (3) 问能否认为工艺A产品的平均耐磨性明显高于工艺B产品? 概率论与数理统计教案 第七章第三、四节 郑一,戚云松,陈倩华,陈健 编著 大连理工大学出版社出版 概率论与数理统计教案 第七章第三、四节 郑一,戚云松,陈倩华,陈健 编著 大连理工大学出版社出版 第第 251 页页 教学建议: (1)题型是:二个正态总体,各方差未知,求解关于均值差的置信区间. (2)问题综合, 值得重视. 若利用实际问题的数据, 可写公开发表的论文,建议学生到网上去查找数据,写写论文. (3)类似的,在假设检验方法中,也有此题型,见例 8.3.2, 要求学生利用此题数据,借助于假设检验方法,考虑同样的问题, “问能否认为公益 A 产品的平均耐磨性明显高于 B 产品?” 解解 经计算,得 x198.10,18.01xs, y143.98,16.55ys,xy1.09ss. (1) 由附表 6,分别查出自由度为 4,5 和 5,4 的 F 分布两个上分位数: 39. 75 , 4025. 0F,0 0250 97515 49 364 5.,.,FF. 根据(4.7)式,得到xY的置信水平为 0.95 的置信区间 0.0250.97511,0.40,3.334,54,5XXYYssssFF. 由于所得置信区间34. 3 ,40. 0包含 1,故在显著性水平 0.05 下可以认为XY1,即两个总体标准差相等XY. (2) 根据问题(1)可以认为XY,故可以按(4.6)构造 XY的置信水平为 0.95 置信区间. 经计算,得w54.12,17.21xys. 查自由度为5629的t分布的显著性水平 0.05 的双侧分位点为0.025(9)2.262t. 将以上各个数据代入(4.6)式,得 XY的置信水平为 0.95 置信区间 69.77,55.30. (3)由于 XY以概率 0.95 包含在区间69.77,55.30中,因此以置信水平 0.95 可以断定 XY30,即 X明显大于 Y,可以认为工艺A产品的平均 概率论与数理统计教案 第七章第三、四节 郑一,戚云松,陈倩华,陈健 编著 大连理工大学出版社出版 概率论与数理统计教案 第七章第三、四节 郑一,戚云松,陈倩华,陈健 编著 大连理工大学出版社出版 第第 252 页页 耐磨性明显高于工艺B的产品. 讲评讲评 (1) 此例是研究两个正态总体的方差之间的大小关系,在实际问题中常常首先考虑这类问题然后再用上例方法判断总体均值的大小关系. (2) 结论“xy的置信水平为 0.95 的置信区间是(0.40, 3.34)”的实际意义是:可以认为第一个正态总体的方差21比第二个正态总体均值22相等,此结论的可信度达到 95%. (3)结论“xy以概率 0.05 包含在区间(30.55,77.69)”的实际意义是:以概率0.95可以断定xy30,即x明显大于y(实际上, 要大于30单位) ,可以认为工艺 A 产品的耐磨性明显高于工艺 B 的产品. 三、单侧置信区间 三、单侧置信区间 教学建议: (3)一个和两个正态总体均值差和方差比的单侧置信区间估计问题在实际应用问题和科技论文写作中更加实用. (4)但限于学时少的限制,这部分内容往往不讲,而建议学生自学例题求解. 定义 设总体定义 设总体X的分布函数的分布函数( ; )F x中含有未知参数中含有未知参数,对于给定的正数,对于给定的正数) 10(,若由来自总体,若由来自总体X的样本的样本12,nXXX确定的统计量 确定的统计量 = =( (12,nXXX), 对于任意的), 对于任意的满足 满足 1,P (4.8) 则称随机区间( 则称随机区间(,+,+)是)是的置信水平为的置信水平为1的单侧置信区间的单侧置信区间, ,称为称为的置信水平为的置信水平为1的单侧置信下限的单侧置信下限. 又若统计量 . 又若统计量 = =( (12,nXXX) 对于任意的) 对于任意的满足 满足 1P, , (4.9) 则称随机区间( 则称随机区间(, ,)是)是的置信水平为的置信水平为1的单侧置信区的单侧置信区间, 间, 称为称为的置信水平为的置信水平为1的单侧置信上限的单侧置信上限. . 对于正态总体 X, 均值和方差2均为未知, 设12,nXXX是来自总体 X 的一组样本. 由第六章第三节抽样分布的定理 1 知 概率论与数理统计教案 第七章第三、四节 郑一,戚云松,陈倩华,陈健 编著 大连理工大学出版社出版 概率论与数理统计教案 第七章第三、四节 郑一,戚云松,陈倩华,陈健 编著 大连理工大学出版社出版 第第 253 页页 (1)/Xt nSn, 图 7-5 t 分布的单侧置信区间 并参考图 7-5, 我们可以令 (1)/XPtnSn1, 整理得到 (1)1SPXtnn . 于是得到的置信水平为1的一个单侧置信区间 (1),SXtnn(), 并且单侧置信下限为 (1).SXtnn 综合上述分析,对比双侧置信区间(4.2)式,只需将其中的上、下限中的“2”改成“” ,就得到相应的单侧置信上、下限了. 不难理解,下列定理成立: 定理定理 对于正态总体XN(,2),设12,nXXX是来自总体 X 的一组样本,置信水平为1. (1)总体方差2已知时, 有 (i) 均值的单侧置信区间 ,Xzn(), (4.10) 单侧置信上限为 Xzn; (4.11) (ii) 均值的单侧置信区间 ,Xzn(), (4.12) 单侧置信下限为 .Xzn (4.13) (2)总体方差2未知时, 有 概率论与数理统计教案 第七章第三、四节 郑一,戚云松,陈倩华,陈健 编著 大连理工大学出版社出版 概率论与数理统计教案 第七章第三、四节 郑一,戚云松,陈倩华,陈健 编著 大连理工大学出版社出版 第第 254 页页 (i) 均值的单侧置信区间 ,(1)SXtnn(), (4.14) 单侧置信上限为 (1)SXtnn; (4.15) (ii) 均值的单侧置信区间(1),SXtnn(), (4.16) 单侧置信下限为 (1).SXtnn (4.17) (3)总体均值 未知时, 有 (i) 方差2的单侧置信区间221(1)0,(1)nSn(), (4.18) 单侧置信上限为 2221(1)(1)nSn; (4.19) (ii) 方差2的单侧置信区间22(1),(1)nSn(), (4.20) 单侧置信下限为 222(1).(1)nSn (4.21) 例例7.4.5 从一批汽车轮胎中随机抽取16只进行磨损试验, 记录其磨坏时所行驶路程(单位: km), 算得样本均值41116x , 样本标准差 s=6346. 设此样本来自正态总体2( ,)N ,2, 均未知. 取置信水平为 0.95, 问该种轮胎平均行驶路程至少是多少千米? 或说平均使用寿命多长? 解解 依据题意,是单侧置信区间问题. 这里正态总体方差未知,故可利用(4.17)式. 已知 =1-0.95=0.05, n=16, 查表得, 0.05(15)1.7531t, 将41116x , s=6346 代入(4.17)式, 得 0.056346(15)411161.7531 3833516sxtn . 所以, 正态总体均值 的置信水平为 0.95 的单侧置信下限为 38335. 也就是说,该种轮胎平均行驶不少于 38334 km,或说使用寿命不少于 38334 km. 可见,并不是 16 只磨损轮胎的寿命均值41116x km. 例例 7.4.6 从一批灯泡中随机地抽取 5 只作寿命试验, 测得寿命(单位:h)为 1 050, 1 100, 1 120, 1 250, 1 280. 设灯泡寿命服从正态分布. 置信水平取为 0.95,试分析生产该批次灯泡的稳定性. 解解 分析生产该批次灯泡的稳定性,可用灯泡寿命的方差或标准差考量,需要计算总体方差的最大值, 就是方差的单侧置信上限(已知20.95(4)0.711x). 已知0.05,n=5,2210.95(1)(4)0.711n.由所给数据计算得到29950.s 由(4.19)式得到,所求总体方差的单侧置信上限为 2221(1)(1)nsn4 9950559800.711. 即得总体标准差的单侧置信上限为 236.6(单位:h) . 思考题思考题 概率论与数理统计教案 第七章第三、四节 郑一,戚云松,陈倩华,陈健 编著 大连理工大学出版社出版 概率论与数理统计教案 第七章第三、四节 郑一,戚云松,陈倩华,陈健 编著 大连理工大学出版社出版 第第 255 页页 1. 解读例 7.4.2:如果置信水平降低到 0.90,置信区间的长度变大还是变小?估计偏差变大还是变小?此时变大或变小的数值是多少?对于置信水平提高到 0.99 考虑同样的问题. 2. 解读例 7.4.4:置信区间(30.55,77.69)说明了哪些实际意义? 3. 在什么情形下,应该利用单侧置信区间的区间估计方法? 4. 单侧置信区间和双侧置信区间有哪些异同点? 解题参考解题参考 1. 如果置信水平降低到 0.90,则置信区间的长度变小,且估计偏差变小,此时估计偏差不大于162022. 60.05(15)t2=5.44(克), 这个结果的可信程度为90%;对于置信水平提高到 0.99,置信区间的长度变大,且估计偏差变大,此时估计偏差不大于162022. 60.005(15)t2=9.14(克), 这个结果的可信程度为99%. 2. “21的置信水平为 0.95 的置信区间是(30.55,77.69)”的实际意义是: 第一个正态总体的均值1(就是工艺或原料 A 平均耐磨性指标)比第二个正态总体均值2(就是工艺或原料 B 平均耐磨性指标)大 30.5577.69 ,此结论的可信度达到 95%. 这说明,工艺或原料 A 平均耐磨性指标高于 B 的. 3. 涉及均值不要低于下限,或者稳定性不要高于上限,等类似只要求上、下限的问题,应该利用单侧置信区间的区间估计方法比较好. 4. 单侧置信区间和双侧置信区间有哪些异同点? 对于未知参数, 我们给出两个统计量, , 得到的双侧置信区间(, ). 但对于设备元件的寿命来说, 我们更希望平均寿命长一些, 我们关心的是平均寿命的下限; 在考虑化学药品中杂质含量的均值时, 我们主要关心的上限;考察机器工作的稳定性时,我们应关注标准差不能超过某一数值. 到底是选用双侧区间估计,还是单侧区间估计?首先,依据问题本身选择区间估计;其次,能用单侧置信区间的就不用双侧置信区间估计. (1) 单侧置信区间和双侧置信区间所用的样本函数是一样的;(2) 对于同样的置信水平1,单侧置信区间和双侧置信区间的上分位点不一样;(3) 单侧置信区间和双侧置信区间表示的实际意义不同. 小 结 与 思 考 小 结 与 思 考 要记住如下结论: (1) 总体方差2已知时,的置信水平为1的一个置信区间为 /2/2,XzXznn(). (2) 总体方差2未知时,的置信水平为1的一个置信区间为 / 2/2(1),(1)SSXtnXtnnn(). (3) 总体均值未知时,方差2的置信水平为 1的一个置信区间为 2222/21/2(1)(1),(1)(1)nSnSnn().