六西格玛数据分析技术4.pptx
《六西格玛数据分析技术4.pptx》由会员分享,可在线阅读,更多相关《六西格玛数据分析技术4.pptx(39页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、SSMC中国人民大学六西格玛质量管理研究中心六西格玛管理培训丛书(5)o 何晓群何晓群 主编主编 六西格玛数据分析技术六西格玛数据分析技术何晓群 编著光盘作者:陶 沙 苏晨辉中 国 人 民 大 学 出 版 社SSMC中国人民大学六西格玛质量管理研究中心第4章 参数估计4.1 参数估计的基本概念4.2 总体均值和总体比例的区间估计4.3 样本容量的确定4.4 两总体均值之差的区间估计4.5 两总体比例之差的区间估计4.6 正态总体方差的区间估计4.7 两个正态总体方差比的区间估计4.8 有关区间估计的Minitab软件实现小组讨论与练习返回目录SSMC中国人民大学六西格玛质量管理研究中心本 章
2、目 标1.掌握参数估计的基本概念2.建立起在管理中运用参数估计的思想3.能运用Minitab实现各种区间估计的计算4.掌握样本容量的确定方法5.能在管理实践中运用参数估计方法返回目录SSMC中国人民大学六西格玛质量管理研究中心4.1 参数估计的基本概念 u参数估计有两大类,一种叫点估计,一种叫区间估计u点估计是利用样本的信息对所感兴趣的参数估计出一个数值u区间估计包含了两个数值,对应着数轴上的一个区间,所以称为区间估计u点估计的方法最常用的有两种:矩估计法极大似然估计法u对一个估计优良性的评价有一些相应的评价准则返回目录SSMC中国人民大学六西格玛质量管理研究中心u 对总体参数的估计,人们最容
3、易想到的方法就是矩估计法,即用样本矩估计总体相应的矩,用样本矩的函数估计总体相应矩的函数。u 矩是指以期望值为基础而定义的数字特征,例如均值、方差、协方差等。u 最常用的矩估计有:用样本均值估计总体均值,用样本标准差估计总体标准差。u 例41.已知某种灯泡的寿命 XN(,2),其中,2均未知,今随机抽取4只灯泡,测得寿命(单位:小时)为1502,1453,1367,1650。试估计,。 矩估计法返回目录SSMC中国人民大学六西格玛质量管理研究中心矩估计法(续)u解:因为是全体灯泡的平均寿命, 为样本的平均寿命,很自然地会想到用 去估计;同理用s去估计。u由于u例42.设样本x1,x2, xn来
4、自参数为 的泊松分布。由于E(X)=D(X)=,因而 与s2都可以作为的矩估计值。u由例42可以看出E(X)=D(X)=,这表明总体均值与方差相等,但在实际问题中 与s2不见得一样,因而矩估计的结果不惟一。)(61.118),(149316 .118140691406914)14936501 ()14931502(1493)1650136714531502(41222小时小时即sxssxxxxx返回目录SSMC中国人民大学六西格玛质量管理研究中心极大似然估计 u极大似然估计是利用总体的分布密度或概率分布的表达式及其样本所提供的信息建立求未知参数估计量的一种方法。u极大似然估计好多初学者觉得难以
5、理解,我们用下面的说法帮助理解:在产品检验中,有说这批产品的次品率可能是1/10000,也有说次品率可能是1/100。 如果你在这批产品中随机抽取一件,竟然 就是次品,自然应当认为这批产品的次品 率最有可能是1/100而不是1/10000。把这 种考虑问题的方法一般化,就概括出极大 似然估计方法。返回目录SSMC中国人民大学六西格玛质量管理研究中心极大似然估计 (续1) u设总体X的分布已知,未知参数为 ,假定其分布密度族为f(x;);u假设对总体X的n次观测结果为(x1, x2, xn)。应在一切中选取使样本(X1,X2, Xn)落在点(x1, x2, xn)附近概率最大的 作为未知参数真值
6、的估计值,即选取 使: 其中 称为似然函数,它是样本的联合概率密度函数。)(max)(2121nn, x, xxL, x, xxL;)(21n, x, xxL;返回目录SSMC中国人民大学六西格玛质量管理研究中心极大似然估计 (续2) u一般情况下,我们用求解似然方程的方法进行极大似然估计,具体步骤是:1.由总体分布导出样本的联合概率密度;2.把样本联合概率密度中自变量x1, x2, xn看成已知常数,而把参数看作变量,得到似然函数;3.用微分原理求似然函数的最大值点;4.在最大值点的表达式中,代入样本值就得参数的估计值。u可以证明:若x1, x2, xn来自正态总体N(,2),则:niini
7、ixxnxnx121)(11返回目录SSMC中国人民大学六西格玛质量管理研究中心u例4-3.设某种品牌的电视机的首次故障时间遵从指数分布f(t)=e-t,t0,共测试了7台电视机,获得相应的首次故障时间(单位:万小时)为: 1.49,3.65,0.26,4.25,5.43,6.97,8.09 求参数的估计值。解:样本x1, x2, xn的联合密度用均值 来表示,就有: ,将 看作常数, 看作变量,可得似然函数 ,进而取对数,求微商,解方程可得: 对本例而言,就有:极大似然估计(续3)2326. 01 .3071xxnnxnnnniixnxnineLe, x, xxPxnxee, x, xxPn
8、iii)()(1)()(2111211x返回目录SSMC中国人民大学六西格玛质量管理研究中心点估计的优良性准则u不同的参数估计方法,可得到不同的估计量,不同的估计量谁优谁劣?我们有一些相应的评价准则。在6管理中,最常用的点估计优良性准则有两个:一个是无偏性,另一个是有效性。u无偏性:设 是参数的一个估计量,如果 ,则称 是参数的无偏估计。无偏性实际上是指对于一个估计量,屡次变更数据反复求估计值时,估计值的平均与真值相一致,即尽管 有时比大,有时比小,总的看来,它的“平均值”就是。可以证明 :许多情况下, 是的无偏估计,s是的无偏估计。然而,在正态分布中的极大似然估计就不是无偏估计。x)(E返回
9、目录SSMC中国人民大学六西格玛质量管理研究中心有效性无偏性只考虑估计值的平均结果是否等于待估参数的真值,而不考虑每个估计值与待估参数真值之间偏差的大小和散布程度。实际问题的研究中,不仅希望估计是无偏的,更希望这些估计值的偏差尽可能地小。u设 都是参数的无偏估计量,如果 且至少有一个 ,严格不等号成立,则称 比 有效。设 、x1都是的无偏估计,但样本均值 的方差为2/n,x1的方差为2,只要n1,作为的估计值, 比x1就更有效。)()(21DD21、210 xxx返回目录SSMC中国人民大学六西格玛质量管理研究中心区间估计u点估计没有给出估计的精度和可靠程度,区间估计解决了这一问题。u设是总体
10、的一个待估参数,从总体中获得容量为n的样本是x1, x2, xn,对给定的(05,n(1p)5,则可用正态分布去近似二项分布,因而有: 因此由正态分布构造总体比例p的置信区间为:p )1 (1,(ppnpNpnppZp) 1 ( 2/1返回目录SSMC中国人民大学六西格玛质量管理研究中心总体比例置信区间估计的例子u例47.某企业在一项关于职工流动原因的研究中,从该企业前职工的总体中随机抽选了200人组成一个样本。访问结果,有140人说他的离开是由于企业管理缺乏人性化。试对由于这种原因而离开企业的人员的真正比例进行估计(=0.05)。解:已知n=200, =0.7, =1405, =605, Z
11、1-/2=1.96故该企业职工认为企业管理缺乏人性化而离开的比例为63.6%76.4%。)764. 0 ,636. 0()200)7 . 01 (7 . 096. 17 . 0 ,200)7 . 01 (7 . 096. 17 . 0() 1 ( ,) 1 ( (2/12/1nppZpnppZpp pn) 1 (pn返回目录SSMC中国人民大学六西格玛质量管理研究中心4.3 样本容量的确定u在研究实际问题时,需要自己动手设计 调查方案,这时如何确定样本容量大有 学问。如果样本量太大,必然费用增加; 如果样本量过小,估计误差又会增大。u这就看你需要什么样的估计精度,即你想构造多宽的估计区间?u对
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 六西格玛 数据 分析 技术
限制150内