6sigma第二章基础统计1精编版.pptx
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_05.gif)
《6sigma第二章基础统计1精编版.pptx》由会员分享,可在线阅读,更多相关《6sigma第二章基础统计1精编版.pptx(56页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、 日期:日期:2012/02/20第二章 基础统计2第一节第一节 统计的基本概念统计的基本概念3统计学的概念在日常生活中经常接触,且每天都在使用-为预测棒球比赛的胜负,调查各个Team的过去胜率-用收集的气象资料预测天气统计学统计学 为了对不确实的未来的预测提供必要的情报收集,分类,分析资料为了对不确实的未来的预测提供必要的情报收集,分类,分析资料 及以此为基础提示结论的学问及以此为基础提示结论的学问统计学统计学4观察的偏差观察的偏差当重复测量时,经常产生不同的结果,这就是偏 差通常原因的偏差通常原因的偏差测量中的差异是被期望的并可以预测的特殊原因的偏差特殊原因的偏差(随机随机)测量中的差异是
2、不可预测的偏差偏差:观察值与实际值之间的差异5偏差偏差所有的茄子产于一块地并同一天采摘所有的茄子产于一块地并同一天采摘问题问题:你期望存在偏差吗你期望存在偏差吗?什么类型的偏差什么类型的偏差?6观察的偏差观察的偏差(续续)我们期望观察出偏差,当没有时将引起注意我们期望观察出偏差,当没有时将引起注意如果所有的区域的产品的销售量完全相同,我们将怀疑数据的真实性.偏差使我们的工作更有挑战性,我们通常不相信来源于单个数据的结果,通常收集多个数据并注意收集的方法以减少偏差,偏差是自然存在的偏差是自然存在的,被期望的并是统计的基础被期望的并是统计的基础7数据类型数据类型连续变量用长度或时间等作为测量尺度。
3、连续变量用长度或时间等作为测量尺度。离散变量是分类的信息如离散变量是分类的信息如“合格合格”或或“不合格不合格”。例如例如:零件编号零件编号.逻辑逻辑连续连续1合格2.0312合格2.0343不合格2.0764合格2.0225不合格2.001连续变量连续变量离散变量离散变量问题问题解决方案解决方案8连续变量参数如:尺寸,重量或时间来描述产品或过程特性,这个测量尺度可以被细细分成有意义的小数你能举出三个设备吗?可用来收集连续变量的.相比仅仅知道零件的好或坏连续变量能告诉更多的相比仅仅知道零件的好或坏连续变量能告诉更多的信息信息连续变量连续变量9离散变量不可能再细分成有意义的小数离散变量不可能再细
4、分成有意义的小数 离散变量是事情发生或不发生的次数或测量发生的频率.离散变量也是可分类的数据,如;销售区域,生产线,操作班组和工厂,单板有缺陷的焊点无辜或有罪无辜或有罪离散变量离散变量合格合格/不合不合格格区域区域10离散变量离散变量通常如果能获得更多的信息优先考虑连续变量.如果不能获得连续变量可以分析逻辑变量,找出结果并做结论.连续和离散变量的注释连续和离散变量的注释:离散变量的例子离散变量的例子:单板的合格单板的合格 合格合格/不合格不合格 发票的正确性发票的正确性 正确正确/不正确不正确按时付款按时付款 按时按时/迟交迟交为了有效的分析为了有效的分析,离散变量要求更多的数据点离散变量要求
5、更多的数据点11在下列的例子边在下列的例子边,画圈选择画圈选择A=“离散离散”或或V=“连续变量连续变量”1.销售的准确性2.数据输入的准确性3.销售区域4.用“通过”/“不通过”量具测直径5.焊膏厚度6.直供协议7.网板厚度8.供应商产品的缺陷数9.计划部下达合同的变更次数 A V A V A V A V A V A V A V A V A V练习练习12总体(母集团)和样本总体(母集团)和样本成为关心对象的所有个体的集合称为总体,在总体中作为调查对象采纳的一部分称为样本。总体样本总体的特性 :个数(N)平均 分散 2标准偏差 样本的特性 :统计量(n)平均 x 分散 S2标准偏差 S如果能
6、够准确计算总体的个数时没有问题,但如果难以计算如果能够准确计算总体的个数时没有问题,但如果难以计算时以样本计算的统计量为基础进行推定时以样本计算的统计量为基础进行推定.13 n平均值平均值-总体或样本的平均值。-总体的平均值用 表示表示-样本的平均值用 Xn均方差均方差-与平均值间距的平方的平均值.(表示数据的离散程度.)-总体的方差用 表示表示 -样本的方差用s2 表示n标准的方差是方差的平方根标准的方差是方差的平方根。(。(表示数据的离散程度.)-总体标准偏差由 表示表示-样本标准偏差由s 表示14n极差极差-在一个子组中最高值与最低值的差值 极差=X高-X低.极差用 R 表示表示n中位数
7、中位数-反应中间50%的数值,一系列数据由低到高排列后所得到的中间数。n众数众数-在一个数据集中最频繁出现的值。15平均值平均值下列是茄子的重量下列是茄子的重量1.01.21.52.53.04.26.11.11.52.03.04.04.26.20.91.42.13.14.54.46.01.21.62.53.24.44.51.01.52.43.34.56.0茄子的平均重量是多少?茄子的平均重量是多少?16平均值平均值所有重量累计 =平均值平均值茄子茄子个数个数=平均值平均值 -总体或样本的平均值。样本用总体或样本的平均值。样本用 x,总体用 表示。平均值公式平均值公式17572125551053
8、1052105810除了平均值除了平均值,我们还要知道其它信息吗,我们还要知道其它信息吗?数据的离散程度怎数据的离散程度怎 样样?例如例如:五位数的中心值 是5X5555R062025R=极差=X高-X低平均值相同平均值相同!这是子组这是子组极差极差18除了中心值和极差除了中心值和极差,我们还要知道其它更多信息吗,我们还要知道其它更多信息吗?极差是足够具体吗?极差是足够具体吗?59 61 63 63 64 59 62 66 65 65 64 60 65 62 64 68 70 65 63 64 68 66 65 66 67 64 66 58 65 65 71 63 69 63 66 70 64
9、 67 64 66 62 64 64 64 61 64 63 65 64 68 66 67 69 71 68 66 65 63 64 64 68 67 65 64 65 64 70 65 68 65 66 69 66 66 65 63 68 66 62 67 65 66 67 66 60 67 63 60 64 7390个女工的平均身高把 数据标在下面5760657075xx直方图直方图19直方图直方图20离散程度的测量离散程度的测量用来判定一个数据用来判定一个数据 集合集合 离散程度或宽度的恒量尺度离散程度或宽度的恒量尺度n极差=最大值-最小值n均方差=与平均值差的平方的平均值 标准偏差=方
10、差的平方根,提供与平均值 的标准的距离的测量。均方差为什么有用?均方差为什么有用?21标准偏差-恒量数据的离散程度 总体的标准偏差用“”表示,样本的标准偏差用S表示表示=(Xi-)2i=1NN总体的标准偏差方差方差-与中心值与中心值 间距的平均值间距的平均值 S=(Xi-X)2i=1nn-1样本的标准偏差统计术语和定义统计术语和定义让我们练习让我们练习.22例子例子课堂例子 :计算均方差和标准偏差(标准偏差(2,6,4)计算平均值,均方差和标准偏差计算平均值,均方差和标准偏差x =xn ii=1ns 2 =n(Xi-X)2i=1n-1 s=(Xi-X)2i=1nn-1平均值平均值 均方差均方差
11、标准偏差标准偏差均方差(s2)=8/(3-1)=4标准偏差(s)=平方根(4)=2ixi(xi-4)(xi-4)21 2-242 6 243 4 00总和12 0823课堂练习:计算均方差均方差标准偏差标准偏差(1,3,5,4,7)用下列表格做指导用下列表格做指导首先计算平首先计算平 均均 值值计算中心值计算中心值 均方差均方差标准偏差标准偏差x =xni1ns 2 =n(Xi-X)2i=1n-1 s=(Xi-X)2i=1nn-1平均值平均值 均方差均方差标准偏差标准偏差 均方差(s2)=标准偏 差 (s)=练习练习24还有其它的统计概念吗还有其它的统计概念吗?中位数中位数&众数众数:59 6
12、1 63 63 64 59 62 66 65 65 64 60 65 62 64 68 70 65 63 64 68 66 65 66 67 64 66 58 65 65 71 63 69 63 66 70 64 67 64 66 62 64 64 64 61 64 63 65 64 68 66 67 69 71 68 66 65 63 64 64 68 67 65 64 65 64 70 65 68 65 66 69 66 66 65 63 68 66 62 67 65 66 67 66 60 67 63 60 64 7390位女士的身高位女士的身高:中位数中位数 -反应中间(50%)处的数
13、值,一系列数据由低到高排列所得的中间数。什么是中位数?众数众数-在一个数集中最频繁出现的数。什么是众数?25平均值,中位数和众数是所有平均值,中位数和众数是所有居中趋势的测量居中趋势的测量值值 聚集在某个中心值附近聚集在某个中心值附近26何时应何时应 用用807060504030201003002001000Neg Skew中位数中位数平均值平均值130120110100908070603002001000P os S kew中位数中位数平均值平均值1101009080706050403020100500Norm al平均值平均值=中位数中位数27到目前为止我们知道到目前为止我们知道:偏差.数
14、据的类型中心值 中位数众数极差标准偏 差均方差28第二节第二节 概率分布概率分布概率分布是将分布的形状演变成数据概率分布是将分布的形状演变成数据模型成为品质管理及模型成为品质管理及 6 6 Sigma Sigma 开展的基本。开展的基本。291)正态分布Units of Measure直方块的中点中心光滑连接形成曲线大多数(但不是所有)数据是正态分布或钟形曲线正态分布告诉我们数据的离散情况正态分布告诉我们数据的离散情况30正态分布正态分布(Normal distribution)Normal distribution)正态分布在统计应用领域最重要的分布并成为正态分布在统计应用领域最重要的分布并
15、成为 6 6 Sigma Sigma 开展的基本开展的基本.正态分布也可如下表示正态分布也可如下表示XN()XN()2 2 ,变量变量正态分布正态分布平均平均标准偏差标准偏差即正态分布由即正态分布由平均平均和和标准偏差标准偏差来定义来定义31正态分布的形态是正态分布的形态是?95.5%95.5%95.5%95.5%43210-1-2-3-468.3%68.3%68.3%68.3%99.73%99.73%99.73%99.73%以平均为轴对称以平均为轴对称(Symmetric)Symmetric)原点在一个位置原点在一个位置(Unimodal)Unimodal)钟形钟形 (Bell-shaped
16、)Bell-shaped)32正态分布的标准偏差()规范上限(USL)规范下限(LSL)分布的中心值(U)分布的标准偏差()1 X or UCLp(d)3 中心值中心值LCLX+2 X+1 X+3 X-1 X-2 X-3 33SigmaSigma是是?95.5%95.5%95.5%95.5%43210-1-2-3-468.3%68.3%68.3%68.3%99.73%99.73%99.73%99.73%第一个弯曲点第一个弯曲点(倾斜从减倾斜从减少到增加的位置少到增加的位置,Deflection Point)Deflection Point)与平均间的距离与平均间的距离以平均为中心占据以平均为中
17、心占据 68%68%的面积的面积34正态分布的函数式正态分布的函数式 正态分布的密度函数正态分布的密度函数 -X +:3.142 e:2.7183:分布的平均:分布的标准偏差 1 1222 2e e-(x-(x-)2 2/2/2 2 2f(X)=XN()XN()2 2 ,35正态曲线正态曲线(Normal curve)Normal curve)形态形态95.5%95.5%95.5%95.5%43210-1-2-3-468.3%68.3%68.3%68.3%99.73%99.73%99.73%99.73%121=1 12121221因和而异的正态分布形状 1 1 2 2,1 1=2 2 1 1=
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- sigma 第二 基础 统计 精编
![提示](https://www.taowenge.com/images/bang_tan.gif)
限制150内