6sigma DMAIC_Measure Basic Statistics精编版.pptx
《6sigma DMAIC_Measure Basic Statistics精编版.pptx》由会员分享,可在线阅读,更多相关《6sigma DMAIC_Measure Basic Statistics精编版.pptx(53页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、统计基础统计基础知识知识q 学习目标学习目标 通过基本概念的理解来了解数据的特性.理解概率分布的基本概念 MINITAB求概率的方法Proprietary to Samsung Electronics CompanyMeasure 基础统计-2Rev 4.0基础统计的必要性基础统计的必要性Measure阶段收集的资料对其进行分析的方法阶段收集的资料对其进行分析的方法.反映流程特性化的反映流程特性化的X和和Y关系式关系式 Y=f(X).利用数据与流程状况来推测未来发展趋势利用数据与流程状况来推测未来发展趋势作为高级统计问题解决时的基础依据作为高级统计问题解决时的基础依据.基本统计具有不直观性基本
2、统计具有不直观性,需要找出符合事实的逻辑语言需要找出符合事实的逻辑语言q 所谓统计所谓统计通过对某组资料数据的分析整理,算出其内容中的特征数值诸如次数,频度,比率等的过程方法即为统计.q 统计的必要性统计的必要性Proprietary to Samsung Electronics CompanyMeasure 基础统计-3Rev 4.0统计术语统计术语 样本样本(Sample):从母集团中取出的用于实际测量的子集合.母集团母集团(Population):所关心的集合中所有个体值的集合.(投标结果,每日生产量,特征产品不良率)例题)本年度总统选举的参选选民为2500万,某舆论调查机构按各地区各年
3、龄 段选民抽选500人对选举结果进行民意测验,此例中母集团与样本各为什么?母集团母集团:所有参选选民约所有参选选民约2500万人万人.样本样本:被选被选500人人.q 母集团和样本母集团和样本Proprietary to Samsung Electronics CompanyMeasure 基础统计-4Rev 4.0对母集团的对母集团的特性推论特性推论母集团平均母集团平均 :母集团分散母集团分散 :2母集团标准偏差母集团标准偏差:样本平均样本平均 :样本分散样本分散 :s2样本标准偏差样本标准偏差 :s 母集团母集团参数参数(Parameter):反映母集团的特征值 (平均,标准偏差,比率等)
4、统计统计参数参数(Statistic):利用样本计算出的特征值,对母集团进行推论的量 (样本平均,样本偏差,样本比率等)抽样抽样(Sampling)AAAAAAABBBBBBCCCCCCDDDDDDDAABDDDCCCCB母集团母集团样本样本母集团参数母集团参数统计参数统计参数统计术语统计术语Proprietary to Samsung Electronics CompanyMeasure 基础统计-5Rev 4.0例)成品完成需要AG共7个流程.各流程所需时间测定如下.试求出各流程所需 平均时间极端值极端值30分对平均造分对平均造成的影响较大成的影响较大 平均平均(Mean)n 个观测值的平
5、均值为观测值总和与观测值数的之比.对极端值(outlier)较为敏感 平均 :2 2 1 3 2 9 30A B C D E F G(单位:分)测值总和测值数=解解)q 中心倾向的中心倾向的指标指标统计术语统计术语Proprietary to Samsung Electronics CompanyMeasure 基础统计-6Rev 4.0 组中值组中值(Median)数据数据按大小按大小(n)排列时的中间位置数值排列时的中间位置数值 来自于极端值(Outlier)的影响较小.最频数最频数(Mode)数据出现的频率(Frequency)最高的.来自于极端值(Outlier)的影响较小.例例)上例
6、中的最频数为多少?2,2,1,3,2,9,30 中的2出现的频率为3,为出现最频的,因此最频数为2.极端值对组中值、极端值对组中值、最频数的影响较最频数的影响较小小.n 为奇数的时候 :n 为偶数的时候:1 2 2 2 3 9 301 2 2 2 3 9 10 302和3的平均2.5统计术语统计术语Proprietary to Samsung Electronics CompanyMeasure 基础统计-7Rev 4.0 虽然虽然B汽车的平均行程汽车的平均行程要高于要高于A汽车汽车,但分布的分散度却很大,但分布的分散度却很大,所以你无法说所以你无法说B汽车一定是最好的汽车一定是最好的!A 汽
7、车汽车B 汽车汽车以下为对A,B汽车的每公升汽油的所能行使里程进行测试后的数据分布情况。大家会看好A/B哪一种车呢?AB例例)在统计分析中,仅考虑平均值来判断会得出错误的结果。应对数据的分散情况也综合考虑进去!q 分散性倾向的指标分散性倾向的指标统计术语统计术语Proprietary to Samsung Electronics CompanyMeasure 基础统计-8Rev 4.0分散和标准偏差显示以平均值为基准的样本的差值情况以及离散的程度.3040506070 如果,从点 开始 为止的平方值为 的话,分散以平均平方值(统计性理由上,分集并非n,而用(n-1)来定义).标准偏差取分散的平
8、方根.分散分散(Variance)和标准偏差和标准偏差(Standard deviation)例例)样本 :4 8 7 5 2 6 3 平均 5 偏差之和 :(-1)+3+2+0+(-3)+1+(-2)=0 样本分散样本分散:样本标准偏差样本标准偏差:平方的理由平方的理由 统计术语统计术语Proprietary to Samsung Electronics CompanyMeasure 基础统计-9Rev 4.0 四分位数四分位数(Quartile):对数据集合按四等份进行排列对数据集合按四等份进行排列 四分位范围四分位范围(IQR:Inter quartile Range):Q3-Q1Q1:
9、第一 四分位数四分位数(First Quartile)=25%对应值Q2:第二 四分位数四分位数(Second Quartile:组中值)=50%对应值Q3:第三 四分位数四分位数(Third Quartile)=75%对应值例例)求出下列数据中的四分位数和求出下列数据中的四分位数和 IQR2,8,20,4,9,5,4,3,解解)根据顺序排列 :Q1=3.25Q2(组中值)=4.5Q3=8.752 3 4 4 5 8 9 20 范围范围(Range):数据数据集合中的最大值和最小值之集合中的最大值和最小值之差差.Range =最大值 最小值统计术语统计术语Proprietary to Sams
10、ung Electronics CompanyMeasure 基础统计-10Rev 4.0利用利用MINITAB进行基础数据分析进行基础数据分析q 例题例题 数据数据的的图图表表分析分析 -数据如何展现?Graph Histogram Graph Boxplot Graph Probability plot 统计参数计算统计参数计算 -中心位置在哪里?-分散的大小为多少?Stat Basic Statistics Descriptive StatisticsOption:Graph Graphical Summary 用流程用语解释结果用流程用语解释结果文件名:Statistics_Norma
11、l.MTWProprietary to Samsung Electronics CompanyMeasure 基础统计-11Rev 4.0利用利用MINITAB进行基础数据分析进行基础数据分析 阶段阶段 1:数据数据的图表分析的图表分析 Graphs Histogram Proprietary to Samsung Electronics CompanyMeasure 基础统计-12Rev 4.0利用利用MINITAB进行基础数据分析进行基础数据分析 阶段阶段 1:数据数据的图表分析的图表分析 Graphs Boxplot Q1Q2Q3Q1-1.5 IQR以外的点以外的点(Outlier)Q3
12、+1.5 IQR以外的点以外的点(Outlier)Proprietary to Samsung Electronics CompanyMeasure 基础统计-13Rev 4.0利用利用MINITAB进行基础数据分析进行基础数据分析 阶段阶段 1:数据数据的图表分析的图表分析 Graphs Probability plotProprietary to Samsung Electronics CompanyMeasure 基础统计-14Rev 4.0利用利用MINITAB进行基础数据分析进行基础数据分析 阶段阶段 2:统计参数计算统计参数计算 Stat Basic Statistics Disp
13、lay Descriptive Statistics*Option:Graphs Graphical SummaryProprietary to Samsung Electronics CompanyMeasure 基础统计-15Rev 4.0利用利用MINITAB进行基础数据分析进行基础数据分析 阶段阶段 3:用流程用语进行解释用流程用语进行解释Descriptive Statistics:NormalVariable N Mean Median TrMean StDev SE MeanNormal 500 70.000 69.977 70.014 10.000 0.447Variable
14、Minimum Maximum Q1 Q3Normal 29.824 103.301 63.412 76.653确认MINITAB的session窗中出现的数据.Proprietary to Samsung Electronics CompanyMeasure 基础统计-16Rev 4.0基础统计练习题基础统计练习题q 如下事例研究分析如下事例研究分析.问题 -某公司对客户 2005年 10月 12月的10周应收帐款遵守情况非常不满,特别对于客户(LEEBING PLAZA、HIGH MART、百货店)强烈要求树立对策.文件名:statistics_ex.MTW-经营会的市场部主管部长提供了此
15、3个客户的一系列帐款数据.数据的种类包含10周期间各客户产品的每日数量.反馈分析-客户产品数量用HISTOGRAM/BOX PLOT 方式表示.-实施统计,解释各产品的平均值和标准偏差.Proprietary to Samsung Electronics CompanyMeasure 基础统计-17Rev 4.0概率的理解概率的理解q 掷骰子游戏掷骰子游戏让我们想一下掷2个骰子的实验.假设2个骰子之和为3,4,5,11时的结果为客户满意.因此,2个骰子之和为 2 或者或者12时看作为缺陷时看作为缺陷.假定骰子很公正时假定骰子很公正时,是否能够预测掷完骰子后出现缺陷的概率是否能够预测掷完骰子后出
16、现缺陷的概率Proprietary to Samsung Electronics CompanyMeasure 基础统计-18Rev 4.0 掷掷2个骰子出现的所有组合个骰子出现的所有组合和为和为2的组合有几个的组合有几个?为为12的组合的组合呢呢?总组合数有几个总组合数有几个?继续继续概率的理解概率的理解Proprietary to Samsung Electronics CompanyMeasure 基础统计-19Rev 4.0即即,缺陷出现可能性缺陷出现可能性(概率概率)为为5.6%.继续继续 各组合出现可能性各组合出现可能性概率的理解概率的理解Proprietary to Samsun
17、g Electronics CompanyMeasure 基础统计-20Rev 4.00123456024681012规格规格下限下限规格规格上限上限通过柱状图所看到的结果通过柱状图所看到的结果概率的理解概率的理解Proprietary to Samsung Electronics CompanyMeasure 基础统计-21Rev 4.0概率的理解概率的理解 所有可发生的情况中特定事件所有可发生的情况中特定事件 A发生的可能性发生的可能性.即即,无数次的相同实验中最终趋近的比率无数次的相同实验中最终趋近的比率 例例)想一想掷两个骰子时的情况.P(A)=事件事件 样本区间样本区间 样本区间样本
18、区间 S=(1,1),(1,2),(6,6):36种所有可能结果的集合 事件事件(事件事件):样本区间的部分集合 E1=第一个骰子为1的组合=(1,1),(1,2),(1,3),(1,4),(1,5),(1,6)两个骰子掷出时有一个骰子为两个骰子掷出时有一个骰子为1时的概率时的概率P(E1)P(E1)=P(1,1),(1,2),(1,3),(1,4),(1,5),(1,6)=6/36=1/6q 概率概率(Probability)Proprietary to Samsung Electronics CompanyMeasure 基础统计-22Rev 4.0对样本区间的各个值赋予实数的函数对样本区
19、间的各个值赋予实数的函数q 随机随机变量变量(Random Variable)概率的理解概率的理解即,将投出骰子出现的值用变量X表示的话,X即为随机变量即为随机变量,此随机变量取1,2,3,4,5,6情况时的值.可取到的随机变量及取到其值的可能性概率,用表、图表、函数等方式表示出来.q 概率分布概率分布(Probability Distribution)学习概率分布的理由是学习概率分布的理由是:为为掌握随机变量掌握随机变量在在某某一区间内一区间内出现的可能性出现的可能性Proprietary to Samsung Electronics CompanyMeasure 基础统计-23Rev 4.
20、0概率分布的种类概率分布的种类q 离散离散(计数计数)型概率分布型概率分布为了将采集到的离散型(计数形)数值模型化而使用.离散型概率分布函数用概率质量函数(pmf)进行表示.(例如:良品/不良、0/1性质,或者不良数1,2,3,的个数模型化.)二项分布二项分布 代表不良型数据的分布.泊松泊松分布分布 代表缺陷型数据的分布.q 连续连续(计量计量)形概率分布形概率分布为了将采集到的连续型(计量形)数值模型化而使用.连续型概率分布函数以概率密度函数(pdf)进行表示.正态分布正态分布 一般计量形数据所具有的分布.信赖性数据随指数分布或Y分布情况较多,规定一侧规格或流程异常时,一般而言数据也不随正态
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 6sigma DMAIC_Measure Basic Statistics精编版 sigma Statistics 精编
限制150内