正态分布的种类精选PPT.ppt
关于正态分布的种类第1页,讲稿共14张,创作于星期二1.1.正态分布的正态分布的(Normal Distribution)(Normal Distribution)的理解的理解“标准的”“自然的”“正常的”表示Normal的含义,正态分布是最正常的数据分布形态.数据脱离正态分布时,可以判断为这种工程是改善的对象.正正态态分分布布以以平平均均为为轴轴相相对对称称,具具有钟形的图表有钟形的图表.又称高斯分布又称高斯分布.正态分布是平均为,标准偏差为 的概率密度函数.度数在中心附近最多,离中心越远越少.是通常出现的形态,是自然的变动第2页,讲稿共14张,创作于星期二正态性正态性正态性正态性(适合度适合度适合度适合度)验证验证验证验证大家为了判断得到的数据是否为正态分布,可以在MINITAB使用如下分析方法打开打开 A05_ A05_非正态分布非正态分布.mtw.mtwStat Basic Statistics Stat Basic Statistics Normality TestNormality TestP-Value 0.824P-Value 0.824进行正态性验证后进行正态性验证后 P-Value P-Value大于大于0.050.05时此分布可以假定为正态的时此分布可以假定为正态的.即母集团即母集团是正态分布时上述是正态分布时上述SampleSample是正态分布是正态分布的概率是的概率是82.4%.82.4%.第3页,讲稿共14张,创作于星期二右边斜型右边斜型平均在中心分布左边称为,右右边斜型边斜型平均在中心分布右边称为,左边左边斜型斜型2.2.非正态分布的种类非正态分布的种类但在现场我们经常遇到非正态分布的情况.因此要正确理解非正态分布的形态及形状,这样才有助于问题的解决.斜型时斜型时,为更加准确为更加准确地计算地计算SIGMASIGMA水平水平,使使用用Box-Cox Box-Cox 后后,求求SIGMASIGMA水平水平左边斜型左边斜型斜型斜型斜型斜型(Skewness)(Skewness)(Skewness)(Skewness)第4页,讲稿共14张,创作于星期二分布的形态比正态分布尖,两侧尾部较长.分布的形态比较平,两侧尾部较短测定设备的精度低时可能得到这种数据 一般的双重峰一般的双重峰一般的双重峰一般的双重峰用2台机器生产时,机器的性能不同时发生的分布极端的双重峰极端的双重峰极端的双重峰极端的双重峰用几台机器生产时,因特定机器的故障等发生的分布急尖急尖急尖急尖平尖平尖平尖平尖尖度尖度尖度尖度(Kurtosis)(Kurtosis)(Kurtosis)(Kurtosis)立状立状立状立状离散型离散型离散型离散型(Granularity)(Granularity)(Granularity)(Granularity)多重多重多重多重 Mode(Multiple Modes)Mode(Multiple Modes)Mode(Multiple Modes)Mode(Multiple Modes)第5页,讲稿共14张,创作于星期二斜型斜型斜型斜型(Skewness)(Skewness)(Skewness)(Skewness)的解释的解释的解释的解释如柱型图,斜型分布是平均的分布从分布的中心偏向左或右,是左右非对称的Skewness表示数据偏移的程度正态分布时正态分布时 Skewness Skewness为为0,0,右边斜型分布是右边斜型分布是(+),(+),左边斜型左边斜型分布是分布是(-)(-)值值.在左边图中在左边图中SkewnessSkewness值为值为2.186,2.186,是是(+)(+)值值,因此是右边斜型分布因此是右边斜型分布第6页,讲稿共14张,创作于星期二尖度尖度(Skewness)(Skewness)的解释的解释急尖或平尖分布的平均的分布在中心,但左,右两边的尾巴比正态分布短或长.Kurtosis称为尖度,表示分布形态的平或尖的程度正态分布时正态分布时 Kurtosis Kurtosis为为0,0,急尖分布时急尖分布时(+),(+),平尖分布时平尖分布时(-)(-)值值.在左图中在左图中KurtosisKurtosis值为值为3.082,3.082,是是(+)(+)值值,可以看出是平尖分布可以看出是平尖分布第7页,讲稿共14张,创作于星期二3.3.非正态分布的原因非正态分布的原因非对称或非正态分布的问题是在现场经常出现的问题,其潜在的原因如下1)1)具有自然界限的数据具有自然界限的数据2)2)筛选检查时不良品的选别筛选检查时不良品的选别 3)3)分布的混合分布的混合4)4)输入变量与输出变量间的非线性关系输入变量与输出变量间的非线性关系5)5)输入变量间的交互作用输入变量间的交互作用6)6)按照时间的工程变化按照时间的工程变化7)7)缺乏独立性或周期的变化缺乏独立性或周期的变化8)8)测定器精密度问题测定器精密度问题9)9)具有异常点具有异常点(Outliers)(Outliers)的数据的数据第8页,讲稿共14张,创作于星期二1)1)1)1)具有自然界限的情况具有自然界限的情况具有自然界限的情况具有自然界限的情况在物理上或不可避地存在无法测定数据的最小值或最大值时,例如时间,不纯度,平坦度.主要 形成左边或右边斜型的分布形成左边或右边斜型的分布.1210864201009080706050403020100121086420150100500频频率率数数工程与自然界限有一定距离时工程与自然界限有一定距离时 工程与自然界限相近时工程与自然界限相近时121086420150100500频频率率数数第9页,讲稿共14张,创作于星期二2)2)因筛选检查因筛选检查因筛选检查因筛选检查,选别时选别时选别时选别时测定值的最初分布测定值的最初分布超过规格上,下限的数据选别后删除或通过再作业调查(斜型,平尖)有意地选别良品后剩下的数据(多重峰)时发生非正态分布规格外的制品规格外的制品废弃时左废弃时左,右边右边斜型分布斜型分布规格外的制品规格外的制品再作业再作业,调整时调整时左左,右边斜型分布右边斜型分布两侧规格外的两侧规格外的制品选别时平制品选别时平尖分布尖分布规格内的制品规格内的制品有意选别时剩有意选别时剩下多重分布下多重分布规格下规格下限限规格上规格上限限第10页,讲稿共14张,创作于星期二3)3)分布混合时分布混合时实际的工程并不只受同一条件的约束,因多样作业条件或多数原因输入的提供,有可能存在分布的混合.这种相异的根源是输出非对称的原因,因此我们应该集中找出潜在原因例如例如因不同的机器因不同的机器因不同时间因不同时间因使用不同原资材因使用不同原资材因不同作业者因不同作业者分布混合时分布混合时,发生这种非正态发生这种非正态分布分布左左,右边斜型右边斜型急尖急尖平尖平尖第11页,讲稿共14张,创作于星期二4)4)4)4)输入输入输入输入,出变量间为非线性时出变量间为非线性时出变量间为非线性时出变量间为非线性时对输入变量X,输出变量Y具有非线性关系时,即使输入变量管理为正态输出变量分布也有可能表现为非正态输入变量与输出变量的非线输入变量与输出变量的非线性关系可能影响尖度性关系可能影响尖度.特别是特别是在化学工程经常出现在化学工程经常出现非线性关系曲线非线性关系曲线Y Y 的周边分布的周边分布(右边斜型右边斜型)X X 的周边分布的周边分布(正态曲线正态曲线)第12页,讲稿共14张,创作于星期二5)5)5)5)输入变量间具有交互作用时输入变量间具有交互作用时输入变量间具有交互作用时输入变量间具有交互作用时输入变量Xs全部是正态分布时如果它们之间有交互作用时输入变量Y有可能是非对称的.如下例:某一工程使用的粘接剂的粘性低,温度高时收率下降,粘性高,温度高时收率也上升,存在这种交互作用时收率的分布是非正态分布.收率的分布收率的分布(右边斜型右边斜型)输出80%相对粘性30%相对粘性3530255075温度的分布温度的分布(正态分布正态分布)粘性的分布粘性的分布(正态分布正态分布)输入输入第13页,讲稿共14张,创作于星期二感感谢谢大大家家观观看看第14页,讲稿共14张,创作于星期二