质量分析与质量改进44240.pptx
质量分析与质量改进质量分析与质量改进培训内容培训内容21、质量改进用的随机变量分布 连续随机变量的概率分布问题。采用概率密度的概念,即是随机变量(连续)单位长度上的概率p(x)概率密度函数是概率密度与随机变量(自变量)的变化关系,显然p(x)0,它与x轴所夹的面积恰好为1。其在区间(a,b)上取值的概率P(ax b)为概率密度曲线下,区间(a,b)上的面积。一、随机变量分布技术 正态分布:概率密度函数 a、根据函数可知图形以 值构成纵向对称,呈钟形曲线;b、为正态分布均值,是分布中心位置,是正态分布的方差,表明分散性。决定了正态分布曲线的形状,故正态曲线用 表示;c、曲线围绕横轴的总面积等于1;d、固定 ,不同的 ,则曲线形状不变,只是在横轴上的位置改变;e、固定 ,改变 ,则曲线位置不变,只是改变了形状。正态概率分布函数标准正态分布 当 的正态分布,称标准正态分布,记为 u N(0,1)。其随机变量记为u,概率密度函数记为 标准正态曲线只有一条(唯一),因而可制成表绘成图,可以根据u的大小在表中查得对应的概率。标准正态概率密度和标准正态概率分布表起同样的作用 根据定义及图形可获得如下的计算公式:标准正态分布的分位数 N(0,1)的 分位数是一个在分位数左侧面积为 ,右侧面积恰好为 的分界线,即 分位数是满足下列等式的实数 就是分位数,可根据概率 的大小在标准正态表中查到。尾数可用内插法决定。例1:求 的分位数 因为表中 都大于0.5,不能直接查表,故需变换,根据对称性知:例2:求 的分位数 因为正态分布表中不能直接查 ,只有 由于 刚介于0.9495与0.9505中间,故 正态分布的计算 任一正态变量x经过标准化变换 后 都可以变换成标准正态变量u。例:因此以下正态分布的概率计算可方便的利用标准变换。式中 为标准正态分布函数,可以直接查表。举例1:电阻器的规格限为 ,服从正态分布,均值80.80k,则其低于 的概率和超过 的概率分别为举例2:已知:1、受控情况下,产品质量特性的分布 2、产品规格限,包括上规格限 和下规格限 ,它们是依据文件中的规定,顾客要求,公认的标准,企业下达的任务书等来决定的。问题一:分布中心与规格中心 重合时,产品的质量特性x超出规格限 的不合格品率。规格限合格品率()不合格品率(ppm)68.2731730095.454550099.73270099.99376399.9999430.5799.99999980.002问题二:分布中心与规格中心不重合时。不合格品率的计算。1、允许有 的偏移;2、偏移只在一个方向上,不能上下同时发生。2、统计量与抽样分布 、统计量 样本通过加工把零散的信息集中起来以反映总体的特征,其中构造样本函数是一种有效的方法,不同函数反映总体的不同特征,通常我们将不含未知参数的样本函数称为统计量。统计量举例、抽样分布 统计量的分布称抽样分布抽样分布的解释样本1样本2样本3样本411911121140109911910108111181313109.810.210.810.4总体8991110911121013910111310109101012计算每个样本的均值,它们不全相等为什么这些样本均值不全相等呢?因为抽样的随机性若取更多的样本,会发生什么呢?会产生样本均值分布样本1样本2样本3样本41.301.931.481.14计算每个样本的标准差,它们也不全相等由于抽样的随机性,该样本标准差不全相等若取更多样本,会产生样本标准差的分布抽样分布的解释可以得出:1)每个统计量都有一个抽样分布;2)不同统计量有不同的抽样分布,当样本来自 时,其样本均值 ,方差 ,以及它们的某种组合所组成的抽样分布,在理论上已经导出;3)抽样分布是统计推断的基础。4)、正态分布的 抽样分布。5)当 已知时,正态总体 的样本 均值分布为 这可通过标准化变换得到,当 未知时,即用样本标准差S代替上式中的 ,此时。称服从自由度为n1的t分布,即t(n-1)i.t (n-1)与N(0,1)的概率密度函数类似,是对称分布;ii.t (n-1)的峰值比N(0,1)略低,底部略宽;iii.当自由度(n1)超过30时,两者区别不大。iv.正态样本 的分布 分布v.定义:正态样本方差 除以总体方差 的(n1)倍的分布,是自由度为(n1)的 分布,记为 分布的概率密度函数在正半轴上是偏态函数两个独立的正态样本方差之比的分布F分布定义:a、两个独立的正态总体 方差相等;b、是分别来自 的两个样本,它们互相独立;c、这两个样本方差之比的分布是自由度为n1和m1的F分布二、参数估计 在实际问题中,总体的参数都是未知的,需要选用适当的统计量作为未知参数的估计,此统计量称为点估计量。点估计定义:用样本的某一函数作为总体中未知参数的估计。设 是总体的某个未知参数,X是该总体的随机变量,是总体的一个样本量为n的样本,若构造一个统计量,用它作为对 的估计,则称 是 的点估计。如抽取到一个 ,就可计算出 值,此乃估计量中的一个具体值。点估计优良性标准 是随机的,不能用某个具体的估计值来评价 是否接近 的优劣,应从多次使用中来评定。与 之间总有偏差,即 ,但因 未知,其差也无法得到,通常用多次采样,将不同的 进行 的平均。即用 来表征估计量 的优劣,因此 此时称 是无偏的,否则称有偏的,无偏性是表示估计优良性的一个重要指标,在选择估计值时尽量选用无偏估计量。式中 是估计量的方差,希望方差愈小愈好,这是估计优良性的另一指标。点估计方法 无论是总体均值 或总体方差 都可用样本的均值或方差作出估计,这就是点估计:用样本矩去估计相应的总体矩。用样本矩的函数去估计相应的总体矩的函数。此法简单实用,对 的估计是无偏的,对 的估计也是无偏的,但这种估计未必总是有效的,也不唯一。点估计举例(正态总体参数的无偏估计)例:把钢材弯成钢夹,其间隙大小是一个重要特性,现从生产线上随机取5个钢夹测量其间隙,得数据如下:0.75 0.70 0.65 0.70 0.60 已知钢夹间隙服从正态分布 ,试定出参数 的无偏估计。解:用样本均值 估计 ,用样本方差 估计 :区间估计概述:点估计只给出参数的一个具体估计值,未给出估计精度,而区间估计是用一个区间来估计未知参数,区间体现了估计的精度。区间估计定义 是总体的待估计参数,其一切可能取值组成参数空间 。记 是总体的样本量为n的样本,对给定的 确定两个统计量:若对任意 ,则称随机区间 是 的置信水平为 的置信区间。正态总体参数的置信区间总体均值 的置信区间求法注:、该区间的中心为 ,区间半径为 、置信水平增大时,置信区间的长度将增加,因为此时 减小,则 就增大。、若要提高估计精度,势必要缩短置信区间的长度,在置信水平及标准差都不变的情况下,只有加大n.总体 的置信区间求法应用举例例1:某溶液中的甲醛浓度服从正态分布,从中抽取一个n4的样本得 9.34,样本S0.03,分别求正态均值 的95的置信区间。解:求 的置信区间,因 未知,故用t分布来求。根据 8.34,S0.03,及n4,0.05,查t分布表,得。例2:一物体的重量未知,若用天平去称,所得称重总有误差,且是一个随机变量,通常服从正态分布。如果已知称重误差的标准差为0.1克(根据天平精度给出),为使 的95的置信区间长度不超过0.1,则至少应称多少次?这是估计样本量的问题,在 已知时,的95置信区间为:三、假设检验假设检验问题 用来判定获取的样本值与总体值或几个样本值之间的差异是确实存在还是由于偶然因素产生的。对总体参数分布做某种假设,再根据抽取的样本观测值,运用统计分析方法,检验这种假设是否成立,从而决定是接受或拒绝这一假设。这一过程就是假设检验。例:装配线的直通率在最近三个月内由95降为85,经分析认为,由于供应商A和B提供的电子物料品质(某参数均值)不同,是造成直通率下降 的原因,试通过假设检验对这种判断进行检验。例:某车床加工零件的外园直径目标值为550mm,之前,零件尺寸的标准差 ,现从加工零件中抽取35个,测得35个数据,试问外园直径均值是否偏离目标值。意义:1、用样本代替总体(节省时间,降低成 本,替代某种不可能的事。)2、确认这种替代的精确性或可行性。假设检验步骤1、2、步骤:根据所获样本,运用统计分析方法,对总体的某种假设H0作出接收或拒绝的判断。建立假设:日生产化纤纤度肯定会偏离目标值1.40,若是随机误差引起的差异,则认为H0:1.40会成立。若是别的特殊因素引起的差异,则应拒绝H0,此时相反的假设 这叫备择假设,若 也叫备择假设,但这是单侧检验问题。,选择统计量,给出拒绝域的形式 由于检验涉及 ,因此选用样本均值 是合适的,把 作为 分布的均值更易把 区分开来。显著性水平 的含义 利用统计技术处理问题,难免不犯错误,问题在于控制犯错误的概率,假设检验中常犯两种错误:第一类错误(拒真错误)和第二类错误(取伪错误)。它们发生的概率分别为 。判断正确第二类错误(发生概率为 )第一类错误(发生概率为 )判断正确接受H0接受H1统计判断真实情况H0成立H1成立 理论分析表明:在相同样本量时,取得小,必导致 增大。在相同样本量时,要使 小,必导致 增大。要同时使 都减小,只有增大样本量n才能实现。通常是控制 ,不使 过小,常选 从中制约 。把第一类错误概率控制在 的意思是:“”确定临界值c,给出拒绝域W 据N(0,1)的分位数性质:判断 本例通过u统计量实施假设检验,故称作u检验,在正态总体中,有关它的假设检验总是涉及两个参数 ,如果是 的假设检验,而 已知,则如上所述,用u检验,如果 未知,则用t检验,如果是 的假设检验,则用 检验,上述各种正态总体 的假设检验综合在下表:检验法条件H0H1检验统计量拒绝域举例例1:据环保法规定,倾入河流的废水中有毒物质平均含量不得超过3ppm,已知废水中该有毒物质含量服从正态分布,现对倾入河中的废水进行检查,15天的记录如下(单位:ppm)3.1,3.2,3.3,2.9,3.5,3.4,2.5,4.3,2.9,3.6,3.2,3.0,2.7,3.5,2.9 试在 水平上判断该厂排污是否符合环保规定。解:如果符合环保规定,那么,应该不超过3ppm,不符合的话应该大于3ppm。所以立假设:由于 未知,故选用t检验 根据显著性水平 及备择假设确定拒绝域为 根据样本观测值,求得 ,因而有由于它大于1.7613,所以检验统计量t落在拒绝域中,因此在 水平上拒绝原假设,认为该厂不符合环保规定,应该采取措施降低废水中该有毒物质的含量。例2:某导线电阻服从 未知,要求电阻标准差不得超过 ,现从一批导线中随机抽取了9根,其样本的标准差为S0.0066,问:在 水平时该批导线电阻是否合格。解:建立假设:选用 检验。根据显著水平 及备择假设,可确定拒绝域为:由样本观测值,求得:由于 值未落在拒绝域中,所以不能拒绝原假设,可以认为该批导线电阻波动合格。四、正交试验概述1、质量改进项目,涉及多个因素和多个水平,要确定其中的主要影响因素和水平,要找到因素和水平之间的最佳组合,以达到改进目的。2、由试验获得的结果是客观和可信的,试验综合了现场的各种条件,试验结果比理论分析结果更真实,可靠。3、试验涉及多个因素和水平,要从众多的试验中寻找最佳结果并非易事,试验工作量大,如 使人望而生畏。试验设计为我们提供了一种试验工作量小,又能获取优化结果的有效方法。有关名词解释试验指标:考察要达到的效果(目标),有数量指标(长度、电压、强度),非数量指标(颜色、外观等定性指标)。因素:对试验指标产生影响的参数,定量描述因素,定性描述因素,单因数试验,多因素试验。水平(位级):因素变化的各种状态和条件,一个因素往往有好几个水平。完全因素水平组合:正交表:正交设计的基本工具,它是运用组合数学和试验设计经验,构成的规范化表格。正交表符号正交表举例:1234123456789111222333123123123123231312123312231列号试验号正交表正交性 正交性体现在两方面,整齐可比性;因素水平的均衡分散性。整齐可比性:表中每一因素的每一水平,所出现的次数完全相同。每个因素及水平在试验结果中与其它因素及水平参与试验的机率完全相同,以保证各水平平等参与不造成干扰。均衡分散性:表中任意两列(因素)的搭配(横向数字对)完全相同,保证试验条件均衡分散在因素水平的完全组合之中,具有很好的代表性。分散可比性就是正交性 图中以三个平面,每个平面上分成等间隔的三行,三列。每行、每列都有一个点。二、无交互作用的正交设计与数据分析试验的设计步骤:、明确试验目的;、确定试验指标,用来判断试验条件的好坏,指标越大(或越小、相等),试验条件越好;、选择因子与水平:首先要分析影响指标的因素是什么,每个因素取哪些水平,通过理论与实践的经验综合判定。、选用合适的正交表,进行表头设计,列出试验计划。首先根据试验中考察的因子水平数和因子的个数具体选定一张表。、把因子放到选定的正交表的列上去,即是表头设计。、试验计划即是将列中因子的数字换成因子的相应水平,不放因子的列就不考虑,允许有空白列。进行试验和记录试验结果 将试验结果记录在试验条件后面 1、试验注意事项:、试验次序要随机化,避免因考虑不周而产生系统误差;、试验中应避免操作人员不同,仪器设备不同引起的系统误差,尽可能使试验外的其它因素固定,若不能避免时,可增加一个区间因子。(如人)、试验时,常需要在同一条件下进行重复,可观察试验的稳定性。应用实例 例:按质量要求,磁鼓电机输出力矩应大于0.0210Nm,欲通过试验设计找到好的条件,以提高磁鼓电机输出力矩。目的:提高磁鼓电机的输出力矩。指标:输出力矩是考察指标。因子与水平:经分析影响力矩的因子是:A:充磁量,B:定位角度,C:定子线圈匝数。根据以往经验,本试验采用如下水平:123A:充磁量()特90011001300B:定位角度(度)101112C:定子线圈匝数(匝)708090因子水平选用正交表,本题涉及三个因子,三个水平的正交表,故选用。将因子列中的数字换成相应的因子水平。正交表安排了9个不同的试验,呈“整体设计”,由三维图看9个试验点的分布。记录试验的结果。1、数据直观分析。寻找最好的试验条件 按水平号将数据分成三组,每组三个试验结果的和与平均值上述计算的 之间的差异只反映了A的三个水平间的差异,其中二水平数据最佳。同理可分析第2列,第3列,得到:因子B的二水平,因子C的三水平最好。综上可知,使指标达到最大的条件是 即充磁量取 特,定位角取11度,线圈取90匝时,力矩最大,达到0.0236Nm。比原力矩提高了 12.4。各因子对指标影响程度的分析 采用极差分析法,该“极差”是指某一因子的。极差大,说明该因子对指标造成的变化大,影响大,因子极差最大,故影响最大,其次是因子,再次是因子。因子水平对指标的影响图17016018019020021022090013001011127080902、数据方差分析问题:上述分析用极差评价各因子对指标的影响,那极差要小到何种程度时,可认为该因子对指标值已没有显著影响了呢?实际上,极差方法,不能辨别指标变化是因素水平还是误差原因所造成的,数据的方差分析可解决这个问题。假设:上述每一试验都是独立进行的。每一试验条件下的试验指标服从正态分布。试验随机变量分布的均值与试验条件有关,可能不相等。它们的方差是相等的。离差平方和分解各试验结果不同是由于试验条件不同及试验中存在误差。用总离差平方和ST描述,即是九次试验结果数据的总波动表头设计ABCY1234123456789111222333123123123123231312123312231160215180168236190157205140T1T2T3555594502485656510555523573536562553S1421.65686.9427.6116.2试验号列号数据波动源自各因子所取的不同水平及可能的试验误差 (组间平方和),分别表示各因子在三个水平下试验结果的平均值,则:未置因子的空白列,可安放由于误差造成的数据波动,称误差的离差平方和Se(组内平方和),其值为正交表上空白列的离差平方和相加。令SeS4。用代数法可证明:在 中有如下关系:F比:认为在显著性水平 上因子是显著的,分别是因子的均方与自由度,是误差的均方与自由度。因子与误差自由度的决定来源平方和自由度均方F比因子A1421.32710.812.23因子B5686.922843.448.94因子C427.62213.83.68误差e116.2258.1总计7652.28F0.90(2,2)9.0,F0.90(2,2)19.0、列自由度水平数1;、因子自由度与所在列自由度相等;、误差自由度为正交表上空白列自由度相加;、总离差平方和的自由度是试验次数n1;、当正交表中n,p,q满足(*)时,离差平方和有(*)式。自由度具有计算 用列表法计算各列的离差平方和与总离差平方和。利用(*)可验证离差平方和计算是否正确。对F比的计算可借助方差分析表3、最佳条件的选择原则:对显著因子应选择其最好的水平,对不显著因子可 任意选择水平,实际上常根据降低成本,操作方便等其它因素来确定。本例最佳条件:A2B2或A2B2 C,C无下标表示有很大灵活性。4、因子贡献率 当试验指标不服从正态分布时,方差分析的依据就不充分,此时采用“因子贡献率”来衡量因子作用的大小。来源平方和自由度纯平方和贡献率()因子A1421.621305.417.06因子B5686.925570.772.80因子C427.62311.44.07误差e116.22464.86.07总计7652.28结论:因子B最重要,其水平变化在数据引起的波动中占总离差的72.8;因子A的水平变化引起的指标变化占17.06,也是显著因素。5、验证试验 分析所得的最佳条件未必出现在试验中,为此通常需要验证试验,如A2B2 C1(不在9次试验中)。即使在试验条件中出现也需通过验证,看其是否稳定。几点说明质量指标的要求是望小值,望目值时,数据的处理。非数字指标的试验设计举例。调优试验 一般情况下通过一轮正交试验设计,难以捕捉到最佳试验方案。为此应多轮反复使用,以逼近最佳方案。每一轮正交试验后,应根据试验结果进行分析,然后作调优试验(确定下轮正交试验设计的因素和水平)。调优的原则为:、重要因素有苗头处加密水平。、次要因素按技术、经济两方面来综合考虑舍取。、有疑问的因素重复考虑。、意外发现的因素补充考虑。、若试验结果与预期目标差异较大时,应重新考虑因素位级的选择。三、有交互作用的正交设计与数据分析 多因子试验中,两个因子不同水平的搭配,对指标也会有影响,这种影响称A、B间的交互作用。提高某农药收率的试验设计。试验设计 设计与上述基本相同,但略有差异。试验目的:提高农药收率;试验指标:农药收率,指标越高越好。hhB2B1A1A2A1A2B2B1B2B1A2A1确定考虑的因子与水平及交互作用:因素有四个,据经验反应温度与反应时间的交互作用,对收率有较大影响AB。选用合适的正交表。进行表头设计,列出试验计划。本题要考察4个二水平因子及一个交互作用,因而可看成有5个二水平因子,故选用正交表 是适当的。表头设计时要利用交互作用表,指明任意两列的交互作用所在的列号,不可随意放置。因子水平1水平2A:反应温度()6080B:反应时间(小时)2.53.5C:两种原料配比1.1/11.2/1D:真空度(kPa)5060列号1234567(1)325476(2)16745(3)7654(4)123(5)32(6)1 有了表头便可写试验计划并进行计算,见下表:表头设计ABABCD列号1234567表头设计ABABCDY123456711(60)1(2.5)11(1.1/1)111(50)8621(60)1(2.5)12(1.2/1)222(60)9531(60)2(3.5)21(1.1/1)122(60)9141(60)2(3.5)22(1.2/1)211(50)9452(80)1(2.5)21(1.1/1)212(60)9162(80)1(2.5)22(1.2/1)121(50)9672(80)2(3.5)11(1.1/1)221(50)8382(80)2(3.5)12(1.2/1)112(60)88T1366368352351361359359T2358356372373363365365S8185060.50.54.54.5试验号列号数据分析1、方差分析 每一列离差平方和用下式计算:利用方差分析公式,可证明第三列的离差平方和即是交互作用的离差平方和,除误差外,只反映交互效应不同所引起的数据波动,记为 。的自由度为两因子自由度的乘积,是1。在 中同样有平方和分解式,各列离差平方和用 计算。由表可知,在 水平上,因子C与交互作用AB 对指标有显著的影响。来源平方和自由度均方F比A8.018.03.2B18.0118.07.2C60.5160.524.2D4.514.51.8AB50.0150.020E5.022.5总计146.07F0.95(1,2)18.52、最佳条件选择 当两因子交互作用显著时,暂不考虑每一因子是否显著,先分析两个因子不同搭配的指标均值,从中选择最好的搭配组合。A、B因子各占一列,各有两个水平,其搭配见下表:由此可见AB搭配A2B1以为最好,因子D不显著,水平可任取。最佳条件是A2B1 C2A1A2B1(86+95)/2=90.5(91+96)/2=93.5B2(91+94)/2=92.5(83+88)/2=85.5避免混杂现象 避免在一列中同时存在两个因子或交互作用的情况,否则存在两个因子或交互作用的列,将难以判别何者是显著因子,选用较多列数的正交表可避免此问题。原则:1、安排时,因子与所在列的自由度与因子的自由度相同;2、交互作用的自由度应与交互作用所占列的自由度之和相同。3、选择的正交表必须满足(必要条件),所考察因子的自由度与交互作用的自由度之和n1。举例:1、A,B,C,D为二水平因子,且要考察交互作用AB,AC。选二水平正交表,因子与交互作用的自由度之和为:2、A,B,C,D为二水平因子,且要考察交互作用AB,CD。选二水平正交表,因子与交互作用的自由度之和为6。表头设计ABABCACD列号12345673、A,B,C,D,E为三水平因子,且要考察AB。选三水平正交表,因子与交互作用的自由度之和表头设计ABABCDCD列号1234567表头设计ABABCDCD列号123456789101112131415表头设计ABABCDE列号123,45678910111213123456789谢谢观看/欢迎下载BY FAITH I MEAN A VISION OF GOOD ONE CHERISHES AND THE ENTHUSIASM THAT PUSHES ONE TO SEEK ITS FULFILLMENT REGARDLESS OF OBSTACLES.BY FAITH I BY FAITH