质量常用统计技术培训资料(ppt 92).pptx
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_05.gif)
《质量常用统计技术培训资料(ppt 92).pptx》由会员分享,可在线阅读,更多相关《质量常用统计技术培训资料(ppt 92).pptx(91页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、质量常用统计技术质量常用统计技术 方差分析方差分析 回归分析回归分析 试验设计试验设计上海质量教育培训中心上海质量教育培训中心2005年年第一节第一节 方差分析方差分析 一、几个概念一、几个概念二、单因子方差分析二、单因子方差分析 一、几个概念一、几个概念 在试验中改变状态的因素称为因子,常用大写在试验中改变状态的因素称为因子,常用大写英文字母英文字母A、B、C、等表示。等表示。 因子在试验中所处的状态称为因子的水平。因子在试验中所处的状态称为因子的水平。用代表因子的字母加下标表示,记为用代表因子的字母加下标表示,记为A1,A2,Ak。 试验中所考察的指标(可以是质量特性也可试验中所考察的指标
2、(可以是质量特性也可以是产量特性或其它)用以是产量特性或其它)用Y表示。表示。Y是一个随机变是一个随机变量。量。单因子试验:单因子试验:若试验中所考察的因子只有一个。若试验中所考察的因子只有一个。例例2.1-1 现有甲、乙、丙三个工厂生产同一种零现有甲、乙、丙三个工厂生产同一种零件,为了了解不同工厂的零件的强度有无明显的差件,为了了解不同工厂的零件的强度有无明显的差异,现分别从每一个工厂随机抽取四个零件测定其异,现分别从每一个工厂随机抽取四个零件测定其强度,数据如表所示,试问三个工厂的零件的平均强度,数据如表所示,试问三个工厂的零件的平均强度是否相同?强度是否相同? 工厂工厂 量件强度量件强度
3、 甲甲 乙乙 丙丙 103 101 98 110 113 107 108 116 82 92 84 86三个工厂的零件强度三个工厂的零件强度 在这一例子中,考察一个因子:在这一例子中,考察一个因子: 因子因子A:工厂:工厂该因子有三个水平:甲、乙、丙该因子有三个水平:甲、乙、丙试验指标是:零件强度试验指标是:零件强度 这是一个单因子试验的问题。每一水平下的这是一个单因子试验的问题。每一水平下的试验结果构成一个总体,现在需要比较三个总体试验结果构成一个总体,现在需要比较三个总体均值是否一致。如果每一个总体的分布都是正态均值是否一致。如果每一个总体的分布都是正态分布,并且各个总体的方差相等,那么比
4、较各个分布,并且各个总体的方差相等,那么比较各个总体均值是否一致的问题可以用方差分析方法来总体均值是否一致的问题可以用方差分析方法来解决。解决。二、单因子方差分析二、单因子方差分析 假定因子假定因子A有有r个水平,在个水平,在Ai水平下指标服水平下指标服从正态分布,其均值为从正态分布,其均值为 ,方差为,方差为 ,i=1,2, , r。每一水平下的指标全体便构成一个总体,共。每一水平下的指标全体便构成一个总体,共有有r个总体,这时比较各个总体的问题就变成比个总体,这时比较各个总体的问题就变成比较各个总体的均值是否相同的问题了,即要检验较各个总体的均值是否相同的问题了,即要检验如下假设是否为真:
5、如下假设是否为真:i2r:H 210 当当 不真时,表示不同水平下的指标的均不真时,表示不同水平下的指标的均值有显著差异,此时称因子值有显著差异,此时称因子A是显著的,否则是显著的,否则称因子称因子A不显著。检验这一假设的分析方法便不显著。检验这一假设的分析方法便是方差分析。是方差分析。0H 方差分析的三个基本假定方差分析的三个基本假定1. 在水平在水平 下,指标服从正态分布下,指标服从正态分布 ;iA),(Ni2 2. 在不同水平下,各方差相等;在不同水平下,各方差相等;3. 各数据各数据 相互独立。相互独立。ijy 设在一个试验中只考察一个因子设在一个试验中只考察一个因子A,它有,它有r个
6、个水平,在每一水平下进行水平,在每一水平下进行m次重复试验,其结果用次重复试验,其结果用 表示,表示,i=1,2, , r。 常常把数据列成常常把数据列成如下表格形式:如下表格形式:imiiy,y,y21单因子试验数据表单因子试验数据表水平水平试验数据试验数据和和均值均值A1myyy11211,T11yA2myyy22221,T22yArrmrryyy,21Trry 记第记第i水平下的数据均值为水平下的数据均值为 ,总均值为,总均值为 。此。此时共有时共有n=rm个数据,这个数据,这n个数据不全相同,它们的个数据不全相同,它们的波动(差异)可以用总离差平方和波动(差异)可以用总离差平方和ST去
7、表示去表示iyy rimjijT)yy(S112记第记第i 水平下的数据和为水平下的数据和为Ti, ; mjijiyT1引起数据波动(差异)的原因不外如下两个:引起数据波动(差异)的原因不外如下两个: 一是由于因子一是由于因子A的水平不同,当假设的水平不同,当假设H0不真不真时,各个水平下指标的均值不同,这必然会使试时,各个水平下指标的均值不同,这必然会使试验结果不同,我们可以用组间离差平方和来表示,验结果不同,我们可以用组间离差平方和来表示,也称因子也称因子A的离差平方和:的离差平方和: riiAyymS12这里乘以这里乘以m是因为每一水平下进行了是因为每一水平下进行了m次试验。次试验。 二
8、是由于存在随机误差,即使在同一水平下二是由于存在随机误差,即使在同一水平下获得的数据间也有差异,这是除了因子获得的数据间也有差异,这是除了因子A的水平的水平外的一切原因引起的,我们将它们归结为随机误外的一切原因引起的,我们将它们归结为随机误差,可以用组内离差平方和表示:差,可以用组内离差平方和表示: rimjiijeyyS112 Se:也称为误差的离差平方和:也称为误差的离差平方和可以证明有如下平方和分解式:可以证明有如下平方和分解式:eATSSS ST、SA、Se 的自由度分别用的自由度分别用 、 、 表示,它们也有分解式:表示,它们也有分解式: ,其中:,其中:TfAfefeATfff 1
9、 试试验验数数Tf1 水水平平数数AfATefff 因子或误差的离差平方和与相应的自由度因子或误差的离差平方和与相应的自由度之比称为因子或误差的均方和,并分别记为:之比称为因子或误差的均方和,并分别记为:AAAfSMS eeefSMS 两者的比记为:两者的比记为:eAMSMSF 当当 时认为在显著性水平时认为在显著性水平 上因上因子子A是显著的。其中是显著的。其中 是自由度为是自由度为 的的F分布的分布的1-分位数。分位数。),(1eAffFF ),(1eAffF eAff ,单因子方差分析表单因子方差分析表 来源来源偏差平方和偏差平方和自由度自由度均方和均方和F比比因子因子A误差误差eSAS
10、e1 rfArnfe AAAfSMS eeefSMS eAMSMSF 总计总计TST1 nfT各个离差平方和的计算:各个离差平方和的计算: nTyyySrimjijrimjijT2112112 r1i22i2ir1iAnTmTyymSATeSSS 其中其中 是第是第i个水平下的数据和;个水平下的数据和;T表示表示所有所有n=rm个数据的总和。个数据的总和。 iT进行方差分析的步骤如下:进行方差分析的步骤如下: (1)计算因子)计算因子A的每一水平下数据的和的每一水平下数据的和T1,T2,Tr及总和及总和T; (2)计算各类数据的平方和)计算各类数据的平方和 ; 222,TTyiij (3)依次
11、计算)依次计算ST,SA,Se; (4)填写方差分析表;)填写方差分析表; (5)对于给定的显著性水平)对于给定的显著性水平,将求得的,将求得的F值与值与F分布表中的临界值分布表中的临界值 比较,当比较,当 时认为因子时认为因子A是显著的,否则认为是显著的,否则认为因子因子A是不显著的。是不显著的。 eAffF,1 eAffFF,1 对上例的分析对上例的分析 (1)计算各类和:)计算各类和: 每一水平下的数据和为:每一水平下的数据和为: 344,444,412321 TTT数据的总和为数据的总和为T=1200 (2)计算各类平方和:)计算各类平方和: 原始数据的平方和为:原始数据的平方和为:
12、1214922ijy每一水平下数据和的平方和为每一水平下数据和的平方和为 4852162 iT(3)计算各离差平方和:)计算各离差平方和: ST=121492-12002/12=1492, fT=34-1=11SA=485216/4-12002/12=1304, fA=3-1=2Se= 1492-1304=188, fe=11-2=9(4)列方差分析表:)列方差分析表: 例例2.1-1的方差分析表的方差分析表 来源来源偏差平方和偏差平方和自由度自由度均方和均方和F比比因子因子A1304AS2Af652 AMSF=31.21误差误差e188eS9ef920.MSe 总计总计T1492TS11Tf
13、(5) 如果给定如果给定 =0.05,从,从F分布表查得分布表查得 26. 4)9 , 2(95. 0 F 由于由于F4.26,所以在,所以在 =0.05水平上结论是因水平上结论是因子子A是显著的。这表明不同的工厂生产的零件强是显著的。这表明不同的工厂生产的零件强度有明显的差异。度有明显的差异。 当因子当因子A是显著时,我们还可以给出每一水是显著时,我们还可以给出每一水平下指标均值的估计,以便找出最好的水平。在平下指标均值的估计,以便找出最好的水平。在单因子试验的场合,第单因子试验的场合,第i个水平指标均值的估计个水平指标均值的估计为:为: iiy , ri, 2 , 1 在本例中,三个工厂生
14、产的零件的平均强度在本例中,三个工厂生产的零件的平均强度的的估计分别为:的的估计分别为: 86,111,103321 由此可见,乙厂生产的零件的强度的均值由此可见,乙厂生产的零件的强度的均值最大,如果我们需要强度大的零件,那么购买最大,如果我们需要强度大的零件,那么购买乙厂的为好;而从工厂来讲,甲厂与丙厂应该乙厂的为好;而从工厂来讲,甲厂与丙厂应该设法提高零件的强度。设法提高零件的强度。 误差方差的估计:这里方差误差方差的估计:这里方差 的估计是的估计是MSe。在本例中:在本例中: 的估计是的估计是20.9。 2 2 的估计是的估计是 57. 49 .20 例例2.1-2 略(见教材略(见教材
15、P92)三、重复数不等的情况三、重复数不等的情况 若在每一水平下重复试验次数不同,假定若在每一水平下重复试验次数不同,假定在在Ai水平下进行水平下进行 次试验,那么进行方差分次试验,那么进行方差分析的步骤仍然同上,只是在计算中有两个改动:析的步骤仍然同上,只是在计算中有两个改动: im imnnTmTSriiiA212 例例2.1-3 某型号化油器原中小喉管的结构使某型号化油器原中小喉管的结构使油耗较大,为节约能源,设想了两种改进方案以油耗较大,为节约能源,设想了两种改进方案以降低油耗。油耗的多少用比油耗进行度量,现在降低油耗。油耗的多少用比油耗进行度量,现在对用各种结构的中小喉管制造的化油器
16、分别测定对用各种结构的中小喉管制造的化油器分别测定其比油耗,数据如表所列,试问中小喉管的结构其比油耗,数据如表所列,试问中小喉管的结构(记为因子(记为因子A)对平均比油油耗的影响是否显著。)对平均比油油耗的影响是否显著。(这里假定每一种结构下的油耗服从等方差的正(这里假定每一种结构下的油耗服从等方差的正态分布)态分布) 例例2.1-3的试验结果的试验结果 水平水平试验结果(比油耗试验结果(比油耗-220)A1:原结构:原结构11.0 12.8 7.6 8.3 4.7 5.5 9.3 10.3A2:改进方案:改进方案12.8 4.5 -1.5 0.2A3:改进方案:改进方案24.3 6.1 1.
17、4 3.6 (为简化计算,这里一切数据均减去(为简化计算,这里一切数据均减去220,不,不影响影响F比的计算及最后分析因子的显著性)比的计算及最后分析因子的显著性) (1)各水平下的重复试验次数及数据和分别为:)各水平下的重复试验次数及数据和分别为: A1:m1=8,T1=69.5A2:m2=4,T2=6.0A3:m3=4,T3=15.4总的试验次数总的试验次数n=16,数据的总和为,数据的总和为T=90.9 (2)计算各类平方和:)计算各类平方和: 41.7572 ijy07.6722 iimT43.5162 nT(3)计算各离差平方和:)计算各离差平方和: ST=757.41-516.43
18、=240.98, fT=16-1=15SA=672.07-516.43=155.64, fA=3-1=2Se= 240.98-155.64=85.34, fe=15-2=13(4)列方差分析表:)列方差分析表: 例例2.1-3方差分析表方差分析表 来源来源偏差平方和偏差平方和自由度自由度均方和均方和F 比比因子因子 A64.155 AS2 Af8277.MSA 86.11 F误差误差 e34.85 eS13 ef566.MSe 总计总计 T98.240 TS15 Tf(5) 如果给定如果给定 =0.05,从,从F分布表查得分布表查得 81. 3)13, 2(95. 0 F 由于由于F3.81,
19、所以在,所以在=0.05水平上我们水平上我们的结论是因子的结论是因子A是显著的。这表明不同的中小是显著的。这表明不同的中小喉管结构生产的化油器的平均比油耗有明显喉管结构生产的化油器的平均比油耗有明显的差异。的差异。 我们还可以给出不同结构生产的化油器的平我们还可以给出不同结构生产的化油器的平均比油耗的估计:均比油耗的估计: 69.22822069. 81 50.22122050. 12 85.22322085. 33 这里加上这里加上220是因为在原数据中减去了是因为在原数据中减去了220的缘故。的缘故。 由此可见,从比油耗的角度看,两种改进由此可见,从比油耗的角度看,两种改进结构都比原来的好
20、,特别是改进结构结构都比原来的好,特别是改进结构1。 在本例中误差方差的估计为在本例中误差方差的估计为6.56,标准差,标准差的估计为的估计为2.56。 第二节第二节 回归分析回归分析 例例2.2-1 合金的强度合金的强度y与合金中的碳含量与合金中的碳含量x有有关。为了生产出强度满足顾客需要的合金,在冶关。为了生产出强度满足顾客需要的合金,在冶炼时应该如何控制碳含量?如果在冶炼过程中通炼时应该如何控制碳含量?如果在冶炼过程中通过化验得到了碳含量,能否预测合金的强度?过化验得到了碳含量,能否预测合金的强度? 这时需要研究两个变量间的关系。首先是收这时需要研究两个变量间的关系。首先是收集数据集数据
21、(xi,yi),i=1,2, ,n。现从生产中收集到表。现从生产中收集到表2.2-1所示的数据。所示的数据。 表表2.2-1 数据表数据表 序号序号xy10.1042.020.1143.530.1245.040.1345.550.1445.060.1547.570.1649.080.1753.090.1850.0100.2055.0110.2155.0120.2360.0一、散布图一、散布图 6050400.150.200.10 xy例例2.2-1的散布图的散布图 二、相关系数二、相关系数 1相关系数的定义相关系数的定义 在散布图上在散布图上 n 个点在一条直线附近,但又个点在一条直线附近,但
22、又不全在一条直线上,称为两个变量有线性相关不全在一条直线上,称为两个变量有线性相关关系,可以用相关系数关系,可以用相关系数 r 去描述它们线性关系去描述它们线性关系的密切程度的密切程度 yyxxxyLLLr 其中其中 nTTyxyyxxLyxiiiixy)( nTxxxLxiixx222 nTyyyLyiiyy222 iyixyTxT,性质:性质: 1 r 表示表示n个点在一条直线上,这时两个个点在一条直线上,这时两个变量间完全线性相关。变量间完全线性相关。 1r r0表示当表示当x增加时增加时y也增大,称为正相关也增大,称为正相关 r0.576,说明两个变量间有(正)线性相关关系。说明两个变
23、量间有(正)线性相关关系。 576. 0)10(975. 0 r四、一元线性回归方程四、一元线性回归方程 1. 一元线性回归方程的求法:一元线性回归方程的求法: 一元线性回归方程的表达式为一元线性回归方程的表达式为 bxay 其中其中a与与b使下列离差平方和达到最小:使下列离差平方和达到最小: 2)(),(iibxaybaQ通过微分学原理,可知通过微分学原理,可知 xxxyLLb , xbya 称这种估计为最小二乘估计。称这种估计为最小二乘估计。 b 称为回归系数;称为回归系数;a一般称为常数项。一般称为常数项。 求一元线性回归方程的步骤如下:求一元线性回归方程的步骤如下: (1)计算变量)计
24、算变量x与与y的数据和的数据和Tx,Ty;(2)计算各变量的平方和与乘积和;)计算各变量的平方和与乘积和;(3)计算)计算Lxx,Lxy;(4)求出)求出b与与a;利用前面的数据,可得:利用前面的数据,可得: b=2.4392/0.0186=130.6022 a=590.5/12-130.6022 1.90/12=28.5297 (5)写出回归方程:)写出回归方程: xy6022.1305340.28 画出的回归直线一定通过(画出的回归直线一定通过(0,a)与)与 两点两点 ),(yx上例:上例: bxay 或或 xxbyy 2. 回归方程的显著性检验回归方程的显著性检验 有两种方法:有两种方
25、法: 一是用上述的相关系数;一是用上述的相关系数; 二是用方差分析方法(为便于推广到多元二是用方差分析方法(为便于推广到多元线性回归的场合),将总的离差平方和分解成线性回归的场合),将总的离差平方和分解成两个部分:回归平方和与离差平方和。两个部分:回归平方和与离差平方和。 总的离差平方和:总的离差平方和: 2yySiT回归平方和:回归平方和: xyiRbLyyS 2离差平方和:离差平方和: RTiiESSyyS 2且有且有ST=SR+SE,其中,其中 iibxay 它们的自由度分别为:它们的自由度分别为: fT=n-1,fR=1,fE=n-2=fT-fR 计算计算F比,比, EERRfSfSF
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 质量常用统计技术培训资料(ppt92)
![提示](https://www.taowenge.com/images/bang_tan.gif)
限制150内