方差分析的类型与计算方法.pptx
《方差分析的类型与计算方法.pptx》由会员分享,可在线阅读,更多相关《方差分析的类型与计算方法.pptx(52页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、方差分析方差分析 (ANOVA)GE Appliances Copyright 1999修订版 10 1999年1月11日方差分析方差分析 (ANOVA)GE Appliances Copyright 1999修订版 10 1999年1月11日目的目的:提供一种比较两个以上总体均值的客观方法。提供一种比较两个以上总体均值的客观方法。目标目标: 理解、应用和解释:单向ANOVA (单变量)平衡ANOVA (多变量)GLM (一般线性模型) 采用Minitab进行ANOVA/GLM分析方差分析方差分析 (ANOVA)GE Appliances Copyright 1999修订版 10 1999年1
2、月11日用来确定因变量(“ Y”)与单个或多个自变量(“ Xs”)间关系的统计显著性的方法,其中(“ Xs”)具有两个或多个水平。是确定每一水平的响应变量值的均值是否来自同一总体的一种方法。(它们有所不同吗?)筛选潜在的关键少数“ Xs”的方法ANOVA适于自变量为适于自变量为离散离散变量、因变量为变量、因变量为连续连续变量的情形。变量的情形。方差分析方差分析 (ANOVA)GE Appliances Copyright 1999修订版 10 1999年1月11日组间变差组间变差 (信号)信号) 组内变差组内变差 (噪音噪音)ANOVA确定不同水平的平均值间的差异(组间变差组间变差)是否大于各
3、水平内部产生的变差(组内变差组内变差)的合理预期 这就是其名字的来源当前当前间距间距新工序新工序总变差总变差水平水平1水平水平2组间组间信号比信号比内部内部噪音大吗噪音大吗?方差分析方差分析 (ANOVA)GE Appliances Copyright 1999修订版 10 1999年1月11日 组内变差组内变差 (噪音噪音)ANOVA计算的比例计算的比例:平均平均SSbetween平均平均SSwithin组间变差组间变差(信号信号) ( )总变差总变差SS = 平方和平方和 (变差的量度变差的量度)= 信号信号噪音噪音方差分析方差分析 (ANOVA)GE Appliances Copyrig
4、ht 1999修订版 10 1999年1月11日在分析阶段,您已经学习了怎样使用“t检验”方法来比较两个样本平均值的差异。(是否记得“ 双样本” t-检验?)例例:保险成本项目保险成本项目您怎样比较不同地区保险成本的平均值?五个地区的成本有差异吗您怎样比较不同地区保险成本的平均值?五个地区的成本有差异吗? 7631,3355963,7421,6324,3651,2621,4481,8335,0782,1442171,1833753,0101,9984,1003,2002,0106715,4122,9486307432,1459573,2109428674,0631,2868671,2851,2
5、331,2323113,7441281,0721,4568631,6358443,1052,7351,4996431,6831,7677671,9601,9961,1941,6752,279平均值平均值:地区运作保险成本地区运作保险成本($K)方差分析方差分析 (ANOVA)GE Appliances Copyright 1999修订版 10 1999年1月11日我们需要进行10次独立的比较以检验每对平均值。(AB, AC, AD, AE, BC, BD, BE, CD, CE, DE)即使所有平均成本都相同,仍有5%的机率来否定H0,并推断其中的一对平均值不相等。如果此检验步骤重复10次,错
6、误地得出至少有一对平均值有差异结论的风险就会很高(比5%高得多)。方差分析方差分析(AVOVA)允许我们同时进行所有允许我们同时进行所有10项比项比较,从而控制着总体较,从而控制着总体风险风险.所有可能的 “ 双样本” t-检验问题:ANOVA给出了同时比较五个平均值的单一假设检验。方差分析方差分析 (ANOVA)GE Appliances Copyright 1999修订版 10 1999年1月11日因素因素 - 自变量 (X)水平或设置水平或设置 - 因素的离散值或因素的设置平衡数据平衡数据 - 各因素不同水平的每一个组合都具有相等数量的样本或观测值。上例即为平衡数据,因为对于X的每个水平
7、,都有两个观测值(响应变量Y值)。非平衡数据非平衡数据 - 各因素不同水平的每一个组合并非都具有相等数量的样本或观测值。 Yf X ( )Y25228178X4040150150因素X有两个水平,40和150。 Y f X ( )Y2 5 7 7 8 1 7 8X4 0 1 5 0 1 5 0 1 5 0因素“ X” 有两个水平(40和150),但在此例中,150 水平有三个Y值,而40水平只有一个Y值。方差分析方差分析 (ANOVA)GE Appliances Copyright 1999修订版 10 1999年1月11日 单向单向ANOVA:单因素(“ X”)有两个以上水平 (设置),以及
8、一个连续的因变量 (Y)- 确定因素水平如何影响总的响应变差。 平衡平衡ANOVA:多个具有多水平的因素(两个以上“Xs”)、一个连续的因变量(“ Y”) - 确定每个因素对整个响应变差有多大影响。 GLM:与平衡ANOVA相同,只是GLM具有非非平衡平衡数据。 DOE (试验设计试验设计):在进行设计的试验中,确定各因素不同水平的哪些组合对响应变量的变差影响最大。运用运用ANOVA来回答这样一个问题:因素来回答这样一个问题:因素(“X”)水平对响应变量水平对响应变量(“ Y”)的总变差有多大影响的总变差有多大影响?方差分析方差分析 (ANOVA)GE Appliances Copyright
9、 1999修订版 10 1999年1月11日NorthWestCentralSouthEast010002000300040005000(group means are indicated by horizontal lines)residualsaverage1. 对于因素水平的每一组合对于因素水平的每一组合, 残差值的均值为残差值的均值为0.0这意味着我们所拟合的方程(或模型)正确,没有其它变量影响结果。 “ 观测” 值(圆圈)和“ 预计”值(数组平均值,水平线)间的差额为“ 残差”。方差分析方差分析 (ANOVA)GE Appliances Copyright 1999修订版 10 19
10、99年1月11日残差必须独立,并呈正态分布残差必须独立,并呈正态分布残差(或误差)即是实际观测的“ Y”值和预计的数学模型的“ Y”值。残差表明模型何处与数据不相匹配。 当比较平均值时,正态性往往不成问题。因为中心极限定理表明,平均值趋向正态分布。 当比较变差时,正态性非常重要。(方差齐性:对于正态数据,应用“ Bartlett”检验法,对于非正态数据,应用“ Levene”检验法)2.方差分析方差分析 (ANOVA)GE Appliances Copyright 1999修订版 10 1999年1月11日间距间距 I级级II级级另一个需要关注的问题(除平均值的相等性之外)是方差的相等性。“
11、X” 转变成不同水平时,可能降低变差,提高Z值。可以用Bartlett或Levene检验法来检验方差的相等性。注注:因素在水平因素在水平II上的方差很大,掩盖了不同水平平均值之间真正上的方差很大,掩盖了不同水平平均值之间真正的差异。的差异。3. 方差必须相等方差必须相等 (或接近相等或接近相等)方差分析方差分析 (ANOVA)GE Appliances Copyright 1999修订版 10 1999年1月11日一位开发工程师用一种特殊的粘合剂将两个部件粘在一起。另外还有两种可使用的粘合剂,但需要更高级的过程控制。如果其中的一种显示出平均抗剪强度不低于20,则值得更换粘合剂供应商、并改进过程
12、控制水平。水平水平 1当前当前粘合剂粘合剂912141318水平水平2配方配方A粘合剂粘合剂1815141715水平水平3配方配方B粘合剂粘合剂2119211623针对此例,运行Minitab 并打开文件:L:6sigmaminitabtrainingminitabsession 2adhesive.mtw独立数据存储在C1-C3栏中;堆叠数据及下标在C4和C5栏中。方差分析方差分析 (ANOVA)GE Appliances Copyright 1999修订版 10 1999年1月11日首先将数据制图!首先将数据制图!GraphPlot如图填写对话框:单击 OK选择 “ Options” 并通
13、过检查对话框添加 “ Jitter”方差分析方差分析 (ANOVA)GE Appliances Copyright 1999修订版 10 1999年1月11日10152025LevelsAll_DataCurrentAB观察图形:1. 三种粘合剂的平均值看上去是否相同?2. 是否有抗剪强度超过20的粘合剂?3. 三种粘合剂的方差是否相同?配方B(水平3)看上去具有比当前粘合剂或配方A都要高的抗剪强度。但是,直观上的差异并不意味差异具有统计显著性 - 我们需要进一步的分析,以确认这种图形分析的结果。并请注意:对于不同的粘合剂,方差并未表现出显著的不同。方差分析方差分析 (ANOVA)GE App
14、liances Copyright 1999修订版 10 1999年1月11日由于随机因素的影响,粘合剂的抗剪强度会产生一些波动,要证明其统计显著性,我们必须表明平均值的差异比偶然出现的差异大。1.测量的响应值(因变量)是什么?粘合剂抗剪强度粘合剂抗剪强度2. 评估的因素是什么?仅一个因素 - 粘合剂类型粘合剂类型3. 我们想知道什么结果?-三种类型的粘合剂三种类型的粘合剂 (水平水平)是否存在差异是否存在差异?-新型粘合剂的平均抗剪强度大于新型粘合剂的平均抗剪强度大于20吗吗?4. 我们将采用什么分析工具,为什么? - 单向单向ANOVA- 单因素单因素 (粘合剂类型粘合剂类型) - 三个水
15、平三个水平 (当前,配方当前,配方A,配方配方B) - 这三种粘合剂是否有差异?这三种粘合剂是否有差异?5. 零假设和备择假设是什么?Ho: 1=2=3Ha: 至少一个 i 与其它不等方差分析方差分析 (ANOVA)GE Appliances Copyright 1999修订版 10 1999年1月11日x水平水平 191214131818151417152119211623水平水平 2水平水平 3 91214131818151417152119211623111112222233333水平水平数据数据总和平均值 (总平均)减去减去(数据数据-总平均总平均) 平方差平方差平方和(SStotal
16、) SStotal - SSbetween = SSwithin总和 平均值总平均 (x)与x的差值平方差平方差之和乘以nSSbetween转下页SS =Bj()jgjxx12SS = Tj=1nj ()igijx12 n方差分析方差分析 (ANOVA)GE Appliances Copyright 1999修订版 10 1999年1月11日g = 组数 (水平)n = 组中的样本数 SStotal - SSbetween = SSwithin这是所有水平组合的SS我们需要平均值(平均数)SS, 所以,用自由度去除:自由度自由度DoFtotal - DoFbetween = DoFwithin
17、(gn) - 1(g-1)g(n - 1)在计算机打印输出中被称作 因素对以上信息稍作调整后,我们得出:组间总体组内平方和自由度平方和的平均值Fcalc(MS比例)在计算机打印输出中被称作 误差或 残留误差Fcalculated =MSBetweenMSWithinANOVA计算计算F统计值统计值:记住:计算的F-统计值是两个方差的比例方差分析方差分析 (ANOVA)GE Appliances Copyright 1999修订版 10 1999年1月11日如果总体平均值间没有差异,则计算得的F-比率应约为1.0最后,将算出的F-比率与F表中列出的F值相比较。表中的F建立在样本容量和风险之上(通
18、常=0.05)。如果F算出的=F表中的, ,总体平均值间的差异具有统计显著性(您可以有95%的置信度相信差异不是偶然产生)。如果F算出的 _ _ _方差分析方差分析 (ANOVA)GE Appliances Copyright 1999修订版 10 1999年1月11日在使用Minitab 分析有关粘合剂问题的数据之前,我们来看一看Minitab 中ANOVA菜单选项。Stat ANOVA:单因素,水平 2(仅用于堆叠数据)双因素,水平 2多因素与多水平 (平衡数据)多因素与多水平 (非平衡数据)平衡ANOVA和普通线性模型(GLM)可以比较多达9 个因素和50个响应值。GLM是您能用来分析非
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 方差分析 类型 计算方法
限制150内