统计培训教材方差分析幻灯片.ppt
《统计培训教材方差分析幻灯片.ppt》由会员分享,可在线阅读,更多相关《统计培训教材方差分析幻灯片.ppt(52页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、统计培训教材方差分析统计培训教材方差分析第1页,共52页,编辑于2022年,星期二主要内容主要内容变异变异方差分析方差分析假设检验假设检验假设假设模型模型ANOVA 模型模型单因子方差分析(单因子方差分析(One-Way ANOVA)双因子方差分析(双因子方差分析(Two-Way ANOVA)多因子方差分析(多因子方差分析(Multi-Factor ANOVA)第2页,共52页,编辑于2022年,星期二变异的类型变异的类型固有变异由许多不可避免的小因素累积而成的变异由许多不可避免的小因素累积而成的变异通常也叫噪声(通常也叫噪声(noise)特殊变异a)不适当地调教机器不适当地调教机器b)操作错
2、误操作错误c)原材料有缺陷原材料有缺陷第3页,共52页,编辑于2022年,星期二方差分析方差分析(ANOVA)方差分析方差分析(ANOVA)是是 R.A.Fisher 在进行农业试验时发展起来的对实在进行农业试验时发展起来的对实验数据的变异性进行分析的一套统计方法。验数据的变异性进行分析的一套统计方法。方差分析做法:通过试验,以观察某一种或多种因素的变化,方差分析做法:通过试验,以观察某一种或多种因素的变化,对试验结果的观察数值是否有显著影响,从而选取最优方案。对试验结果的观察数值是否有显著影响,从而选取最优方案。例:在化工生产中,影响结果的因素有:配方、设备、温度、压力、催例:在化工生产中,
3、影响结果的因素有:配方、设备、温度、压力、催化剂、操作人员等。需要通过观察或试验判断哪些因素是重要的,有化剂、操作人员等。需要通过观察或试验判断哪些因素是重要的,有显著影响的,哪些因素是不重要的,没有显著影响的。显著影响的,哪些因素是不重要的,没有显著影响的。第4页,共52页,编辑于2022年,星期二方差分析方差分析(ANOVA)试验中考虑的因素只有一个,即只有一个因素在变,其他因素保试验中考虑的因素只有一个,即只有一个因素在变,其他因素保持不变,这种试验称为单因素方差分析持不变,这种试验称为单因素方差分析 (One-Way ANOVA)。试验中考虑的因素有两个,这种试验称为双因素方差分析试验
4、中考虑的因素有两个,这种试验称为双因素方差分析(Two-Way ANOVA)。试验中考虑的因素有试验中考虑的因素有 k 个,这种试验称为个,这种试验称为 k 因素方差分析(因素方差分析(k-Way ANOVA)。第5页,共52页,编辑于2022年,星期二ANOVA 的应用的应用因素所处的状态,称为水平因素所处的状态,称为水平(Level)。例如,温度是一个因素,可在。例如,温度是一个因素,可在50,60,70三个水平下做试验。三个水平下做试验。ANOVA 可用于可用于估计每个变异来源对总变异的贡献。估计每个变异来源对总变异的贡献。明确各效应的显著性明确各效应的显著性估计过程中的随机误差或噪声估
5、计过程中的随机误差或噪声计算方差的成份计算方差的成份第6页,共52页,编辑于2022年,星期二ANOVA 假设检验假设检验H0:1=2=r 所有总体均值相等所有总体均值相等H1:至少至少有两个总体的均值不等有两个总体的均值不等ANOVA 通过比较组间差和组内差来进行通过比较组间差和组内差来进行F-检验:检验:如果如果 ,则拒绝原假设。,则拒绝原假设。.第7页,共52页,编辑于2022年,星期二ANOVA 假设检验假设检验N(1,1)N(2,2)N(3,3)N(4,4)N(groups,between)第8页,共52页,编辑于2022年,星期二ANOVA 假设假设观察值相互独立观察值相互独立.各
6、水平的数据服从正态分布,即各水平的数据服从正态分布,即 因子水平因子水平 i N(i,i)各水平的方差相同,即各水平的方差相同,即 1=2=r第9页,共52页,编辑于2022年,星期二ANOVA 模型模型固定效应模型(ANOVA I)因子水平是指定的因子水平是指定的相关结论只能对指定的因子水平而言相关结论只能对指定的因子水平而言随机效应模型(ANOVA II)因子水平是随机抽取的因子水平是随机抽取的结论对整个处理总体有效结论对整个处理总体有效混合效应模型(ANOVA III)有些因子是固定的,有些因子是随机的有些因子是固定的,有些因子是随机的第10页,共52页,编辑于2022年,星期二ANOV
7、A 模型模型一个一个 kWay ANOVA 模型,是指试验中包含有模型,是指试验中包含有k 个因素个因素.kWay ANOVA I:k 个因素个因素;所有因素效应固定所有因素效应固定kWay ANOVA II:k 个因素个因素;所有因素效应随机所有因素效应随机kWay ANOVA III:k 个因素个因素;有些因素效应固定,有些因素效应固定,有些有些 因素效应随机因素效应随机注意:当注意:当 k 大于等于大于等于 2 时,还要考虑各因素之间的相互作用(或交互效时,还要考虑各因素之间的相互作用(或交互效应)应)(Interaction).第11页,共52页,编辑于2022年,星期二q我们要观察的
8、一个我们要观察的一个 input 变量变量(因子因子)有多个样本时有多个样本时,我们实际上在实施我们实际上在实施 单因单因子实验子实验(Single Factor Experiment).q我们要分析对象的我们要分析对象的 因子是否有水平间的差异因子是否有水平间的差异确定确定3个供应商的平均交货期是否有差异个供应商的平均交货期是否有差异确定某个机器的设定值在确定某个机器的设定值在5个水平间变化时,零件的尺寸是否不同个水平间变化时,零件的尺寸是否不同q现在开始做第一次实验现在开始做第一次实验!q观察观察.One way ANOVAOne way ANOVA的概念的概念(1)(1)概要概要第12页
9、,共52页,编辑于2022年,星期二One ANOVAOne ANOVA的概念的概念(2)(2)例题例题o考虑如下情景:一个产品开发工程师要研究某个电阻焊接考虑如下情景:一个产品开发工程师要研究某个电阻焊接系统中系统中5 5种不同的电流设置对焊接强度的影响种不同的电流设置对焊接强度的影响 o她要研究的电流范围为她要研究的电流范围为15-1915-19安培。她将调查安培。她将调查5 5个水平的输入变个水平的输入变量(因子):量(因子):15A,16A,17A,18A 15A,16A,17A,18A 和和 19 19A A。她将对每个水平她将对每个水平进行进行5 5次实验次实验 o输出输出:焊接强
10、度焊接强度o输入输入:电流电流o这是一个具有这是一个具有5 5个水平的单因子实验(电流)个水平的单因子实验(电流)o该实验的结果参考下页该实验的结果参考下页.第13页,共52页,编辑于2022年,星期二?One ANOVAOne ANOVA的概念的概念(3)(3)例题例题存在电流对焊接强度的影响吗?存在电流对焊接强度的影响吗?对于这个设备使用哪个电流,你的结论是什么?为什么?对于这个设备使用哪个电流,你的结论是什么?为什么?第14页,共52页,编辑于2022年,星期二输入结果输入结果DATA的的 design matrix同下同下.实习实习:打开窗口打开窗口 Mont52.mtwMont52.
11、mtw 制作各列数据的制作各列数据的 dotplot.使用对所有变量相同的格式使用对所有变量相同的格式(SCALE)!One ANOVAOne ANOVA的概念的概念(3)(3)例题例题第15页,共52页,编辑于2022年,星期二各均值的各均值的 95%置信区间置信区间(CI)如下如下.DATA Stack 后后 StatANOVAInterval Plot对电流和焊接强度的关系做什么结论对电流和焊接强度的关系做什么结论?这结论的置信度是怎样这结论的置信度是怎样?One way ANOVAOne way ANOVA的概念的概念(3)(3)例题例题第16页,共52页,编辑于2022年,星期二设定
12、假设设定假设!One ANOVAOne ANOVA的概念的概念(4)(4)假设假设Ha:至少有一个至少有一个水平产生不同过程水平产生不同过程 H0:数据只描述数据只描述一个过程的自然一个过程的自然散布散布 你认为答案是什么?为什么?你认为答案是什么?为什么?第17页,共52页,编辑于2022年,星期二One ANOVAOne ANOVA的概念的概念(5)(5)假设假设此设计的数学模型是:此设计的数学模型是:l Ho 假设处理项是零假设处理项是零 数学模型假设数学模型假设 常规假设常规假设 Yti=+t+ti其中其中:yti=来自处理来自处理t t的单个响应的单个响应 =总平均值总平均值 t=处
13、理处理tti=随机误差随机误差第18页,共52页,编辑于2022年,星期二One ANOVAOne ANOVA的概念的概念(6)(6)变量选定变量选定*输入变量作为一个输入变量作为一个因子因子。在单因子设计中,因子被当作特征变量处理,即使它可能是间隔值或比率。在单因子设计中,因子被当作特征变量处理,即使它可能是间隔值或比率。*如果因子自然为连续型的,可以把它分类成子群。如果因子自然为连续型的,可以把它分类成子群。-例如,我可以采用低和高来度量生产线的压力值。-我们可以作中值分离(Median Split)来把因子分成两个水平:低和高。-对于我们的例子,因为电流是连续型变量,我们把它分成5个等级
14、。*输出一般以间隔值或比率范围来度量(合格率,温度,电压,等等)输出一般以间隔值或比率范围来度量(合格率,温度,电压,等等)输出变量可以是分离型或间隔输出变量可以是分离型或间隔/比率变量比率变量 第19页,共52页,编辑于2022年,星期二ANOVAANOVA的原理的原理(1)(1)总变动总变动q 因子因子A A的水平是的水平是I I个个,各水平的反复数都是各水平的反复数都是m m次次,则数据矩阵则数据矩阵 排列成下面的样子排列成下面的样子因子的水平A1 A2 A3 A4 A5 A6 Al实验的反复x11 x21 x31 x41 x51 x61 xl1x12 x22 x32 x42 x52 x
15、62 xl2 x13 x23 x33 x43 x53 x63 xl3 x14 x24 x34 x44 x54 x64 xl4 x15 x25 x35 x45 x55 x65 xl5x1m x2m x3m x4m x5m x6m xlm合计T1 T2 T3 T4 T5 T6 TlT均值x1 x2 x3 x4 x5 x6 xlx第20页,共52页,编辑于2022年,星期二q 总均值总均值 是用右边的公式求是用右边的公式求.q 利用各个利用各个DATADATA 和总均值和总均值 把总均值把总均值 分解为两个分解为两个,同下表示同下表示.q 左边和右边平方时同下左边和右边平方时同下.ANOVAANOV
16、A的原理的原理(2)(2)总变动总变动第21页,共52页,编辑于2022年,星期二q 上面的第三项变为如下上面的第三项变为如下.SS(total)SS(error)SS(factor)q 同样第同样第8 8页式从写如下页式从写如下,这意义的略写这意义的略写SS(Sum of SquaresSS(Sum of Squares)来表来表示示.ANOVAANOVA的原理的原理(3)(3)总变动总变动第22页,共52页,编辑于2022年,星期二SS(total)SS(total)的自由度的自由度 是是,SS(factorSS(factor)的自由度的自由度 是是,SS(error)SS(error)的
17、自由度的自由度 是是,因此因此 ANOVAANOVA的原理的原理(4)(4)自由度自由度在一个系统中不影响其他变量能够独立移动的数在一个系统中不影响其他变量能够独立移动的数Ex)a*b*c=4Ex)a*b*c=4 这式中变量的自由度是这式中变量的自由度是 2.2.假如假如 a,ba,b定为定为 1,2,1,2,c c必须是必须是 2.2.即能够自然的移动的变量。即能够自然的移动的变量。q 自由度是自由度是?q 自由度的计算自由度的计算第23页,共52页,编辑于2022年,星期二因子(factor)平方和(Sum of Squares)自由度(Degree of Freedom)均值平方(Mea
18、n Square)F值AErrorTotalANOVAANOVA的原理的原理(5)(5)方差分析表方差分析表q 方差分析表的制作方差分析表的制作q 对错误的均值平方因子对错误的均值平方因子,利用利用A A的均值平方的大小的均值平方的大小 观察观察 A A效果的大小效果的大小.F越大越大 A效果越大效果越大.(利用利用F 分布确认分布确认 P-value)第24页,共52页,编辑于2022年,星期二ANOVAANOVA的原理的原理(6)(6)F F分布分布q F F分布的参考分布的参考q 自由度 k1,k2的变量的 F值的 F(k1,k2:)按 的大小 占有面积(发生概率).(显著水平)F(k1
19、,k2)F(k1,k2:)第25页,共52页,编辑于2022年,星期二F-分布分布 65432100.70.60.50.40.30.20.10.0ScoresProb10%1%5%第26页,共52页,编辑于2022年,星期二q Exercise某个某个 coating 工程认为工程认为 反应温度反应温度对生产的对生产的 产品的强度产品的强度有影响有影响,所以对反应温度变化强度有什么所以对反应温度变化强度有什么变化变化,还有温度在什么水平时强度最好还有温度在什么水平时强度最好,进行了实验进行了实验.反应温度设为因子水平反应温度设为因子水平,各温度反复各温度反复3回回,总总共共12回实验数据随机整
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 统计 培训教材 方差分析 幻灯片
限制150内