第五章-回归设计优秀PPT.ppt
《第五章-回归设计优秀PPT.ppt》由会员分享,可在线阅读,更多相关《第五章-回归设计优秀PPT.ppt(78页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、5.1 5.1 回来设计的基本概念回来设计的基本概念5.2 Box5.2 BoxBenhkenBenhken设计设计5.3 5.3 二次回来的中心组合设计二次回来的中心组合设计5.4 5.4 二次回来正交设计二次回来正交设计5.5 5.5 二次回来旋转设计二次回来旋转设计5.6 D5.6 D最优混合设计最优混合设计第五章第五章 回来设计回来设计5.1 回来设计的基本概念回来设计的基本概念 回来设计方法是由英国统计学家回来设计方法是由英国统计学家G.Box在在20世纪世纪50年头初针对化工生年头初针对化工生产提出的。产提出的。回来设计也称为响应面设计,目的回来设计也称为响应面设计,目的是寻求试验
2、指标与各定量因子间的定是寻求试验指标与各定量因子间的定量规律,找到工作条件的最优值(最量规律,找到工作条件的最优值(最优工艺、最佳配方等)。优工艺、最佳配方等)。它是在多元线性回来的基础上用主它是在多元线性回来的基础上用主动收集数据的方法获得具有较好性质动收集数据的方法获得具有较好性质的回来方程的一种试验设计方法。的回来方程的一种试验设计方法。5.1.1 回来分析回来分析数据处理由被动变主动数据处理由被动变主动 古典的回来分析方法只是被动地处理已有古典的回来分析方法只是被动地处理已有的试验数据,对试验点的支配不提任何要求,的试验数据,对试验点的支配不提任何要求,试验点散乱而不匀整,预料值的标准
3、误很大,试验点散乱而不匀整,预料值的标准误很大,且对于回来方程的精度探讨也很少。且对于回来方程的精度探讨也很少。其后果:其后果:(1)盲目增加试验次数,这些试验数据还)盲目增加试验次数,这些试验数据还不能供应充分的信息,在很多复因子试验问不能供应充分的信息,在很多复因子试验问题中达不到试验目的。题中达不到试验目的。(2)对模型的合适性有时无法检验,因为)对模型的合适性有时无法检验,因为在被动处理数据时在同一试验点上不确定存在被动处理数据时在同一试验点上不确定存在重复试验数据。在重复试验数据。为了适应寻求最佳工艺、最佳配方、建立为了适应寻求最佳工艺、最佳配方、建立生产过程的数学模型等的须要,人们
4、就要求生产过程的数学模型等的须要,人们就要求以较少的试验次数建立精度较高的回来方程。以较少的试验次数建立精度较高的回来方程。为此,要求摆脱古典回来分析的被动局面,主动把试验为此,要求摆脱古典回来分析的被动局面,主动把试验的支配、数据的处理和回来方程的精度统一起来考虑,即的支配、数据的处理和回来方程的精度统一起来考虑,即依据试验目的和数据分析的要求来选择试验点,不仅使得依据试验目的和数据分析的要求来选择试验点,不仅使得在每一个试验点上获得的数据含有最大的信息,从而削减在每一个试验点上获得的数据含有最大的信息,从而削减试验次数,而且使数据的统计分析具有一些较好的性质。试验次数,而且使数据的统计分析
5、具有一些较好的性质。这就是二十世纪五十年头发展起来的这就是二十世纪五十年头发展起来的“回来设计回来设计”所探所探讨的问题。讨的问题。回来设计的分类:回来设计的分类:依据建立的回来方程的次数不同,回来设计通常有一次依据建立的回来方程的次数不同,回来设计通常有一次回来设计、二次回来设计等;回来设计、二次回来设计等;依据设计的性质又有正交设计、旋转设计、通用设计和依据设计的性质又有正交设计、旋转设计、通用设计和最优设计等。最优设计等。本章仅介绍二次回来的各种设计方法。本章仅介绍二次回来的各种设计方法。5.1.2 多项式回来模型多项式回来模型 在一些试验中希望建立试验指标在一些试验中希望建立试验指标
6、y 与与各个定量因子各个定量因子 之间关系的定量表达之间关系的定量表达式,即回来方程,以便通过该回来方程式,即回来方程,以便通过该回来方程找出访指标满足极值要求的各因子的取找出访指标满足极值要求的各因子的取值。值。可以假定可以假定 y与与 间有如下关系:间有如下关系:这里这里 是是 的一个函数,其图的一个函数,其图形也称为响应曲面。形也称为响应曲面。是随机误差,通常假定它听从均值是随机误差,通常假定它听从均值为为0,方差为,方差为 的正态分布。的正态分布。试验设计中,我们称 为因子或自变量。称 的可能取值的空间为因子空间。我们的任务就是从因子空间中找寻一个最佳工艺条件(最优点),使y满足要求。
7、当f 的函数形式已知时,可以通过最优化的方法去找寻 。在很多状况下f 的形式并不知道,这时常常用一个多项式去靠近它,即假定:这里各这里各 为未知参数,称为回为未知参数,称为回来系数,通常须要通过试验数据对它们进行估计。来系数,通常须要通过试验数据对它们进行估计。在实际中常用如下的一次与二次回来方程:在实际中常用如下的一次与二次回来方程:若用若用 表示相应的估计,则称表示相应的估计,则称 为为y y关于关于 的多项式回来方程。的多项式回来方程。5.1.3 多元线性回来多元线性回来 多项式回来模型,在对变量作了变换并重多项式回来模型,在对变量作了变换并重新命名后也可以看成是一个多元线性回来模新命名
8、后也可以看成是一个多元线性回来模型。比如对二次回来模型型。比如对二次回来模型令令即变成五元线性回来模型。即变成五元线性回来模型。1回来模型回来模型 假定回来模型为:假定回来模型为:记随机变量的观测向量为记随机变量的观测向量为回来参数向量为回来参数向量为 ,随机误差向量为,随机误差向量为结构矩阵结构矩阵上述模型可以表示为矩阵形式:上述模型可以表示为矩阵形式:2回来系数的最小二乘估计 估计回来模型中回来系数的方法是最小二乘法。记回来系数的最小二乘估计为 ,应满足如下正规方程组:当 存在时,最小二乘估计为:在求得了最小二乘估计后,可以写出回来方程:3对回来方程的显著性检验 对回来方程的显著性检验是指
9、检验如下假设:H0:H1:不全为0 则平方和分解式 其中 为残差平方和,自由度为 为回来平方和,自由度为 当H0为真时,有 给定的显著性水平 ,拒绝域为 4失拟检验失拟检验 当在某些点有重复试验数据,便可以对试验指标当在某些点有重复试验数据,便可以对试验指标 y 的期的期望是否是望是否是 的函数进行检验,这种检验称为失拟的函数进行检验,这种检验称为失拟检验,它检验如下假设:检验,它检验如下假设:当当在在有有些些试试验验点点上上有有mi重重复复试试验验时时,试试验验点点为为n,总总试试验验次次数数为为N,残残差差平平方方和和可可进进一一步步分分解解为为组组内内平平方方和和与与组组间间平平方方和和
10、,其其中中组组内内平平方方和和就就是是纯纯误误差差平平方方和和,记记为为 ,组组间平方和称为失拟平方和,记为间平方和称为失拟平方和,记为 ,即:,即:,检验统计量为检验统计量为 在在H0H0为真时,为真时,对于给定的显著性水平,对于给定的显著性水平 下,拒绝域为:下,拒绝域为:当拒绝当拒绝H0H0时,须要找寻缘由,变更模型,否则接受线性回时,须要找寻缘由,变更模型,否则接受线性回来模型合适,可以将来模型合适,可以将SeSe与与SLfSLf合并作为合并作为SESE检验方程是否显著。检验方程是否显著。其中其中 5对回来系数的显著性检验对回来系数的显著性检验 当回来方程显著时,可进一步检验某个回来系
11、数是当回来方程显著时,可进一步检验某个回来系数是否为否为0,也即检验如下假设:,也即检验如下假设:每一项回来系数每一项回来系数j=1,2,p逐一进行。逐一进行。常用的检验方法是常用的检验方法是t检验或等价的检验或等价的F检验,检验,F统计量统计量为:为:其中其中 是是 中的第中的第j+1个对角元素。个对角元素。记分子为记分子为 ,它是因子,它是因子 的回来平方和。的回来平方和。分母分母 是模型中是模型中 的无偏估计。的无偏估计。当H0j为真时,有 。给定的显著性水平 ,当 时拒绝原假设H0j,即认为 显著不为零,回来关系显著;否则人为回来关系不显著,可以将对应的变量从回来方程中删除。注:当有不
12、显著的系数时,一般状况下一次只能删除一个F值最小的变量,重新计算回来系数,再重新检验。通常要到余下的系数都显著时为止。5.1.4 因子水平的编码因子水平的编码 在回来问题中各因子的量纲不同,其取值的范在回来问题中各因子的量纲不同,其取值的范围也不同,为了数据处理的便利,对全部的因子围也不同,为了数据处理的便利,对全部的因子作一个线性变换,使全部因子的取值范围都转化作一个线性变换,使全部因子的取值范围都转化为中心在原点的一个单位为中心在原点的一个单位“立方体立方体”中,这一变换中,这一变换称为对因子水平的编码。称为对因子水平的编码。方法如下:方法如下:设因子设因子 的取值范围为:的取值范围为:与
13、与 分别为因子分别为因子 的下水平的下水平()与上水平与上水平()其中心也称为零水平:其中心也称为零水平:因子的变更半径为因子的变更半径为 令编码值令编码值 ,而实际值,而实际值 此变换式就称为此变换式就称为“编码变换编码变换”例例5.1.1 5.1.1 因子因子z z的取值范围为:的取值范围为:1030,对其作编码:对其作编码:编码后,编码后,10对应对应-1,30对应对应1,20对应对应0。变换后,正交点在编码空间变换后,正交点在编码空间为中心在原点的立方体,其边为中心在原点的立方体,其边长为长为2 2。编码变换后,编码变换后,z zm m对应的编码为对应的编码为 ,z zM M对应的编码
14、为对应的编码为 ,z z0 0对应的对应的编码为编码为0 0。这样不管什么取值范。这样不管什么取值范围,都转化为值域围,都转化为值域-1,1-1,1或或-,-,。见示意图。见示意图。5.2 BoxBoxBenhkenBenhken设计设计BoxBoxBehnkenBehnken设计是由统计学家设计是由统计学家BoxBox和和Behnken Behnken 提出的一种比较常用的回来设计提出的一种比较常用的回来设计方法,适用于方法,适用于2 2至至5 5个因子的优化试验。个因子的优化试验。BoxBoxBehnkenBehnken设计首先假定试验范围内设计首先假定试验范围内因子存在二次项,其基试验点
15、的选取为编因子存在二次项,其基试验点的选取为编码立方体的每条棱的中点,即随意两因子码立方体的每条棱的中点,即随意两因子做做2222交互,而其它因子固定在交互,而其它因子固定在0 0水平。水平。再加上中心点。再加上中心点。三因子三因子Box-BehnkenBox-Behnken设计设计 试验点示意图试验点示意图BoxBoxBenhkenBenhken设计设计例题:对超高压杀灭枯草芽孢例题:对超高压杀灭枯草芽孢杆菌效果杆菌效果Y Y的探讨发觉:温度、的探讨发觉:温度、压力、保压时间是灭活枯草芽压力、保压时间是灭活枯草芽孢杆菌显著影响因子。孢杆菌显著影响因子。探讨结果表明杀灭探讨结果表明杀灭6 6个
16、数量个数量级的枯草芽孢杆菌的杀菌条件:级的枯草芽孢杆菌的杀菌条件:温度为温度为T=30T=306060,压力为,压力为P=200P=200600 MPa600 MPa,保压时间为,保压时间为M=10M=1020min20min,试分析最优杀,试分析最优杀菌工艺参数。菌工艺参数。BoxBoxBenhkenBenhken设计设计BoxBoxBenhkenBenhken设计设计题解:本试验接受题解:本试验接受Box-BehnkenBox-Behnken设计,以温设计,以温度度T T,压力,压力P P,保压时间,保压时间M M 三个外界因子为自三个外界因子为自变量,并以变量,并以+1+1、0 0、-1
17、-1分别代表自变量的高、分别代表自变量的高、中、低水平,对自变量进行编码。中、低水平,对自变量进行编码。超高压杀灭菌的数量级超高压杀灭菌的数量级Y Y为响应值(为响应值(Y=-Y=-log10 Nt/N0 log10 Nt/N0,即经超高压作用后枯草芽孢,即经超高压作用后枯草芽孢杆菌死亡的数量级,杆菌死亡的数量级,NtNt为超高压处理后为超高压处理后1ml1ml菌液中的活菌数,菌液中的活菌数,N0N0为比照为比照1ml1ml菌液中的活菌液中的活菌数)菌数)BoxBoxBenhkenBenhken设计设计因子因子代号代号水平水平编码-1-10 01 1温度温度()()T T30304545606
18、0压力力(MPa)(MPa)P P200200400400 600600保保压时间(min)(min)M M101015152020试验因子的水平及编码表试验因子的水平及编码表BoxBoxBenhkenBenhken设计设计试验设计与试验结果列表试验设计与试验结果列表Trial No.Trial No.T TP PMMY Y1 1-1-10 0-1-14.274.272 21 10 0-1-15.445.443 3-1-10 01 15.115.114 41 10 01 15.795.795 5-1-1-1-10 02.112.116 61 1-1-10 03.213.217 7-1-11 1
19、0 06.046.048 81 11 10 06.876.879 90 0-1-1-1-12.702.7010100 0-1-11 13.443.4411110 01 1-1-16.236.2312120 01 11 16.436.4313130 00 00 05.455.4514140 00 00 05.325.3215150 00 00 05.675.6716160 00 00 05.435.4317170 00 00 05.235.23BoxBoxBenhkenBenhken设计设计分析结果分析结果Factor DF SS MS F PT 4 2.041247 0.510312 13.6
20、7 0.0020P 4 26.797874 6.699469 179.46 .0001M 4 0.716485 0.179121 4.80 0.0352 在在0.050.05水平下,只有温度(水平下,只有温度(T T)压力()压力(P P)和保压时间(和保压时间(M M)与灭菌效果都存在显著的)与灭菌效果都存在显著的回来关系。回来关系。在在T=60.37,P=663.87,M=13.51 T=60.37,P=663.87,M=13.51 时,灭菌时,灭菌效果最大,达到效果最大,达到6.796.79。须要进行试验验证。须要进行试验验证。BoxBoxBenhkenBenhken设计设计T=60.3
21、7,P=663.87,M=13.51T=60.37,P=663.87,M=13.51时,极大值时,极大值Y=6.79Y=6.795.3 二次回来的中心组合设计二次回来的中心组合设计 一、中心组合设计方案一、中心组合设计方案 中心组合设计中的试验点由三部分中心组合设计中的试验点由三部分组成:组成:(1)将编码值)将编码值-1与与1看成每个因子的看成每个因子的两个水平,接受二水平正交表支配试两个水平,接受二水平正交表支配试验,可以是全因子试验,也可以是其验,可以是全因子试验,也可以是其1/2实施,实施,1/4实施等,称这种试验点为实施等,称这种试验点为正交点。这样的点有正交点。这样的点有mc=2p
22、个,选取个,选取正交表的正交表的p个基本列构成。个基本列构成。(2)在每一因子的坐标轴上取两个)在每一因子的坐标轴上取两个试验点,该因子的编码值分别为试验点,该因子的编码值分别为-与与 ,其它因子的编码值为,其它因子的编码值为0。由于有。由于有p个个因子,因此这部分试验点共有因子,因此这部分试验点共有2p个。个。称这种试验点为星号点或主轴点。称这种试验点为星号点或主轴点。(3)在试验区域的中心进行)在试验区域的中心进行m0次重次重复试验,这时每个因子的编码值均为复试验,这时每个因子的编码值均为0。称这种试验点为中心点。称这种试验点为中心点。如如p=2=2的中心组合设计方案是:的中心组合设计方案
23、是:如如p=2=2的中心组合设计试验点的分布图的中心组合设计试验点的分布图二、中心组合设计方案的特点二、中心组合设计方案的特点 该方案总试验次数该方案总试验次数n为:为:每个因子都取每个因子都取5个水平,故该方案所布的试验点个水平,故该方案所布的试验点范围较广。范围较广。该方案还有较大的敏捷性,因为在方案中留有两该方案还有较大的敏捷性,因为在方案中留有两个待定参数个待定参数 m0(中心点的试验次数)和(中心点的试验次数)和 (主轴(主轴点的位置),使二次回来设计具有正交性、旋转点的位置),使二次回来设计具有正交性、旋转性等。性等。中心点处的中心点处的m0次重复,可以精确估计试验误差,次重复,可
24、以精确估计试验误差,从而使对方程与系数的检验有了牢靠依据。从而使对方程与系数的检验有了牢靠依据。5.4 二次回来正交设计二次回来正交设计 二次回来正交设计是二次回来中心组合二次回来正交设计是二次回来中心组合设计的一种常用设计方法。设计的一种常用设计方法。假如一个设计具有正交性,则数据分析假如一个设计具有正交性,则数据分析将是特别便利的,由于所得的回来系数将是特别便利的,由于所得的回来系数的估计值之间互不相关,因此删除某些的估计值之间互不相关,因此删除某些因子时不会影响其它的回来系数的估计,因子时不会影响其它的回来系数的估计,从而很简洁写出全部回来系数为显著的从而很简洁写出全部回来系数为显著的回
25、来方程。回来方程。我们可以适当选择我们可以适当选择m0与与 使二次回来中使二次回来中心组合设计具有正交性。心组合设计具有正交性。5.4.1 二次中心组合设计的结构矩阵二次中心组合设计的结构矩阵X与系数矩阵与系数矩阵 p=2的中心组合设计回来模型的结构式为的中心组合设计回来模型的结构式为 结构矩阵如下:结构矩阵如下:x0 x1 x2 x1x2 (x1)2(x2)2这里这里mc=4,2p=4,则,则n=mc+2p+m0=8+m0,再记,再记那么那么各平方项所对应的行、列在非对角线都有非各平方项所对应的行、列在非对角线都有非0 0元素元素5.4.2 正交性的实现正交性的实现 要使中心组合设计具有正交
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 第五 回归 设计 优秀 PPT
限制150内