第五章 回归设计优秀PPT.ppt
《第五章 回归设计优秀PPT.ppt》由会员分享,可在线阅读,更多相关《第五章 回归设计优秀PPT.ppt(78页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、第五章 回归设计第一页,本课件共有78页5.1 回归设计的基本概念回归设计的基本概念 回归设计方法是由英国统计学家回归设计方法是由英国统计学家G.BoxG.Box在在2020世纪世纪5050年代初针对化工生产提出的。年代初针对化工生产提出的。回归设计也称为响应面设计,目的是寻求试回归设计也称为响应面设计,目的是寻求试验指标与各验指标与各定量因子定量因子间的定量规律,找到工作条间的定量规律,找到工作条件的最优值(最优工艺、最佳配方等)。件的最优值(最优工艺、最佳配方等)。它是在多元线性回归的基础上用主动收集数它是在多元线性回归的基础上用主动收集数据的方法获得具有较好性质的回归方程的一种据的方法获
2、得具有较好性质的回归方程的一种试验设计方法。试验设计方法。第二页,本课件共有78页5.1.1 回归分析回归分析数据处理由被动变主动数据处理由被动变主动 古典的回归分析方法只是被动地处理已有的试验数据,对古典的回归分析方法只是被动地处理已有的试验数据,对试验点的安排不提任何要求,试验点散乱而不均匀,预测值试验点的安排不提任何要求,试验点散乱而不均匀,预测值的标准误很大,且对于回归方程的精度研究也很少。的标准误很大,且对于回归方程的精度研究也很少。其后果:其后果:(1 1)盲目增加试验次数盲目增加试验次数,这些试验数据还不能提供充分的信,这些试验数据还不能提供充分的信息,在许多复因子试验问题中达不
3、到试验目的。息,在许多复因子试验问题中达不到试验目的。(2 2)对模型的合适性有时无法检验对模型的合适性有时无法检验,因为在被动处理数据时,因为在被动处理数据时在同一试验点上不一定存在重复试验数据。在同一试验点上不一定存在重复试验数据。为了适应寻求最佳工艺、最佳配方、建立生产过程的数学模型为了适应寻求最佳工艺、最佳配方、建立生产过程的数学模型等的需要,人们就要求以较少的试验次数建立精度较高的回归方等的需要,人们就要求以较少的试验次数建立精度较高的回归方程。程。第三页,本课件共有78页 为此,要求摆脱古典回归分析的被动局面,主动把试验的安为此,要求摆脱古典回归分析的被动局面,主动把试验的安排、数
4、据的处理和回归方程的精度统一起来考虑,即根据试验排、数据的处理和回归方程的精度统一起来考虑,即根据试验目的和数据分析的要求来选择试验点,不仅使得在每一个试验目的和数据分析的要求来选择试验点,不仅使得在每一个试验点上获得的数据含有最大的信息,从而减少试验次数,而且使点上获得的数据含有最大的信息,从而减少试验次数,而且使数据的统计分析具有一些较好的性质。数据的统计分析具有一些较好的性质。这就是二十世纪五十年代发展起来的这就是二十世纪五十年代发展起来的“回归设计回归设计”所研究的所研究的问题。问题。回归设计的分类:回归设计的分类:根据建立的回归方程的次数不同,回归设计通常有一次回归根据建立的回归方程
5、的次数不同,回归设计通常有一次回归设计、二次回归设计等;设计、二次回归设计等;根据设计的性质又有正交设计、旋转设计、通用设计和最根据设计的性质又有正交设计、旋转设计、通用设计和最优设计等。优设计等。本章仅介绍二次回归的各种设计方法。本章仅介绍二次回归的各种设计方法。第四页,本课件共有78页5.1.2 多项式回归模型多项式回归模型 在一些试验中希望建立试验指标在一些试验中希望建立试验指标 y 与各个定量与各个定量因子因子 之间关系的定量表达式,即回之间关系的定量表达式,即回归方程,以便通过该回归方程找出使指标满足极归方程,以便通过该回归方程找出使指标满足极值要求的各因子的取值。值要求的各因子的取
6、值。可以假定可以假定 y与与 间有如下关系:间有如下关系:这这里里 是是 的的一一个个函函数数,其其图形也称为响应曲面。图形也称为响应曲面。是是随随机机误误差差,通通常常假假定定它它服服从从均均值值为为0 0,方方差差为为 的正态分布。的正态分布。第五页,本课件共有78页 试验设计中,我们称试验设计中,我们称 为因子或自变量。称为因子或自变量。称 的可能取值的空间为因子空间。的可能取值的空间为因子空间。我们的任务就是从因子空间中寻找一个最佳工艺条我们的任务就是从因子空间中寻找一个最佳工艺条件(最优点)件(最优点),使,使y满足要求。满足要求。当当f 的函数形式已知时,可以通过最优化的方法去寻找
7、的函数形式已知时,可以通过最优化的方法去寻找 。在许多情况下。在许多情况下f 的形式并不知道,这时常常用一个的形式并不知道,这时常常用一个多项式去逼近它,即假定:多项式去逼近它,即假定:这里各这里各 为未知参数,称为回归系为未知参数,称为回归系数,通常需要通过试验数据对它们进行估计。数,通常需要通过试验数据对它们进行估计。第六页,本课件共有78页在实际中常用如下的一次与二次回归方程:在实际中常用如下的一次与二次回归方程:若用若用 表示相应的估计,则称表示相应的估计,则称 为为y关于关于 的的多项式回归方程多项式回归方程。第七页,本课件共有78页5.1.3 多元线性回归多元线性回归 多项式回归模
8、型,在对变量作了变换并重新命名后也可以看成多项式回归模型,在对变量作了变换并重新命名后也可以看成是一个多元线性回归模型。比如对二次回归模型是一个多元线性回归模型。比如对二次回归模型令令即变成五元线性回归模型。即变成五元线性回归模型。1 1)回归模型)回归模型 假定回归模型为:假定回归模型为:第八页,本课件共有78页记随机变量的观测向量为记随机变量的观测向量为回归参数向量为回归参数向量为 ,随机误差向量为,随机误差向量为结构矩阵结构矩阵上述模型可以表示为矩阵形式:上述模型可以表示为矩阵形式:第九页,本课件共有78页 2)回归系数的最小二乘估计回归系数的最小二乘估计 估计回归模型中回归系数的方法是
9、最小二乘法。估计回归模型中回归系数的方法是最小二乘法。记回归系数的最小二乘估计为记回归系数的最小二乘估计为 ,应满足如,应满足如下正规方程组:下正规方程组:当当 存在时,最小二乘估计为:存在时,最小二乘估计为:在求得了最小二乘估计后,可以写出回归方程:在求得了最小二乘估计后,可以写出回归方程:第十页,本课件共有78页 3)对回归方程的显著性检验对回归方程的显著性检验 对回归方程的显著性检验是指检验如下假设:对回归方程的显著性检验是指检验如下假设:H0:H1:不全为不全为0 则平方和分解式则平方和分解式 其中其中 为残差平方和,自由度为为残差平方和,自由度为 为回归平方和,自由度为为回归平方和,
10、自由度为 当当H0为真时,有为真时,有 给定的显著性水平给定的显著性水平 ,拒绝域为拒绝域为 第十一页,本课件共有78页 4)对回归系数的显著性检验对回归系数的显著性检验 当回归方程显著时,可进一步检验某个回归系数是否为当回归方程显著时,可进一步检验某个回归系数是否为0 0,也即检验如下假设:也即检验如下假设:每一项回归系数每一项回归系数j=1,2,=1,2,p逐一进行。逐一进行。常用的检验方法是常用的检验方法是t t检验或等价的检验或等价的F F检验,检验,F F统计量为:统计量为:其中其中 是是 中的第中的第j j+1+1个对角元素。个对角元素。记分子为记分子为 ,它是因子,它是因子 的回
11、归平方和。的回归平方和。分母分母 是模型中是模型中 的无偏估计。的无偏估计。第十二页,本课件共有78页 当当H H0j0j为真时,有为真时,有 。给定的显著性水平给定的显著性水平 ,当,当 时拒绝原假设时拒绝原假设H H0j0j,即认为,即认为 显著不为零,回归关系显著;否则人为回归关显著不为零,回归关系显著;否则人为回归关系不显著,可以将对应的变量从回归方程中删除。系不显著,可以将对应的变量从回归方程中删除。注:当有不显著的系数时,一般情况下一次只能删除一个注:当有不显著的系数时,一般情况下一次只能删除一个F F值最小的变量,重新计算回归系数,再重新检验。通常要到值最小的变量,重新计算回归系
12、数,再重新检验。通常要到余下的系数都显著时为止。余下的系数都显著时为止。第十三页,本课件共有78页 5)失拟检验失拟检验 当在某些点有重复试验数据,便可以对试验指标当在某些点有重复试验数据,便可以对试验指标 y 的期望是的期望是否是否是 的函数进行检验,这种检验称为失拟检验,的函数进行检验,这种检验称为失拟检验,它检验如下假设:它检验如下假设:当当在在有有些些试试验验点点上上有有mi重重复复试试验验时时,试试验验点点为为n,总总试试验验次次数数为为N,残残差差平平方方和和可可进进一一步步分分解解为为组组内内平平方方和和与与组组间间平平方方和和,其其中中组组内内平平方方和和就就是是纯纯误误差差平
13、平方方和和,记记为为 ,组组间间平平方方和和称称为为失失拟拟平方和,记为平方和,记为 ,即:,即:第十四页,本课件共有78页,检验统计量为检验统计量为 在在H H0 0为真时,为真时,对于给定的显著性水平,对于给定的显著性水平 下,下,拒绝域为:拒绝域为:当拒绝当拒绝H H0 0时,需要寻找原因,改变模型,否则接受线性回归时,需要寻找原因,改变模型,否则接受线性回归模型合适,可以将模型合适,可以将S Se e与与S SLfLf合并作为合并作为S SE E检验方程是否显著。检验方程是否显著。其中其中第十五页,本课件共有78页5.1.4 因子水平的编码因子水平的编码 在回归问题中各因子的量纲不同,
14、其取值的范围也不同,在回归问题中各因子的量纲不同,其取值的范围也不同,为了数据处理的方便,对所有的因子作一个线性变换,使所为了数据处理的方便,对所有的因子作一个线性变换,使所有因子的取值范围都转化为中心在原点的一个单位有因子的取值范围都转化为中心在原点的一个单位“立方体立方体”中,这一变换称为对因子水平的编码。中,这一变换称为对因子水平的编码。方法如下:方法如下:设因子设因子 的取值范围为:的取值范围为:与与 分别为因子分别为因子 的下水平的下水平()()与上水平与上水平()()其中心也称为零水平:其中心也称为零水平:因子的变化半径为因子的变化半径为 令编码值令编码值 ,而实际值,而实际值 此
15、变换式就称为此变换式就称为“编码变换编码变换”第十六页,本课件共有78页例例5.1.1 5.1.1 因子因子z z的取值范围为:的取值范围为:1030,对其作编码:对其作编码:编码后,编码后,10对应对应-1,30对应对应1,20对应对应0。变换后,正交点在编码空间为中变换后,正交点在编码空间为中心在原点的立方体,其边长为心在原点的立方体,其边长为2 2。编码变换后,编码变换后,z zm m对应的编码为对应的编码为 ,z zM M对应的编码为对应的编码为 ,z z0 0对应的编对应的编码为码为0 0。这样不管什么取值范围,。这样不管什么取值范围,都转化为值域都转化为值域-1,1-1,1或或-,
16、-,。见示意图。见示意图。第十七页,本课件共有78页5.2 BoxBoxBenhkenBenhken设计设计BoxBoxBehnkenBehnken设计是由统计学家设计是由统计学家BoxBox和和Behnken Behnken 提出的一种比较常用的回归设计提出的一种比较常用的回归设计方法,适用于方法,适用于2 2至至5 5个因子的优化实验。个因子的优化实验。BoxBoxBehnkenBehnken设计首先假定实验范围内设计首先假定实验范围内因子存在二次项,其基试验点的选取为编因子存在二次项,其基试验点的选取为编码立方体的每条棱的中点,即码立方体的每条棱的中点,即任意两因子任意两因子做做2 22
17、 2交互,而交互,而其它因子固定在其它因子固定在0 0水平水平。再加上中心点。再加上中心点。第十八页,本课件共有78页三因子三因子Box-BehnkenBox-Behnken设计设计 试验点示意图试验点示意图BoxBoxBenhkenBenhken设计设计第十九页,本课件共有78页例题例题:对超高压杀灭枯草芽孢杆:对超高压杀灭枯草芽孢杆菌效果菌效果Y Y的研究发现:温度、压的研究发现:温度、压力、保压时间是灭活枯草芽孢力、保压时间是灭活枯草芽孢杆菌显著影响因子。杆菌显著影响因子。研究结果表明杀灭研究结果表明杀灭6 6个数量级个数量级的枯草芽孢杆菌的杀菌条件:温的枯草芽孢杆菌的杀菌条件:温度为度
18、为T T=30=306060,压力为,压力为P P=200=200600 MPa600 MPa,保压时间为,保压时间为M M=10=1020min20min,试分析最优杀菌工,试分析最优杀菌工艺参数。艺参数。BoxBoxBenhkenBenhken设计设计第二十页,本课件共有78页BoxBoxBenhkenBenhken设计设计题解:题解:本试验采用本试验采用Box-BehnkenBox-Behnken设计,以温度设计,以温度T T,压力,压力P P,保压时间,保压时间M M 三个外界因子为自变三个外界因子为自变量,并以量,并以+1+1、0 0、-1-1分别代表自变量的高、中、分别代表自变量的
19、高、中、低水平,对自变量进行编码。低水平,对自变量进行编码。超高压杀灭菌的数量级超高压杀灭菌的数量级Y Y为响应值(为响应值(Y Y=-=-loglog1010 N Nt t/N/N0 0,即经超高压作用后枯草芽孢杆菌,即经超高压作用后枯草芽孢杆菌死亡的数量级,死亡的数量级,N Nt t为超高压处理后为超高压处理后1ml1ml菌液中菌液中的活菌数,的活菌数,N N0 0为对照为对照1ml1ml菌液中的活菌数)菌液中的活菌数)第二十一页,本课件共有78页BoxBoxBenhkenBenhken设计设计因子因子代号代号水平水平编码编码-1-10 01 1温度温度()()T T30304545606
20、0压力压力(MPa)(MPa)P P200200400400 600600保压时间保压时间(min)(min)M M101015152020试验因子的水平及编码表试验因子的水平及编码表第二十二页,本课件共有78页BoxBoxBenhkenBenhken设计设计试验设计与试验结果列表试验设计与试验结果列表Trial No.Trial No.T TP PMMY Y1 1-1-10 0-1-14.274.272 21 10 0-1-15.445.443 3-1-10 01 15.115.114 41 10 01 15.795.795 5-1-1-1-10 02.112.116 61 1-1-10 0
21、3.213.217 7-1-11 10 06.046.048 81 11 10 06.876.879 90 0-1-1-1-12.702.7010100 0-1-11 13.443.4411110 01 1-1-16.236.2312120 01 11 16.436.4313130 00 00 05.455.4514140 00 00 05.325.3215150 00 00 05.675.6716160 00 00 05.435.4317170 00 00 05.235.23第二十三页,本课件共有78页BoxBoxBenhkenBenhken设计设计分析结果分析结果Factor DF SS
22、MS F PT 4 2.041247 0.510312 13.67 0.0020P 4 26.797874 6.699469 179.46 .0001M 4 0.716485 0.179121 4.80 0.0352 在在0.050.05水平下,只有温度(水平下,只有温度(T T)压力()压力(P P)和)和保压时间(保压时间(M M)与灭菌效果都存在显著的回归)与灭菌效果都存在显著的回归关系。关系。在在T=60.37,P=663.87,M=13.51 T=60.37,P=663.87,M=13.51 时,灭菌时,灭菌效果最大,达到效果最大,达到6.796.79。需要进行试验验证。需要进行试验
23、验证。第二十四页,本课件共有78页BoxBoxBenhkenBenhken设计设计T=60.37,P=663.87,M=13.51T=60.37,P=663.87,M=13.51时,极大值时,极大值Y=6.79Y=6.79第二十五页,本课件共有78页5.3 二次回归的中心组合设计二次回归的中心组合设计 一、中心组合设计方案一、中心组合设计方案 中心组合设计中的试验点由三部分组成:中心组合设计中的试验点由三部分组成:(1 1)将将编编码码值值-1-1与与1 1看看成成每每个个因因子子的的两两个个水水平平,采采用用二二水水平平正正交交表表安安排排试试验验,可可以以是是全全因因子子试试验验,也也可可
24、以以是是其其1/21/2实实施施,1/41/4实实施施等等,称称这这种种试试验验点点为为正正交交点点。这这样样的的点点有有mc c=2=2p个,选取正交表的个,选取正交表的p个基本列构成。个基本列构成。(2 2)在在每每一一因因子子的的坐坐标标轴轴上上取取两两个个试试验验点点,该该因因子子的的编编码码值值分分别别为为 -与与 ,其其它它因因子子的的编编码码值值为为0 0。由由于于有有p个个因因子子,因因此此这这部部分分试试验验点点共共有有2 2p个个。称称这这种种试试验验点点为为星星号号点点或或主轴点主轴点。(3 3)在在试试验验区区域域的的中中心心进进行行m0 0次次重重复复试试验验,这这时
25、时每每个个因因子的编码值均为子的编码值均为0 0。称这种试验点为。称这种试验点为中心点中心点。第二十六页,本课件共有78页 如如p=2=2的中心组合设计方案是:的中心组合设计方案是:第二十七页,本课件共有78页 如如p=2=2的中心组合设计试验点的分布图的中心组合设计试验点的分布图第二十八页,本课件共有78页二、中心组合设计方案的特点二、中心组合设计方案的特点 该方案总试验次数该方案总试验次数n为:为:每个因子都取每个因子都取5 5个水平,故该方案所布的试验点范个水平,故该方案所布的试验点范围较广。围较广。该方案还有较大的灵活性,因为在方案中留有该方案还有较大的灵活性,因为在方案中留有两个待定
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 第五章 回归设计优秀PPT 第五 回归 设计 优秀 PPT
限制150内