田间试验与统计方法响应面设计.pptx
《田间试验与统计方法响应面设计.pptx》由会员分享,可在线阅读,更多相关《田间试验与统计方法响应面设计.pptx(83页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、11.1 回归设计概述 回归设计(也称为响应曲面设计),目的是寻找试验指标与各因子间的定量规律,考察的因子都是定量的 。 它是在多元线性回归的基础上用主动收集数据的方法获得具有较好性质的回归方程的一种试验设计方法。 第1页/共83页11.1.1 多项式回归模型 在一些试验中希望建立指标y与各定量因子 (又称变量) 间相关关系的定量表达式,即回归方程,以便通过该回归方程找出使指标满足要求的各因子的范围 。 可以假定 y与 间有如下关系: 这里 是 的一个函数,常称为响应函数,其图形也称为响应曲面; 是随机误差,通常假定它服从均值为0,方差为 的正态分布。 在上述假定下, 可以看作为在给定 后指标
2、的均值,即 pzzz,21pzzz,21),(21pzzzfy),(21pzzzfpzzz,212),(21pzzzfpzzz,21),()(21pzzzfyE第2页/共83页 称z 的可能取值的空间为因子空间。我们的任务便是从因子空间中寻找一个点z0 使E(y)满足质量要求。 当f的函数形式已知时,可以通过最优化的方法去寻找z0 。在许多情况下f的形式并不知道,这时常常用一个多项式去逼近它,即假定: ),(21pzzz),(00201pzzz(7.1.1) 20jijiijjjjjjjjzzzzy这里各 为未知参数,也称为回归系数,通常需要通过收集到的数据对它们进行估计。 若用 表示相应的估
3、计,则称 ,0ijjjj,0ijjjjbbbb ybb zb zb z zjjjjjjjijijij02为y关于 的多项式回归方程。 pzzz,21第3页/共83页 在实际中常用的是如下的一次与二次回归方程(也称一阶与二阶模型):jjjzbby0 20jijiijjjjjjjjzzbzbzbby一般p个自变量的d次回归方程的系数个数为 ddp第4页/共83页11.1.2 多元线性回归 (14.1.1)是一个多项式回归模型,在对变量作了变换并重新命名后也可以看成是一个多元线性回归模型。 1 1回归模型 设所收集到的n n组数据为假定回归模型为: niyxxxiipii, 2 , 1 ),(21
4、), 0(, 2 , 12110Niidnixxyiiippii各,第5页/共83页记随机变量的观察向量为 未知参数向量为 不可观察的随机误差向量为 结构矩阵那么上述模型可以表示为:nyyyY21p10n21npnppxxxxxxX1221111111),(nnINXY20或),(2nnIXNY第6页/共83页 2回归系数的最小二乘估计 估计回归模型中回归系数的方法是最小二乘法。 记回归系数的最小二乘估计(LSE)为 ,应满足如下正规方程组: 当 存在时,最小二乘估计为 在求得了最小二乘估计后,可以写出回归方程: 今后称 为正规方程组的系数矩阵, 为正规方程组的常数项向量, 为相关矩阵。 在前
5、述模型下,有 ),(10pbbbbYXXbX1XXYXXXb1ppxbxbby110XXAYXB1XXC)(,(12XXNb第7页/共83页若记 ,那么)(1ijcXXCpjcNbjjjj, 2 , 1 , 0 ),(2在通常的回归分析中,由于C C非对角阵,所以各回归系数间是相关的: 2),(ijjicbbCov第8页/共83页 3对回归方程的显著性检验 对回归方程的显著性检验是指检验如下假设: H0: H1: 不全为0检验方法是作方差分析。 记 则有平方和分解式 其中 为残差平方和,自由度为 为回归平方和,自由度为当H0为真时,有 对于给定的显著性水平 ,拒绝域为 。 021pp,21ni
6、xbxbbyippii,2,1110,REniiniiiniiTSSyyyyyyS121212)()()(iiiEyyS2)(1pnfE2)(yySiRpfR) 1,(),(/pnpFffFfSfSFEREERR) 1,(1pnpFF第9页/共83页 若记p+1维向量 ,那么 )(jBBYXppniiiiiEBbBbBbyyyS1100122)(ETiRSSyyS2)(第10页/共83页 4失拟检验 当在某些点有重复试验数据的话,可以在检验回归方程显著性之前,先对y 的期望是否是 的线性函数进行检验,这种检验称为失拟检验,它要检验如下假设: H H0 0: H H1 1:当在 上有重复试验或观
7、察时,将数据记为 其中至少有一个 ,记 。此时残差平方和可进一步分解为组内平方和与组间平方和,其中组内平方和就是误差平方和,记为 ,组间平方和称为失拟平方和,记为 ,即: pxxx,21ppxxEy110ppxxEy110),(21ipiixxxnimjyxxxiijipii, 2 , 1, 2 , 1),(21,2imniimN1eSLfeESSSLfS第11页/共83页nimjiijeiyyS121)(nNmfie) 1(imjijiiymy11niiiiLfyymS12)(1pnfLf, 检验统计量为 在H0为真时, ,对于给定的显著性水平 ,拒绝域为 当拒绝H0时,需要寻找原因,改变模
8、型,否则认为线性回归模型合适,可以将Se与SLf合并作为SE检验方程是否显著。其中eeLfLfLffSfSF/),(eLfLfffFF),(1eLfLfffFF第12页/共83页 5对回归系数的显著性检验 当回归方程显著时,可进一步检验某个回归系数是否为0,也即检验如下假设: 此种检验应对j=1,2, p逐一进行。 常用的检验方法是t t检验或等价的F F检验,F F检验统计量为:其中 是 中的第j j+1+1个对角元。 记分子为 ,即 ,它是因子 的偏回归平方和 分母是模型中 的无偏估计。 , 也称为 的标准误,即其标准差的估计。 0010jjjjHH:,:222/jjjjjcbtFjjc1
9、)(XXjSjjjjcbS/2jx2EEfS / jjcjb第13页/共83页 当H0j为真时,有 。 给定的显著性水平 ,当 时拒绝假设H0j,即认为 显著不为零,否则可以将对应的变量从回归方程中删除。 注:当有不显著的系数时,一般情况下一次只能删除一个F值最小的变量,重新计算回归系数,再重新检验。通常要到余下的系数都显著时为止。 ), 1 (EjfFF), 1 (1EjfFFj第14页/共83页11.1.3 回归分析对数据的处理由被动变主动 古典的回归分析方法只是被动地处理已有的试验数据,对试验的安排不提任何要求,对如何提高回归方程的精度研究很少。 后果: (1)盲目增加试验次数,而这些试
10、验结果还不能提供充分的信息,以致在许多多因子试验问题中达不到试验目的。 (2)对模型的合适性有时无法检验,因为在被动处理数据时在同一试验点上不一定存在重复试验数据。 为了适应寻求最佳工艺、最佳配方、建立生产过程的数学模型等的需要,人们就要求以较少的试验次数建立精度较高的回归方程。 第15页/共83页 为此,要求摆脱古典回归分析的被动局面,主动把试验的安排、数据的处理和回归方程的精度统一起来考虑,即根据试验目的和数据分析的要求来选择试验点,不仅使得在每一个试验点上获得的数据含有最大的信息,从而减少试验次数,而且使数据的统计分析具有一些较好的性质。 这就是二十世纪五十年代发展起来的“回归设计”所研
11、究的问题。 回归设计的分类: 根据建立的回归方程的次数不同,回归设计有一次回归设计、二次回归设计、三次回归设计等; 根据设计的性质又有正交设计、旋转设计等。 第16页/共83页11.1.4 因子水平的编码 在回归问题中各因子的量纲不同,其取值的范围也不同,为了数据处理的方便,对所有的因子作一个线性变换,使所有因子的取值范围都转化为中心在原点的一个“立方体”中,这一变换称为对因子水平的编码。 方法如下: 设因子 的取值范围为: , 与 分别称为因子 的下水平与上水平。其中心也称为零水平: , 因子的变化半径为 , 令 ,此变换式就称为“编码式”。 jzjjjzzz21pj, 2 , 1jzjz1
12、jz22/ )(210jjjzzzpj, 2 , 12/ )(12jjjzzpj, 2 , 1jjjjzzx0pj, 2 , 1第17页/共83页 例 硝基蒽醌中某物质的含量y与以下三个因子有关: z1:亚硝酸钠(单位:克) z2:大苏打(单位:克) z3:反应时间(单位:小时)为提高该物质的含量,需建立y关于变量z1,z2,z3的回归方程。 1试验设计 (1)确定因子取值范围,并对它们的水平进行编码 本例的因子水平编码见下表。 表 因子水平编码表 因子 水平 编码值 z1 z2 z3 上水平 +1 9.0 4.5 3 下水平 - -1 5.0 2.5 1 零水平 0 7.0 3.5 2 变化
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 田间试验 统计 方法 响应 设计
限制150内