多元模型回归与分析教案.ppt
《多元模型回归与分析教案.ppt》由会员分享,可在线阅读,更多相关《多元模型回归与分析教案.ppt(56页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、多元模型回归与分析 Still waters run deep.流静水深流静水深,人静心深人静心深 Where there is life,there is hope。有生命必有希望。有生命必有希望一、实验数据分析一、实验数据分析q由实验数据回归模型,得到模型参数前,对数据自变量间的由实验数据回归模型,得到模型参数前,对数据自变量间的线性相关性进行检验,是发现回归模型应用的可靠性和准确线性相关性进行检验,是发现回归模型应用的可靠性和准确性受限制的有效方法。性受限制的有效方法。因自变量间的线性相关性,使得无法区分它们对因变量的作用因自变量间的线性相关性,使得无法区分它们对因变量的作用;回归模型参
2、数时会遇到几乎是奇异的数据矩阵,这样的模型参数有很回归模型参数时会遇到几乎是奇异的数据矩阵,这样的模型参数有很大的不确定性大的不确定性(95的参数置信度范围宽的参数置信度范围宽)。q例:例:回归二氧化硫的催化氧化速率方程:回归二氧化硫的催化氧化速率方程:装有载铂氧化铝催化剂颗粒的微分固定床反应器中,测定二氧装有载铂氧化铝催化剂颗粒的微分固定床反应器中,测定二氧化硫的催化氧化速率。总压为化硫的催化氧化速率。总压为790 mmHg时,记录流体相的组时,记录流体相的组成分压,有下表所示的速率结果,通过这些数据求取二氧化成分压,有下表所示的速率结果,通过这些数据求取二氧化硫的催化氧化速率方程。硫的催化
3、氧化速率方程。2二氧化硫的催化氧化速率二氧化硫的催化氧化速率 r分 压(atm)mol/g.hSO3SO2O20.020.04280.02550.1860.040.03310.03530.1900.060.02720.04090.1930.080.02360.04430.1950.100.02140.04640.1960.120.02010.04760.197表表8 82 2 二氧化硫的催化氧化速率二氧化硫的催化氧化速率 3两种模型的非线性回归两种模型的非线性回归q1、一般的指数速率方程形式、一般的指数速率方程形式(8.2.1)k=0.517113.3;a=-1.987.02;b=-0.216
4、4.556;c=6.078124.7 拟合结果:拟合结果:参数的参数的9595置信度太宽,模型参数不可靠置信度太宽,模型参数不可靠。q2、根据原子氧的吸附机理,得到的速率方程式(、根据原子氧的吸附机理,得到的速率方程式(Smith,Chemical Engineering Kinetics,3rd Ed.,1981,McGraw-Hill,P.374)(8.2.2)K=73K=73,为反应平衡常数,为反应平衡常数A=0.1017A=0.10170.09580.0958;B=16.02B=16.024.334.33 拟合结果:拟合结果:与方程与方程(8.2.1)(8.2.1)相比,方程参数的置信
5、度有了显著改善。相比,方程参数的置信度有了显著改善。4对速率方程的进一步分析对速率方程的进一步分析 如果把方程如果把方程(8.2.2)改写为:改写为:(8.2.3)将模型参数代入计算并以方程左边为横坐标、右边为纵坐标将模型参数代入计算并以方程左边为横坐标、右边为纵坐标作图。作图。结果并不是斜结果并不是斜率为率为-1-1的直线。的直线。说明表所给的说明表所给的速率数据没有速率数据没有足够的信息来足够的信息来表明速率方程表明速率方程中的逆反应贡中的逆反应贡献。献。如将如将SO3SO3分压分压对对O2O2分压作分压作图,这两分图,这两分压间有近似压间有近似线性关系。线性关系。所以方程所以方程(8.2
6、.18.2.1)的)的置信区间范置信区间范围大。围大。5二、回归模型的选择(二、回归模型的选择(1)q例:例:水饱和蒸汽压的模型回归水饱和蒸汽压的模型回归 水的蒸汽压数据选用的温度范围为水的蒸汽压数据选用的温度范围为0120 q三参数的三参数的Antoine方程:方程:q四参数的四参数的Riedel回归方程:回归方程:q五参数回归方程(参考五参数回归方程(参考Thek-Stiel的蒸汽压预测方程提出):的蒸汽压预测方程提出):(8.2.4)(8.2.5)(8.2.6)6水饱和蒸汽压的模型回归结果水饱和蒸汽压的模型回归结果参数Antoine方程改进Thek-Stiel方程A18.5587.513
7、2B-3973.2-10.449C-39.9832.8683D-.064796E-6.8475R20.99999981.0表表8-38-3 水饱和蒸汽压的方程拟合结果水饱和蒸汽压的方程拟合结果 拟合度十分接近拟合度十分接近1 1,表明拟合是成功的,但实际上用,表明拟合是成功的,但实际上用AntoineAntoine方程来拟合回归得到的结果不理想,说明仅从拟方程来拟合回归得到的结果不理想,说明仅从拟合度上来判断结果的好坏是不够的。为什么呢?合度上来判断结果的好坏是不够的。为什么呢?7因变量与残差关系图因变量与残差关系图 q残差定义:残差定义:(8.2.7)q考察模型参数估计方法的两个基本假设:考
8、察模型参数估计方法的两个基本假设:参数估计的误差相互不相关联,是随机的。参数估计的误差相互不相关联,是随机的。估计误差符合正态分布。估计误差符合正态分布。检查模型适合体系数据程度的最有效方法之一检查模型适合体系数据程度的最有效方法之一是对因变量与残差作图,观察其分布情况。是对因变量与残差作图,观察其分布情况。8Antoine方程拟合的残差方程拟合的残差 残差虽然很小,但其分残差虽然很小,但其分布不是随机的。布不是随机的。残差的分布同正态分布相残差的分布同正态分布相比,有较大的差距。比,有较大的差距。两方面的结果充分说明了拟合回归的两方面的结果充分说明了拟合回归的AntoineAntoine方程
9、还不能充方程还不能充分反映蒸汽压与温度间的关系,造成残差间存在关联。分反映蒸汽压与温度间的关系,造成残差间存在关联。采用采用RiedelRiedel方程拟合得到的也是类似的结果。方程拟合得到的也是类似的结果。9改进改进Thek-Stiel方程方程的拟合结果方程方程的拟合结果拟合误差比拟合误差比AntoineAntoine方程方程小了近一个数量级,而且小了近一个数量级,而且残差分布是随机分布的。残差分布是随机分布的。误差分布基本符合正态误差分布基本符合正态分布。分布。改进改进Thek-StielThek-Stiel方程方程描述水饱和蒸汽压的合适模型。方程方程描述水饱和蒸汽压的合适模型。10二、回
10、归模型的选择(二、回归模型的选择(2)q前面说明了前面说明了模型参数较少模型参数较少时会出现拟合残差时会出现拟合残差的分布不是随机的,而是呈现某种分布,相的分布不是随机的,而是呈现某种分布,相互关联。互关联。q在模型回归拟合数据的过程中,如在模型回归拟合数据的过程中,如模型参数模型参数过多过多会出现什么情况?如何判断回归拟合模会出现什么情况?如何判断回归拟合模型中有过多的参数呢?型中有过多的参数呢?11丙烷在氢型丝光沸石上的吸附平衡丙烷在氢型丝光沸石上的吸附平衡q例:例:选用不同吸附方程拟合丙烷在氢型丝光沸石体系选用不同吸附方程拟合丙烷在氢型丝光沸石体系303K的吸附平衡数据。的吸附平衡数据。
11、q目标:目标:说明如何对模型拟合结果进行统计分析,确定模型拟合的好坏、模说明如何对模型拟合结果进行统计分析,确定模型拟合的好坏、模型参数的可靠性和准确性,从而进行拟合模型的选择。型参数的可靠性和准确性,从而进行拟合模型的选择。P,kPaq,mmol/gP,kPaq,mmol/gP,kPaq,mmol/gP,kPaq,mmol/g0.100.09 1.080.4812.670.81115.891.140.140.12 1.470.5116.700.85140.071.170.220.18 1.510.5324.810.90158.901.190.330.24 2.270.5934.280.951
12、76.761.200.410.30 3.220.6443.850.98193.371.220.490.31 4.720.6954.621.02206.811.240.570.36 5.060.7065.791.040.770.41 7.390.7573.191.060.990.4410.260.7994.661.09表表8-4 303K8-4 303K时丙烷在氢型丝光沸石上的吸附平衡数据时丙烷在氢型丝光沸石上的吸附平衡数据 12具有代表性的、也是适用性较广的模型具有代表性的、也是适用性较广的模型 q1、Lanmuir(L)双参数方程:双参数方程:q2、Freundlich(F)双参数方程:双参
13、数方程:(8.2.8)q3、BET双参数方程:双参数方程:q4、Langmuir-Freundlich(LF)三参数方程:三参数方程:q5、三参数方程:、三参数方程:q6、Toth三参数方程:三参数方程:q7、扩展的、扩展的LF方程(五参数):方程(五参数):q8、(14)式的特殊形式(四参数)式的特殊形式(四参数):(8.2.9)(8.2.10)(8.2.11)(8.2.12)(8.2.13)(8.2.14)(8.2.15)13各模型的计算结果各模型的计算结果 Eq.(8)Eq.(9)Eq.(10)Eq.(11)Eq.(12)Eq.(13)Eq.(14)Eq.(15)nm1.0840.051
14、/0.9760.0250.4380.0534.62317.221.5350.2570.7580.0880.7690.068a0.5530.1310.4460.034/1.3820.107/1.3290.4961.4270.144b/0.200.018/0.4940.0620.6781.6580.5490.0760.9420.1070.9750.058c/812.1116.3/20.9652.650.3410.0591.9071.5930.0170.003d/0.0240.0480.9120.046e/1.6380.586/s29.09010-27.72110-25.13410-23.79910
15、-22.9933.15410-21.04810-28.68610-3R20.987900.991270.996140.997950.998580.998590.999860.99990表表8 85 5 吸附等温线关联的参数值、方差和回归系数吸附等温线关联的参数值、方差和回归系数 从表中可看出,方程从表中可看出,方程(8(814)14)拟合方差逐渐减少,回归系数更拟合方差逐渐减少,回归系数更接近接近1 1(方程(方程(12)(12)是通过压力数据来拟合的,故拟合方差和其是通过压力数据来拟合的,故拟合方差和其它方程的结果不是在同一数量级上它方程的结果不是在同一数量级上)。由方程。由方程(14)(1
16、4)的五参数形的五参数形式改进的方程式改进的方程(15)(15)式获得的结果最好,实验数据点几乎完全落式获得的结果最好,实验数据点几乎完全落在方程(在方程(1515)式的曲线上)式的曲线上(见下图见下图)。14方程方程(13)和方程和方程(15)的拟合结果的拟合结果 方程方程(15)(15)式获得的结果最好,实验数据点几乎完式获得的结果最好,实验数据点几乎完全落在方程(全落在方程(1515)式的曲线上。)式的曲线上。15判断模型参数是否过少的依据判断模型参数是否过少的依据q通过对方程通过对方程(13)和五参数方程和五参数方程(15)的残差进行分析,的残差进行分析,方程方程(13)因参数过少,吸
17、附量的计算误差与实验吸附量之间存在着某种分布。因参数过少,吸附量的计算误差与实验吸附量之间存在着某种分布。方程方程(15)计算误差在零的两边是随机分布的,看不出规律性。因此,拟合计算计算误差在零的两边是随机分布的,看不出规律性。因此,拟合计算误差有无规律性的分布是判断模型参数是否过少的依据。误差有无规律性的分布是判断模型参数是否过少的依据。因此,拟合计算误差有无规律性的分布是判断模型参数是因此,拟合计算误差有无规律性的分布是判断模型参数是否过少的依据。否过少的依据。方程方程(13)(13)的拟合误差的拟合误差 方程方程(15)(15)的拟合误差的拟合误差 16判断模型参数是否过多的依据判断模型
18、参数是否过多的依据Eq.(14)Eq.(15)nm0.7580.0880.7690.068a1.3290.4961.4270.144b0.9420.1070.9750.058c1.9071.5930.0170.003d0.0240.0480.9120.046e1.6380.586/s21.04810-28.68610-3R20.999860.99990q在方程在方程(14)的计算结果中,有的计算结果中,有些参数些参数95%的置信度较大,说的置信度较大,说明这些参数之间有联系,不是明这些参数之间有联系,不是独立的。独立的。q而对于方程而对于方程(14)的五参数形式,的五参数形式,即方程即方程(1
19、5),其所有参数的,其所有参数的95%置信度都较小。事实上,置信度都较小。事实上,方程方程(15)就是据此分析对吸附就是据此分析对吸附平衡理论作进一步研究而获得平衡理论作进一步研究而获得的。的。因此,拟合参数因此,拟合参数95%95%的置信度是否较大是判断模型参数是否的置信度是否较大是判断模型参数是否过多的依据。过多的依据。17回归模型的选择总结回归模型的选择总结q模型参数较少模型参数较少时会出现拟合残差的分布不是时会出现拟合残差的分布不是随机的,而是呈现某种分布,相互关联。残随机的,而是呈现某种分布,相互关联。残差的分布偏离正态分布较远。差的分布偏离正态分布较远。q模型参数过多模型参数过多会
20、出现某些参数会出现某些参数95%的置信度的置信度较大,说明这些参数之间有联系,不是独立较大,说明这些参数之间有联系,不是独立的。的。18习题习题q研究二硫化碳饱和蒸汽压的模型回归问题。(研究二硫化碳饱和蒸汽压的模型回归问题。(P266,Ex8.3)二硫化碳的基本性质:二硫化碳的基本性质:临界温度为临界温度为273.05273.05 临界压力为临界压力为72.87 atm72.87 atm。温度,蒸汽压,mmHg温度,蒸汽压,mmHg-701.610198.0-603.520297.5-507.130432.7-4014.040616.7-3026.250995.6-2046.5601170.4
21、-1078.8701558.00127.319Statistica的非线性估计的非线性估计q非线性估计方法非线性估计方法User-Specified Regression,least square 可以计算95%置信区间20“least square”与与“Custom Loss”比较比较q“least square”计算结果(采用计算结果(采用Levenberg-Marquardt方法)方法)q“Custom Loss”计算结果(采用计算结果(采用Quasi-Newton法)法)Matrix ill conditioned;cannot compute standard errors.ECo
22、nf21“Custom Loss”的方差分析与迭代步骤的方差分析与迭代步骤 “Custom Custom Loss Loss”无迭代无迭代历史纪录,协历史纪录,协方差分析结果方差分析结果已出现病态。已出现病态。Covariance matrix cannot be computed.22Statistica非线性估计的残差分析非线性估计的残差分析残差分布情况残差分布情况残差对预测值作图残差对预测值作图23对方程对方程(15)的残差分析的残差分析Histogram of Histogram of residualsresidualsResidual vs.Residual vs.Predicte
23、dPredicted24误差正态分布图误差正态分布图“least square”计算的误差正态分布图计算的误差正态分布图“Custom Loss”计算的误差正态分布图计算的误差正态分布图qAntoine 方程拟合结果方程拟合结果25非线性函数的管理非线性函数的管理26三、三、MATLAB的拟合函数的拟合函数q多项式拟合函数多项式拟合函数polyfitq非线性最小二乘法非线性最小二乘法lsqnonlin()非线性最小二乘(优化问题)非线性最小二乘(优化问题)lsqcurvefit()非线性最小二乘曲线拟合非线性最小二乘曲线拟合nlinfit()前两种的简化版本前两种的简化版本nlparci()计
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 多元 模型 回归 分析 教案
限制150内