最新多元模型回归与分析精品课件.ppt
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_05.gif)
《最新多元模型回归与分析精品课件.ppt》由会员分享,可在线阅读,更多相关《最新多元模型回归与分析精品课件.ppt(57页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、2一、实验数据分析一、实验数据分析q由实验数据回归模型,得到模型参数前,对数据自变量间的由实验数据回归模型,得到模型参数前,对数据自变量间的线性相关性进行检验,是发现回归模型应用的可靠性和准确线性相关性进行检验,是发现回归模型应用的可靠性和准确性受限制的有效方法。性受限制的有效方法。 因自变量间的线性相关性,使得无法区分它们对因变量的作用因自变量间的线性相关性,使得无法区分它们对因变量的作用; 回归模型参数时会遇到几乎是奇异的数据矩阵,这样的模型参数有很回归模型参数时会遇到几乎是奇异的数据矩阵,这样的模型参数有很大的不确定性大的不确定性(95的参数置信度范围宽的参数置信度范围宽)。 q例:例:
2、回归二氧化硫的催化氧化速率方程:回归二氧化硫的催化氧化速率方程: 装有载铂氧化铝催化剂颗粒的微分固定床反应器中,测定二装有载铂氧化铝催化剂颗粒的微分固定床反应器中,测定二氧化硫的催化氧化速率。总压为氧化硫的催化氧化速率。总压为790 mmHg时,记录流体相的时,记录流体相的组成分压,有下表所示的速率结果,通过这些数据求取二氧组成分压,有下表所示的速率结果,通过这些数据求取二氧化硫的催化氧化速率方程。化硫的催化氧化速率方程。 9Antoine方程拟合的残差方程拟合的残差 残差虽然很小,但其分残差虽然很小,但其分布不是随机的。布不是随机的。残差的分布同正态分布相残差的分布同正态分布相比,有较大的差
3、距。比,有较大的差距。 两方面的结果充分说明了拟合回归的两方面的结果充分说明了拟合回归的AntoineAntoine方程还不能充方程还不能充分反映蒸汽压与温度间的关系,造成残差间存在关联。分反映蒸汽压与温度间的关系,造成残差间存在关联。采用采用RiedelRiedel方程拟合得到的也是类似的结果。方程拟合得到的也是类似的结果。lnPResidual Values-0.003-0.002-0.0010.0000.0010.0020.00312345678Residual fromAntoine Eq fitExpectedNormalFrequency Distribution: Residua
4、lsNo of obs02468101214161820222426-0.003-0.003-0.002-0.002-0.001-5.000e-40.0005.000e-40.0010.0020.0020.0030.0030.00410改进改进Thek-Stiel方程方程的拟合结果方程方程的拟合结果拟合误差比拟合误差比AntoineAntoine方程方程小了近一个数量级,而且小了近一个数量级,而且残差分布是随机分布的。残差分布是随机分布的。误差分布基本符合正态误差分布基本符合正态分布。分布。改进改进Thek-StielThek-Stiel方程方程描述水饱和蒸汽压的合适模型。方程方程描述水饱和蒸
5、汽压的合适模型。 lnPvPrResidual Values-7e-4-5e-4-3e-4-1e-41e-43e-45e-4-11-10-9-8-7-6-5-4Eq.(8.2.6) fit Frequency Distribution: ResidualsNo of obs01020304050607080-7e-4-6e-4-5e-4-4e-4-3e-4-2e-4-1e-401e-42e-43e-44e-4Eq.(6) fitExpectedNormal11二、回归模型的选择(二、回归模型的选择(2)q前面说明了前面说明了模型参数较少模型参数较少时会出现拟合残差时会出现拟合残差的分布不是随机
6、的,而是呈现某种分布,相的分布不是随机的,而是呈现某种分布,相互关联。互关联。q在模型回归拟合数据的过程中,如在模型回归拟合数据的过程中,如模型参数模型参数过多过多会出现什么情况?如何判断回归拟合模会出现什么情况?如何判断回归拟合模型中有过多的参数呢?型中有过多的参数呢?12丙烷在氢型丝光沸石上的吸附平衡丙烷在氢型丝光沸石上的吸附平衡q例:例:选用不同吸附方程拟合丙烷在氢型丝光沸石体系选用不同吸附方程拟合丙烷在氢型丝光沸石体系303K的吸附平衡数的吸附平衡数据。据。q目标:目标:说明如何对模型拟合结果进行统计分析,确定模型拟合的好坏、模说明如何对模型拟合结果进行统计分析,确定模型拟合的好坏、模
7、型参数的可靠性和准确性,从而进行拟合模型的选择。型参数的可靠性和准确性,从而进行拟合模型的选择。 P, kPaq, mmol/gP, kPaq, mmol/gP, kPaq, mmol/gP, kPaq, mmol/g0.100.09 1.080.4812.670.81115.891.140.140.12 1.470.5116.700.85140.071.170.220.18 1.510.5324.810.90158.901.190.330.24 2.270.5934.280.95176.761.200.410.30 3.220.6443.850.98193.371.220.490.31 4.
8、720.6954.621.02206.811.240.570.36 5.060.7065.791.040.770.41 7.390.7573.191.060.990.4410.260.7994.661.09表表8-4 303K8-4 303K时丙烷在氢型丝光沸石上的吸附平衡数据时丙烷在氢型丝光沸石上的吸附平衡数据 13具有代表性的、也是适用性较广的模型具有代表性的、也是适用性较广的模型 q1、Lanmuir (L)双参数方程:双参数方程: q2、Freundlich (F)双参数方程:双参数方程: nn aPaPm1(8.2.8) q3、BET双参数方程:双参数方程:q4、Langmuir-F
9、reundlich (LF)三参数方程:三参数方程:q5、三参数方程:、三参数方程: q6、Toth三参数方程:三参数方程: q7、扩展的、扩展的LF方程(五参数):方程(五参数): q8、(14)式的特殊形式(四参数)式的特殊形式(四参数) : naPbnn cxxxcxm()()11xP P/0nn aPaPmbb1Pbc111exp() n nm/nn PbPmcc()/1nn aPdcPaPcPmbebe1nn aPbc bd PaPcPmbdbd()11(8.2.9) (8.2.10) (8.2.11) (8.2.12) (8.2.13) (8.2.14) (8.2.15) 14各模
10、型的计算结果各模型的计算结果 Eq.(8)Eq.(9)Eq.(10)Eq.(11)Eq.(12)Eq.(13)Eq.(14)Eq.(15)nm1.0840.051/0.9760.0250.4380.0534.62317.221.5350.2570.7580.0880.7690.068a0.5530.1310.4460.034/1.3820.107/1.3290.4961.4270.144b/0.200.018/0.4940.0620.6781.6580.5490.0760.9420.1070.9750.058c/812.1116.3/20.9652.650.3410.0591.9071.593
11、0.0170.003d/0.0240.0480.9120.046e/1.6380.586/s29.09010-27.72110-25.13410-23.79910-22.9933.15410-21.04810-28.68610-3R20.987900.991270.996140.997950.998580.998590.999860.99990表表8 85 5 吸附等温线关联的参数值、方差和回归系数吸附等温线关联的参数值、方差和回归系数 从表中可看出,方程从表中可看出,方程(8(814)14)拟合方差逐渐减少,回归系数更拟合方差逐渐减少,回归系数更接近接近1 1(方程(方程(12)(12)是通
12、过压力数据来拟合的,故拟合方差和其是通过压力数据来拟合的,故拟合方差和其它方程的结果不是在同一数量级上它方程的结果不是在同一数量级上) )。由方程。由方程(14)(14)的五参数形的五参数形式改进的方程式改进的方程(15)(15)式获得的结果最好,实验数据点几乎完全落式获得的结果最好,实验数据点几乎完全落在方程(在方程(1515)式的曲线上)式的曲线上( (见下图见下图) )。15方程方程(13)和方程和方程(15)的拟合结果的拟合结果 0.11.010.0100.0p, kPa0.00.51.0n, mmol/gExp. dataToth Eq.(13)Eq.(15)方程方程(15)(15)
13、式获得的结果最好,实验数据点几乎完式获得的结果最好,实验数据点几乎完全落在方程(全落在方程(1515)式的曲线上。)式的曲线上。16判断模型参数是否过少的依据判断模型参数是否过少的依据q通过对方程通过对方程(13)和五参数方程和五参数方程(15)的残差进行分析,的残差进行分析, 方程方程(13)因参数过少,吸附量的计算误差与实验吸附量之间存在着某种分布。因参数过少,吸附量的计算误差与实验吸附量之间存在着某种分布。 方程方程(15) 计算误差在零的两边是随机分布的,看不出规律性。因此,拟合计算计算误差在零的两边是随机分布的,看不出规律性。因此,拟合计算误差有无规律性的分布是判断模型参数是否过少的
14、依据。误差有无规律性的分布是判断模型参数是否过少的依据。因此,拟合计算误差有无规律性的分布是判断模型参数是因此,拟合计算误差有无规律性的分布是判断模型参数是否过少的依据。否过少的依据。 Predicted versus Residual Valuesn, mmol/gResidual Values-0.08-0.06-0.04-0.020.000.020.040.060.00.20.40.60.81.01.21.4Predicted versus Residual Valuesn, mmol/gResidual Values-0.020-0.015-0.010-0.0050.0000.0050
15、.0100.0150.0200.00.20.40.60.81.01.21.4方程方程(13)(13)的拟合误差的拟合误差 方程方程(15)(15)的拟合误差的拟合误差 17判断模型参数是否过多的依据判断模型参数是否过多的依据Eq.(14)Eq.(15)nm0.7580.0880.7690.068a1.3290.4961.4270.144b0.9420.1070.9750.058c1.9071.5930.0170.003d0.0240.0480.9120.046e1.6380.586/s21.04810-28.68610-3R20.999860.99990q在方程在方程(14)的计算结果中,有的
16、计算结果中,有些参数些参数95%的置信度较大,说的置信度较大,说明这些参数之间有联系,不是明这些参数之间有联系,不是独立的。独立的。q而对于方程而对于方程(14)的五参数形式,的五参数形式,即方程即方程(15),其所有参数的,其所有参数的95%置信度都较小。事实上,置信度都较小。事实上,方程方程(15)就是据此分析对吸附就是据此分析对吸附平衡理论作进一步研究而获得平衡理论作进一步研究而获得的。的。因此,拟合参数因此,拟合参数95%95%的置信度是否较大是判断模型参数是否的置信度是否较大是判断模型参数是否过多的依据。过多的依据。18回归模型的选择总结回归模型的选择总结q模型参数较少模型参数较少时
17、会出现拟合残差的分布不是时会出现拟合残差的分布不是随机的,而是呈现某种分布,相互关联。残随机的,而是呈现某种分布,相互关联。残差的分布偏离正态分布较远。差的分布偏离正态分布较远。 q模型参数过多模型参数过多会出现某些参数会出现某些参数95%的置信度的置信度较大,说明这些参数之间有联系,不是独立较大,说明这些参数之间有联系,不是独立的。的。19习题习题q研究二硫化碳饱和蒸汽压的模型回归问题。(研究二硫化碳饱和蒸汽压的模型回归问题。(P266,Ex8.3)二硫化碳的基本性质:二硫化碳的基本性质: 临界温度为临界温度为273.05273.05 临界压力为临界压力为72.87 72.87 atmatm
18、。 温度,蒸汽压,mmHg温度,蒸汽压,mmHg-701.610198.0-603.520297.5-507.130432.7-4014.040616.7-3026.250995.6-2046.5601170.4-1078.8701558.00127.320Statistica的非线性估计的非线性估计q非线性估计方法非线性估计方法 User-Specified Regression, least square 可以计算95%置信区间21“least square”与与“Custom Loss ”比较比较q“least square”计算结果(采用计算结果(采用Levenberg-Marquar
19、dt方法)方法)Model is: q=(nm*a*p*b*(b+c*(b+d)*p*d)/(1+a*p*b*(1+c*p*d) (propane-mor.sta)Dep. Var. : qLevel of confidence: 95.0% ( alpha=0.050)EstimateStandarderrort-valuedf = 28p-levelLo. ConfLimitUp. ConfLimitnmabcd0.7637600.032019 23.85354 0.000000 0.698173 0.8293471.4359130.069004 20.80900 0.000000 1.2
20、94564 1.5772620.9822270.028027 35.04555 0.000000 0.924816 1.0396380.0163330.0016779.73910 0.000000 0.012898 0.0197680.9168660.022152 41.38886 0.000000 0.871489 0.962243Model: q=(nm*a*p*b*(b+c*(b+d)*p*d)/(1+a*p*b*(1+c*p*d). (propane-mor.sta)Dep. var: q Loss: (OBS-PRED)*2Final loss: .002032166 R=.9997
21、5 Variance explained: 99.950%N=33nmabcdEstimate0.763768 1.435910 0.982209 0.016336 0.916840q“Custom Loss ”计算结果(采用计算结果(采用Quasi-Newton法)法)Matrix ill conditioned; cannot compute standard errors.EConf22“Custom Loss ”的方差分析与迭代步骤的方差分析与迭代步骤 “Custom “Custom Loss ”Loss ”无迭无迭代历史纪录,代历史纪录,协方差分析结协方差分析结果已出现病态。果已出现
22、病态。Model is: q=(nm*a*p*b*(b+c*(b+d)*p*d)/(1+a*p*b*(1+c*p*d) (propane-mor.sta)Dep. Var. : qEffect1Sum of Sqares2DF3Mean Squares4F-value5p-valueRegressionResidualTotalCorrected TotalRegression vs.Corrected Total21.505475.000004.30109459262.190.0000000.0020328.000000.00007321.5075033.000004.0675032.000
23、0021.505475.000004.30109433.840.000000Model is: q=(nm*a*p*b*(b+c*(b+d)*p*d)/(1+a*p*b*(1+c*p*d) (propane-mor.sta)Dep. Var. : qLossFunctionnmabcd123456789104.629683 0.100000 0.100000 0.100000 0.100000 0.1000004.294027 0.184348 0.196978 0.173970 0.528173 0.5570214.227658 0.191476 0.221943 0.188990 0.58
24、7318 0.5716294.102290 0.204036 0.266635 0.217677 0.697367 0.5994433.874137 0.224709 0.339318 0.270956 0.885848 0.6511153.429648 0.259087 0.453795 0.373779 1.198671 0.7516122.556049 0.312350 0.616018 0.561417 1.656081 0.9378231.036472 0.392841 0.756563 0.881424 1.932017 1.2618210.899994 0.404754 0.76
25、4595 0.929852 1.734310 1.3103860.755383 0.425557 0.992230 0.962118 0.684109 1.321683Covariance matrix cannot be computed. 23Statistica非线性估计的残差分析非线性估计的残差分析残差分布情况残差分布情况残差对预测值作图残差对预测值作图24对方程对方程(15)的残差分析的残差分析Predicted versus Residual Values123456789101112131415161718192021222324252627282930313233-0.20.0
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 最新 多元 模型 回归 分析 精品 课件
![提示](https://www.taowenge.com/images/bang_tan.gif)
限制150内