数学建模多元线性回归分析ppt课件.ppt
《数学建模多元线性回归分析ppt课件.ppt》由会员分享,可在线阅读,更多相关《数学建模多元线性回归分析ppt课件.ppt(50页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、第十五章第十五章 多元线性回归分析多元线性回归分析(Multiple Linear Regression) Multiple linear regression Choice of independent variable Application 讲述内容讲述内容第一节第一节 多元线性回归多元线性回归第二节第二节 自变量选择方法自变量选择方法第三节第三节 多元线性回归的应用多元线性回归的应用 及其注意事项及其注意事项目的:作出以多个自变量估计因变量的多元线性回归方程。资料:因变量为定量指标;自变量全部或大部分为定量指标,若有少量定性或等级指标需作转换。用途:解释和预报。意义:由于事物间的联系常
2、常是多方面的,一个应变量的变化可能受到其它多个自变量的影响,如糖尿病人的血糖变化可能受胰岛素、糖化血红蛋白、血清总胆固醇、甘油三脂等多种生化指标的影响。第一节第一节 多元线性回归多元线性回归 变量:变量:应变量应变量 1 个,自变量个,自变量m 个,共个,共 m+1 个。个。 样本含量:样本含量:n 数据格式见表数据格式见表15-1 回归模型一般形式:回归模型一般形式:eXXXYmm22110一、多元线性回归模型一、多元线性回归模型例 号 X1 X2 Xm Y 1 X11 X12 X1m Y1 2 X21 X22 X2m Y2 n Xn1 Xn2 Xnm Yn 表15-1 多元回归分析数据格式
3、 条件条件(1)Y与mXXX,21之间具有线性关系。 (2)各例观测值), 2 , 1(niYi相互独立。 (3)残差 e 服从均数为 0、 方差为2的正态分布, 它等价于对任意一组自变量mXXX,21值,应变量 Y 具有相同方差,并且服从正态分布。 一般步骤一般步骤(1)求偏回归系数mbbbb,210 mmXbXbXbbY22110建立回归方程(2)检验并评价回归方程检验并评价回归方程及各自变量的作用大小及各自变量的作用大小 二、多元线性回归方程的建立 例15-1 27名糖尿病人的血清总胆固醇、甘油三脂、空腹胰岛素、糖化血红蛋白、空腹血糖的测量值列于表15-2中,试建立血糖与其它几项指标关系
4、的多元线性回归方程。总胆固醇 甘油三脂 胰岛素 糖化血 血糖 (mmol/L) (mmol/L) (U/ml) 红蛋白(%) (mmol/L) 序号 i X1 X2 X3 X4 Y 1 5.68 1.90 4.53 8.2 11.2 2 3.79 1.64 7.32 6.9 8.8 3 6.02 3.56 6.95 10.8 12.3 4 4.85 1.07 5.88 8.3 11.6 5 4.60 2.32 4.05 7.5 13.4 6 6.05 0.64 1.42 13.6 18.3 7 4.90 8.50 12.60 8.5 11.1 8 7.08 3.00 6.75 11.5 12.
5、1 9 3.85 2.11 16.28 7.9 9.6 10 4.65 0.63 6.59 7.1 8.4 11 4.59 1.97 3.61 8.7 9.3 12 4.29 1.97 6.61 7.8 10.6 13 7.97 1.93 7.57 9.9 8.4 14 6.19 1.18 1.42 6.9 9.6 15 6.13 2.06 10.35 10.5 10.9 16 5.71 1.78 8.53 8.0 10.1 17 6.40 2.40 4.53 10.3 14.8 18 6.06 3.67 12.79 7.1 9.1 19 5.09 1.03 2.53 8.9 10.8 20
6、6.13 1.71 5.28 9.9 10.2 21 5.78 3.36 2.96 8.0 13.6 22 5.43 1.13 4.31 11.3 14.9 23 6.50 6.21 3.47 12.3 16.0 24 7.98 7.92 3.37 9.8 13.2 25 11.54 10.89 1.20 10.5 20.0 26 5.84 0.92 8.61 6.4 13.3 27 3.84 1.20 6.45 9.6 10.4 表15-2 27名糖尿病人的血糖及有关变量的测量结果 2221102)()(mmXbXbXbbYYYQmYmmmmmYmmYmmlblblbllblblbllblb
7、lbl22112222212111212111)(22110mmXbXbXbYb求偏导数()() , , j=1,2,m()(), 1,2,ijijiijjijjjYjjjXXlXXXXX XinXYlXXYYX Yjmn43216382027060351501424094335X.X.X.X.Y原 理最小二乘法三、假设检验及其评价 012:0mH , 1:jH各 (j=1,2, ,m)不全为 0, 0.05 1. 方差分析法方差分析法:残回总SSSSSS残回残回(MSMSmnSSmSSF) 1/(一)对回归方程) 1(mn ,mFF变异来源 自由度 SS MS F P 总变异 n-1 SS总
8、 回 归 m SS回 SS回 /m MS回/MS残 残 差 n-m-1 SS残 SS残 /(n-m-1) 表15-4 例15-1的方差分析表 变异来源 自由度 SS MS F P 总变异 26 222.5519 回 归 4 133.7107 33.4277 8.28 0.01 残 差 22 88.8412 4.0382 表15-3 多元线性回归方差分析表查 F 界值表得31. 4)22,4(01. 0F,31. 4F,01. 0P, 在05. 0水平上拒绝 H0,接受 H1认为所建回归方程具有统计学意义。 (0.05)(0.05)102 R,说明自变量mXXX,21能够解释Y变化的百分比,其值
9、愈接近于 1,说明模型对数据的拟合程度愈好。本例 6008. 05519.2227107.1332R 表明血糖含量变异的 60%可由总胆固醇、 甘油三脂、胰岛素和糖化血红蛋白的变化来解释。 21SSSSRSSSS回残总总2. 决定系数决定系数R 2:3.复相关系数复相关系数 可用来度量应变量 Y 与多个自变量间的线性相关程度,亦即观察值Y与估计值Y之间的相关程度。 计算公式:2RR,本例7751060080.R 若m=1自变量,则有| r |R,r为简单相关系数。 (二)对各自变量 指明方程中的每一个自变量对Y的影响(即方差分析和决定系数检验整体)。含义 回归方程中某一自变量jX的偏回归平方和
10、表示模型中含有其它 m-1 个自变量的条件下该自变量对 Y的回归贡献, 相当于从回归方程中剔除jX后所引起的回归平方和的减少量, 或在 m-1个自变量的基础上新增加jX引起的回归平方和的增加量。 1. 偏回归平方和 )(jXSS回表示偏回归平方和,其值愈大说明相应的自变量愈重要。 ()/1/(1)jjSSXFSSnm回残一般情况下,m-1 个自变量对 Y 的回归平方和由重新建立的新方程得到,而不是简单地把jjXb从有 m 个自变量的方程中剔出后算得。 12 1, 1nm平方和(变异) 回归方程中 包含的自变量 SS回 SS残 4321X,X,X,X 133.7107 88.8412 432X,
11、X,X 133.0978 89.4540 431XX,X 121.7480 100.8038 421XX,X 113.6472 108.9047 321XX,X 105.9168 116.6351 表表15-5 对例对例15-1数据作回归分析的部分中间结果数据作回归分析的部分中间结果 各自变量的偏回归平方和可以通过拟合包含不同各自变量的偏回归平方和可以通过拟合包含不同自变量的回归方程计算得到,表自变量的回归方程计算得到,表15-515-5给出了例给出了例15-115-1数数据分析的部分中间结果。据分析的部分中间结果。 11234234()(,)(,) 133.7107-133.0978=0.6
12、129SSXSSXXXXSSX XX回回回 21234134()(,)(,) 133.7107-121.748011.9627SSXSSXXXXSSX XX回回回 31234124()(,)(,) 133.7107-113.647220.0635SSXSSXXXXSSX XX回回回 41234123()(,)(,) 133.7107-105.916827.7939SSXSSXXXXSSX XX回回回 152. 0) 1427( /8412.881 /6129. 01F, 962. 2) 1427/(8412.881 /9627.112F 968. 4) 1427/(8412.881 /0635
13、.203F , 883. 6) 1427/(8412.881 /7939.274F 结结果果2. t 检验法 是一种与偏回归平方和检验完全等价的一种方法。计算公式为jbjjSbt检验假设: H0:0j,jt服从自由度为1mn的 t 分布。如果12mn ,/jt|t |,则在(0.05)水平上拒绝 H0,接受 H1,说明jX与Y有线性回归关系。 jb为偏回归系数的估计值,jbS是jb的标准误。 390036560142401.t 721120420351502.t 229212140270603.t 623224330638204.t 结结 果果结结 论论0742222050.t,/.,074.
14、2|34 tt, P值 均 小 于0.05, 说 明3b和4b有 统 计 学 意义 , 而1b和2b则 没 有 统 计 学 意 义 。 3标准化回归系数 变量标准化是将原始数据减去相应变量的均数,然后再除以该变量的标准差。()jjjjXXXS 计算得到的回归方程称作标准化回归方程,相应的回归系数即为标准化回归系数。 YjjYYjjjjSSbllbb注意:注意: 一般回归系数一般回归系数有单位,用来解释各自有单位,用来解释各自变量对应变量的影响,表示在其它自变量保变量对应变量的影响,表示在其它自变量保持不变时,持不变时, 增加或减少一个单位时增加或减少一个单位时Y Y的平的平均变化量均变化量 。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 数学 建模 多元 线性 回归 分析 ppt 课件
限制150内