03-多元线性回归模型.pdf
《03-多元线性回归模型.pdf》由会员分享,可在线阅读,更多相关《03-多元线性回归模型.pdf(34页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、第第3章 多元线性回归模型章 多元线性回归模型多元线性回归模型与假定条件最小二乘法(多元线性回归模型与假定条件最小二乘法(OLS)最小二乘估计量的特性可决系数显著性检验与置信区间预测预测的评价指标建模过程中应注意的问题案例分析)最小二乘估计量的特性可决系数显著性检验与置信区间预测预测的评价指标建模过程中应注意的问题案例分析第第3章 多元线性回归模型章 多元线性回归模型3.1 多元线性回归模型与假定条件多元线性回归模型与假定条件经济意义:经济意义:xt j是是yt的重要解释变量代数意义:的重要解释变量代数意义:yt与与xt j存在线性关系几何意义:存在线性关系几何意义:yt表示一个多维平面表示一
2、个多维平面(第(第2版教材第版教材第49页)(第页)(第3版教材第版教材第45页)页)yt=0 0+1xt1+2xt2 +k-xt k +ut 当给定一个样本(当给定一个样本(yt,xt1,xt2,xt k),t=1,2,T 时时,上述模型表示为上述模型表示为 y1=0 0+1x11+2x12 +k-x1 k+u1,y2=0 0+1x21+2x22 +k x2 k+u2,.yT=0 0+1x T 1+2x T 2+k-x T k+uT 1211)1(10)1(122211111121111+=TTkkkTkTTjTkjkjTTuuuxxxxxxxxxyyy?Y=X +u 此时此时 yt与与 x
3、 t i已知,已知,j与与 ut未知。未知。3.1 多元线性回归模型与假定条件多元线性回归模型与假定条件为保证得到最优估计量,回归模型应满足如下假定条件:为保证得到最优估计量,回归模型应满足如下假定条件:假定(假定(1):):E(u)=0=00?假定(假定(2):):误差项同方差、非自相关误差项同方差、非自相关 Var(u)=E(u u )=2I=210000001?假定(假定(3):):解释变量与误差项相互独立。解释变量与误差项相互独立。E(X u)=0 假定(假定(4):):解释变量之间线性无关。解释变量之间线性无关。rk(X X)=rk(X)=k+1 假定(假定(5):):解释变量是非随
4、机的,且当解释变量是非随机的,且当 T 时,时,T 1X X Q 其中其中 Q 是一个有限值的非退化矩阵。是一个有限值的非退化矩阵。(第(第2版教材第版教材第51页)(第页)(第3版教材第版教材第47页)页)最小二乘最小二乘(OLS)法的原理是求残差平方和最小。代数上是求极值问题。法的原理是求残差平方和最小。代数上是求极值问题。minS=(Y-X)(Y-X)=Y Y-X Y-Y X +X X =Y Y-2 X Y+X X 因为因为 Y X 是一个标量,所以有是一个标量,所以有 Y X =X Y。上式的一阶条件为:。上式的一阶条件为:S=-2X Y+2X X=0 X Y=X X 因为因为(X X
5、)是一个非退化矩阵(假定(是一个非退化矩阵(假定(5),所以有),所以有 =(X X)-1 X Y 3.2 最小二乘法(最小二乘法(OLS)(第(第2版教材第版教材第55页)(第页)(第3版教材第版教材第51页)页)3.2 最小二乘法(最小二乘法(OLS)的最小二乘的最小二乘(OLS)估计公式也可以用下面的方式推导。估计公式也可以用下面的方式推导。对估计的回归模型对估计的回归模型 Y=X+u 左乘一个左乘一个 X,X Y=X X+X u 根据(最小二乘)估计的回归函数的性质(根据(最小二乘)估计的回归函数的性质(4),),X u=0 有有 X Y=X X =(X X)-1X Y 高斯高斯马尔可
6、夫定理:马尔可夫定理:若前述假定条件成立,若前述假定条件成立,OLS 估计量是估计量是 最佳线性无偏估计量最佳线性无偏估计量。具有具有无偏性,最小方差特性,一致性。无偏性,最小方差特性,一致性。求出求出,估计的回归模型写为,估计的回归模型写为 Y=X+u=Y+u 例题例题3.1Y:某商品需求量:某商品需求量X1:该商品价格:该商品价格X2:消费者平均收入:消费者平均收入(第(第2版教材第版教材第60页)(第页)(第3版教材第版教材第54页)页)obsY X1 X2 1 58 9 56 2 48 8 53 3 63 7 60 4 68 6 70 5 73 7 78 6 98 5 84 7 98
7、4 91 8 78 6 82 9 108 3 100 10 88 5 120 =113.83-8.36 X1+0.18 X2(4.0)(-3.6)(0.9)R2=0.88,F=26.4,T=10Y3.3 最小二乘(最小二乘(OLS)估计量的特性)估计量的特性(第(第2版教材第版教材第64页)(第页)(第3版教材第版教材第58页)页)1 的分布的分布 E()=E(X X)-1 X Y =E(X X)-1X(X +u)=+(X X)-1X E(u)=Var()=E()()=E(X X)-1X u u X(X X)-1 =E(X X)-1X 2I X(X X)-1=2(X X)-1 因为因为 u N
8、(0,2 2I),Y N(X,2 2I),=(X X)-1X Y,是是 Y 的线性函数,所以的线性函数,所以 N(,2(X X)-1)。3.3 最小二乘(最小二乘(OLS)估计量的特性)估计量的特性(第(第2版教材第版教材第62页)(第页)(第3版教材第版教材第57页)页)2.残差的方差残差的方差 s2=2=u u/(T k-1)s2是是 2 2 的无偏估计量,的无偏估计量,E(s2)=E(2)=2 2。的估计的方差协方差矩阵是的估计的方差协方差矩阵是 Var()=s2 2(X X)-1=2(X X)-1 1.多重确定系数(多重可决系数)多重确定系数(多重可决系数)Y=X+u=Y+u,TSS=
9、RSS+ESS R2=22yTyTSSTSSR-YYYY=有有 0 R 2 1。R 2 1,拟合优度越好。,拟合优度越好。2.调整的多重确定系数调整的多重确定系数 2R=1-)(11(1)1/()1/(SSTSSRSSTkTTTSSTkTSSE=1-)1(112RkTT 3.4 可决系数可决系数(R2)(第(第2版教材第版教材第73页)(第页)(第3版教材第版教材第64页)页)例题例题3.1Y:某商品需求量:某商品需求量X1:该商品价格:该商品价格X2:消费者平均收入:消费者平均收入8831.095789.191813.40395789.19)110(.)110(.22222=DSSSEDSS
10、STSSESSTSSTSSRR8497.0)8831.01(12101101)1(111222=RkTTR(第(第2版教材第版教材第63页)(第页)(第3版教材第版教材第57页)(第页)(第2版教材第版教材第72页)(第页)(第3版教材第版教材第65页)页)5973.5712101813.4031=kTuuF 检验检验 与与 SST=RSS+ESS 相对应,自由度相对应,自由度 T-1 也被分解为两部分,也被分解为两部分,(T-1)=(k)+(T-k-1)回归均方定义为回归均方定义为 MSR=kSSR,误差均方定义为,误差均方定义为 MSE=1 kTSSE H0:1=2=k=0;H1:j不全为
11、零不全为零 F=MSEMSR=)1/()/(kTSSEkSSR F(k,T-k-1)设检验水平为设检验水平为,则检验规则是,则检验规则是,若若 F F (k,T-k-1),接受,接受 H0;若;若 F F (k,T-k-1),拒绝,拒绝 H0。3.5 显著性检验与置信区间显著性检验与置信区间(第(第2版教材第版教材第74页)(第页)(第3版教材第版教材第67页)页)3.5 显著性检验与置信区间显著性检验与置信区间(第(第2版教材第版教材第76页)(第页)(第3版教材第版教材第69页)页)回归系数的回归系数的 t 检验检验 H 0:j=0,(j=1,2,k),H 1:j 0 t=)(jjs=11
12、21)()(+=jjjjVarXX t(T-k-1)判别规则:判别规则:若若 t t(T-k-1)接受接受 H 0;若若 t t(T-k-1)拒绝拒绝 H 0。(第第2版教材版教材75-78页页)(第第3版教材版教材67-70页页)Y:某商品需求量:某商品需求量X1:该商品价格:该商品价格X2:消费者平均收入:消费者平均收入45.267/95789.192/)1813.40395789.19(7/)110(.2/)110(.()1/(/)()1/(/2222=DSSSEDSknESSkSSESSTknESSkRSSF例题例题3.16474.32907.23553.8)(111=st9017.0
13、1997.01801.0)(222=st3.5 显著性检验与置信区间显著性检验与置信区间(第第2版教材版教材78页页)(第第3版教材版教材70页页)i的置信区间的置信区间(1)全部)全部 i的联合置信区间的联合置信区间 F=k1(-)(X X)(-)/s2 F (k,T-k)(-)(X X)(-)s2 k F (k,T-k),是一个,是一个 k 维椭球体。维椭球体。(2)单个)单个 i的置信区间的置信区间 i=i)(ist/2/2(k-1)=i)(ius1+iCt/2/2(k-1)=i11)(+iXXt/2/2(k-1)(第第2版教材版教材78页页)(第第3版教材版教材70页页)回归系数的联合
14、置信区间回归系数的联合置信区间例题例题3.1 1 的置信区间上下限:的置信区间上下限:-8.36 2.36 2.29 2 的置信区间上下限:的置信区间上下限:0.18 2.36 0.20Y:某商品需求量:某商品需求量X1:该商品价格:该商品价格X2:消费者平均收入:消费者平均收入单个回归系数的置信区间单个回归系数的置信区间(1)点预测)点预测 C=(1 xT+1 1 xT+1 2 xT+1 k )则则 T+1 期被解释变量期被解释变量 yT+1的点预测式,的点预测式,1+Ty=C=0+1 xT+1 1+k xT+1 k (2)单个)单个 yT+1的置信区间预测的置信区间预测 yT+1值与点预测
15、值值与点预测值1+Ty有以下关系有以下关系 yT+1=1+Ty+uT+1 E(yT+1)=E(1+Ty+uT+1)=C Var(yT+1)=Var(1+Ty)+Var(uT+1)=2 C(X X)-1C +2 =2(C(X X)-1C +1)yT+1是一个多元正态分布变量是一个多元正态分布变量,yT+1 N(C,2C(X X)-1C+1)单个单个 yT+1的置信区间是的置信区间是 C t/2(T-k-1)1)(1+CXXC 3.6 预测预测Y:某商品需求量:某商品需求量X1:该商品价格:该商品价格X2:消费者平均收入:消费者平均收入例题例题3.1 样本内样本内10点与样本外点与样本外1点预测点
16、预测204060801001201168.0105.630.4YF(第第2版教材版教材91-98页页)(第第3版教材版教材74-79页页)obs Y YF X1 X2 1 58 48.72 9 56 2 48 56.54 8 53 3 63 66.15 7 60 4 68 76.31 6 70 5 73 69.39 7 78 6 98 87.18 5 84 7 98 96.80 4 91 8 78 78.47 6 82 9 108 106.78 3 100 10 88 93.67 5 120 11 68.02 8.5 140 样本外样本外1点点点预测点预测与与区间预测区间预测预测的预测的EVi
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 03 多元 线性 回归 模型
限制150内