多元线性回归.ppt

资源ID：56699706 资源大小：1.55MB 全文页数：102页
资源格式： PPT 下载积分：20金币

快捷下载

会员登录下载

微信登录下载

三方登录下载：

微信扫一扫登录

下载资源需要20金币

邮箱/手机：
温馨提示：	快捷下载时，用户名和密码都是您填写的邮箱或者手机号，方便查询和重复下载（系统自动生成）。如填写123，账号就是123，密码也是123。
支付方式：
验证码：	换一换

账号：
密码：
验证码：	换一换
当日自动登录忘记密码？

友情提示

1、下载资料失败解决办法

2、PDF文件下载后，可能会被浏览器默认打开，此种情况可以点击浏览器菜单，保存网页到桌面，就可以正常下载了。

3、本站不支持迅雷下载，请使用电脑自带的IE浏览器，或者360浏览器、谷歌浏览器下载即可。

4、本站资源下载后的文档和图纸-无水印,预览文档经过压缩，下载后原文更清晰。

5、试题试卷类文档，如果标题没有明确说明有答案则都视为没有答案，请知晓。

网站客服

侵权投诉

多元线性回归.ppt

多元线性回归多元线性回归3.1 3.1 多元线性回归模型多元线性回归模型一、多元线性回归模型一、多元线性回归模型二、多元线性回归模型的基本假定二、多元线性回归模型的基本假定 2一、多元线性回归模型一、多元线性回归模型多元线性回归模型多元线性回归模型:表现在线性回归模型中的表现在线性回归模型中的解释变量有多个。解释变量有多个。一般表现形式一般表现形式：i=1,2,n其中其中:k为解释变量的数目，为解释变量的数目，j j称为称为回归参数回归参数（regression coefficient）。）。3也也被被称称为为总总体体回回归归函函数数的的随随机机表表达达形形式式。它它的的非随机表达式非随机表达式为为:表示：表示：各变量各变量X X值固定时值固定时Y Y的平均响应的平均响应。习惯上：习惯上：把常数项看成为一虚变量的系把常数项看成为一虚变量的系数，该虚变量的样本观测值始终取数，该虚变量的样本观测值始终取1。于是：于是：模型中解释变量的数目为（模型中解释变量的数目为（k+1）4总体回归模型总体回归模型n个随机方程的矩阵表达式为个随机方程的矩阵表达式为:其中矩阵其中矩阵Y、X、和和的含义如下的含义如下:j也被称为偏回归系数也被称为偏回归系数，表示在其他解释变，表示在其他解释变量保持不变的情况下，量保持不变的情况下，X j每变化每变化1个单位时，个单位时，Y的的均值均值E(Y)的变化的变化;或者说或者说 j给出了给出了X j的单位变化对的单位变化对Y均值的均值的“直直接接”或或“净净”（不含其他变量）影响。（不含其他变量）影响。56其其随机表示式随机表示式:ei称为称为残差残差或或剩余项剩余项(residuals)，可看成是，可看成是总体回归函数中随机扰动项总体回归函数中随机扰动项 i的近似替代。的近似替代。样本回归函数样本回归函数的的矩阵表达矩阵表达:或或其中其中：用来估计总体回归函数的用来估计总体回归函数的样本回归函数为：样本回归函数为：7二、多元线性回归模型的基本假定二、多元线性回归模型的基本假定假设假设1，解释变量是非随机的或固定的，且各，解释变量是非随机的或固定的，且各X之间互不相关（无多重共线性）。之间互不相关（无多重共线性）。假设假设2，随机误差项具有零均值、同方差及不，随机误差项具有零均值、同方差及不序列相关性。序列相关性。8 假设假设3，解释变量与随机项不相关，解释变量与随机项不相关假设假设4，随机项满足正态分布，随机项满足正态分布 9上述假设的上述假设的矩阵符号表示矩阵符号表示式：式：假设假设1 1，n(k+1)+1)矩阵矩阵X是非随机的，是非随机的，且且X的的秩秩=k+1+1，即，即X满秩。满秩。假设假设2 2，10 f(u)x x=x x3 3时的时的E E(y y)x x=x x2 2时时y y的分布的分布x x=x x1 1时时y y的分布的分布x x=x x2 2时的时的E E(y y)x x3 3x x2 2x x1 1x x=x x1 1时的时的E E(y y)0 0 xyx x=x x3 3时时y y的分布的分布 0 0+1 1x x11假设假设4，向量，向量有一多维正态分布，即有一多维正态分布，即同一元回归一样，多元回归还具有如下两个重同一元回归一样，多元回归还具有如下两个重要假设：要假设：假设假设5 5，样本容量趋于无穷时，各解释变量的，样本容量趋于无穷时，各解释变量的方差趋于有界常数，即方差趋于有界常数，即n时，时，假设假设3，E(E(X)=0)=0，即即 12 其中：其中：Q为一非奇异固定矩阵，矩阵为一非奇异固定矩阵，矩阵x是是由各解释变量的离差为元素组成的由各解释变量的离差为元素组成的n k阶矩阵阶矩阵该假设同样是为了避免伪回归问题。该假设同样是为了避免伪回归问题。假设假设6，回归模型的设定是正确的，回归模型的设定是正确的。或133.2 3.2 多元线性回归模型的估计多元线性回归模型的估计一、普通最小二乘估计一、普通最小二乘估计二、参数估计量的性质二、参数估计量的性质三、样本容量问题三、样本容量问题四、估计实例四、估计实例 14一、普通最小二乘估计一、普通最小二乘估计对于随机抽取的对于随机抽取的n组观测值组观测值如果如果样本函数样本函数的参数估计值已经得到，则有的参数估计值已经得到，则有：i=1,2n 根据根据最最小二乘原小二乘原理理，参数，参数估计值应估计值应该是右列该是右列方程组的方程组的解解其其中中15 于是得到关于待估参数估计值的于是得到关于待估参数估计值的正规方程组正规方程组：解该解该（k+1）个方程组成的线性代数方程组，即个方程组成的线性代数方程组，即可得到可得到(k+1)个待估参数的估计值个待估参数的估计值$,jj=012 L。k16正规方程组正规方程组的矩阵形式矩阵形式即即由于由于XX满秩，故有满秩，故有 17用含两个解释变量的矩阵形式来表示用含两个解释变量的矩阵形式来表示XX：18 将上述过程用矩阵表示如下将上述过程用矩阵表示如下：寻找一组参数估计值寻找一组参数估计值，使得残差平方和，使得残差平方和最小。最小。即求解方程组即求解方程组：19得到得到：于是于是：例例3.2.1：在例：在例2.1.1的家庭收入的家庭收入-消费支出例中消费支出例中，-2XY+2XX =020可求得：可求得：于是于是：15 82939 007 100142.40.6721正规方程组正规方程组的另一种写法的另一种写法对于对于正规方程组正规方程组于是于是或或(*)(*)或（或（*）是多元线性回归模型）是多元线性回归模型正规方程组正规方程组的另一种写法。的另一种写法。(*)(*)将将Y=X +e 代入得代入得22样本回归函数的离差形式样本回归函数的离差形式i=1,2n 其矩阵形式为其矩阵形式为：其中其中：在离差形式下，参数的最小二乘估计结果为在离差形式下，参数的最小二乘估计结果为 23随机误差项随机误差项的方差的方差的无偏估计的无偏估计可以证明，随机误差项可以证明，随机误差项的方差的无偏估的方差的无偏估计量为：计量为：24 四、参数估计量的性质四、参数估计量的性质在满足基本假设的情况下，其结构参数在满足基本假设的情况下，其结构参数的的普通最小二乘估计普通最小二乘估计、最大或然估计最大或然估计及及矩估计矩估计仍具仍具有：有：线性性线性性、无偏性无偏性、有效性有效性。同时，随着样本容量增加，参数估计量具有：渐近无偏性、渐近有效性、一致性渐近无偏性、渐近有效性、一致性。25 1、线性性、线性性(参考一元回归的性质，参考一元回归的性质，36页）页）其中其中,C=(XX)-1 X 为一仅与固定的为一仅与固定的X有关的行有关的行向量向量 2、无偏性、无偏性这里利用了假设这里利用了假设:E(X)=026 3、有效性（最小方差性）有效性（最小方差性）参数估计量参数估计量的方差的方差-协方差矩阵协方差矩阵 27其中利用了其中利用了和和根据高斯根据高斯-马尔可夫定理，马尔可夫定理，Cov()=2(XX)-1在所有的无偏估在所有的无偏估计计量的方差中是最小的。量的方差中是最小的。28 五、样本容量问题五、样本容量问题所谓所谓“最小样本容量最小样本容量”，即从最小二乘原理，即从最小二乘原理和最大似然原理出发，欲得到参数估计量，不管和最大似然原理出发，欲得到参数估计量，不管其质量如何，所要求的样本容量的下限。其质量如何，所要求的样本容量的下限。最小样本容量最小样本容量样本最小容量必须不少于模型中解释变量样本最小容量必须不少于模型中解释变量的数目（包括常数项）的数目（包括常数项）,即 n k+1因为，无多重共线性要求：秩因为，无多重共线性要求：秩(X)=)=k+1+129 2 2、满足基本要求的样本容量、满足基本要求的样本容量从统计检验的角度从统计检验的角度：n 30 时，时，Z检验才能应用；检验才能应用；n-k8 8时时,t分布较为稳定分布较为稳定一般经验认为一般经验认为:当当n30或者至少或者至少n3(k+1)时，才能说满足模时，才能说满足模型估计的基本要求。型估计的基本要求。模型的良好性质只有在大样本下才能得到理模型的良好性质只有在大样本下才能得到理论上的证明论上的证明30 六、多元线性回归模型的参数估计实例六、多元线性回归模型的参数估计实例 313.3 3.3 多元线性回归模型的统计检验多元线性回归模型的统计检验一、拟合优度检验一、拟合优度检验二、方程的显著性检验二、方程的显著性检验(F(F检验检验)三、变量的显著性检验（三、变量的显著性检验（t t检验）检验）四、参数的置信区间四、参数的置信区间 32一、拟合优度检验一、拟合优度检验1、可决系数与调整的可决系数、可决系数与调整的可决系数则总离差平方和的分解总离差平方和的分解记总离差平方和回归平方和残差平方和33由于由于:=0所以有所以有：注意：一个有趣的现象注意：一个有趣的现象34 可决系数可决系数该统计量越接近于该统计量越接近于1，模型的拟合优度越高，模型的拟合优度越高。问题：在应用过程中发现，如果在模型中问题：在应用过程中发现，如果在模型中增加一个解释变量，增加一个解释变量，R2往往增大（往往增大（Why?)Why?)这就给人一个错觉：这就给人一个错觉：要使得模型拟合得好，要使得模型拟合得好，只要增加解释变量即可只要增加解释变量即可。但是，现实情况但是，现实情况往往是，由增加解释变量个数引起的往往是，由增加解释变量个数引起的R2的增大的增大与拟合好坏无关与拟合好坏无关，R2需调整需调整。35调整的可决系数调整的可决系数（adjusted coefficient of determination）在样本容量一定的情况下，增加解释变量必在样本容量一定的情况下，增加解释变量必定使得自由度减少，所以定使得自由度减少，所以调整的思路是调整的思路是:将残差平将残差平方和与总离差平方和分别除以各自的自由度，以方和与总离差平方和分别除以各自的自由度，以剔除变量个数对拟合优度的影响剔除变量个数对拟合优度的影响:其中：其中：n-k-1为残差平方和的自由度，为残差平方和的自由度，n-1为总体为总体平方和的自由度。平方和的自由度。36 与与R2之间存在如下关系：之间存在如下关系：在例在例3.2.2中中：=0.9756在中国居民消费支出的一元模型例中：在中国居民消费支出的一元模型例中：R2=0.9714说明增加的解释变量增强了模型的解释能力。说明增加的解释变量增强了模型的解释能力。问题：问题：多大才算通过拟合优度检验？多大才算通过拟合优度检验？37二、方程的显著性检验二、方程的显著性检验(F(F检验检验)方程的显著性检验，旨在对模型中被解释变方程的显著性检验，旨在对模型中被解释变量与解释变量之间的线性关系在总体上是否显著量与解释变量之间的线性关系在总体上是否显著成立作出推断。成立作出推断。1.方程显著性的方程显著性的F检验检验即检验模型即检验模型 Yi=0+1X1i+2X2i+kXki+i i=1,2,n 中的参数中的参数 1,2,3,4.是否显著不为是否显著不为0。38 可提出如下原假设与备择假设：可提出如下原假设与备择假设：H0：1=2=k=0 H1：j不全为0 F F检验的思想检验的思想来自于总离差平方和的分解式：来自于总离差平方和的分解式：TSS=ESS+RSS由于回归平方和由于回归平方和ESS=是解释变量是解释变量X的联合体的联合体对被解释变量对被解释变量Y的线性作用的结果，考虑比值：的线性作用的结果，考虑比值：39 如果这个比值较大，则如果这个比值较大，则X的联合体对的联合体对Y的解的解释程度高，可认为总体存在线性关系，反之总体释程度高，可认为总体存在线性关系，反之总体上可能不存在线性关系。上可能不存在线性关系。因此因此,可通过该比值的大小对总体线性关系可通过该比值的大小对总体线性关系进行推断进行推断。统计学中的知识：统计学中的知识：N N个服从正态分布的独立随个服从正态分布的独立随机变量的平方和服从自由度为机变量的平方和服从自由度为N N的的分布。分布。如果如果X X和和Z Z是独立的，均服从是独立的，均服从分布，其自由度分布，其自由度分别为分别为N N1 1和和N N2 2，则（，则（X/X/N1）/(Z/(Z/N2)服从自由度为服从自由度为N1和和N2的的F分布。分布。在原假设在原假设H0成立的条件下，统计量成立的条件下，统计量 40服从自由度为服从自由度为(k,n-k-1)1)的的F分布。分布。给定显著性水平给定显著性水平，可得到临界值，可得到临界值F(k,n-k-1)，由样本求出统计量，由样本求出统计量F的数值，通过的数值，通过 F F F(k,n-k-1)或或 F FF(k,n-k-1)来拒绝或接受原假设来拒绝或接受原假设H0，以判定原方程总体上，以判定原方程总体上的线性关系是否显著成立。的线性关系是否显著成立。41对于例子对于例子3.2.2,计算得到计算得到 F=285.92给给定定显显著著性性水水平平 =0.05，查查分分布布表表，得得到到临临界界值：值：F0.05(2(2,28)=)=3.34显显然然有有F F F(k,n-k-1)，即即模模型型的的线线性性关关系系在在95%的置信水平下显著成立。的置信水平下显著成立。42 2.关于拟合优度检验与方程显著性检验关系关于拟合优度检验与方程显著性检验关系由由可推出：可推出：或或43检验检验H H0 0:1 1=0,=0,2 2=0,=0,k=0等价于检验等价于检验R2=0因此，因此，F检验是所估计回归的总显著性的一个检验是所估计回归的总显著性的一个度量，也是度量，也是R2的一个显著性检验。亦即的一个显著性检验。亦即F与与R2同向变化：当同向变化：当R2=0时，时，F=0；R2越大，越大，F值也越大；值也越大；当当R2=1时，时，F为无穷大。为无穷大。44 在例在例3.2.3中，给定显著水平中，给定显著水平 =0.05时，查时，查F分布表：分布表：将该数值代入与调整将该数值代入与调整R R2 2的关系式中，得到调整的关系式中，得到调整R2的值为的值为0.1354。在应用中不必对在应用中不必对R R2 2过分苛求，重要的是需要考察过分苛求，重要的是需要考察模型的经济关系是否合理。模型的经济关系是否合理。F0.05(2,28)=3.3445三、变量的显著性检验（三、变量的显著性检验（t t检验）检验）方程的方程的总体线性总体线性关系显著关系显著每个解释变量每个解释变量对对被解释变量的影响都是显著的。被解释变量的影响都是显著的。因此，必须对每个解释变量进行显著性检验，因此，必须对每个解释变量进行显著性检验，以决定是否作为解释变量被保留在模型中。以决定是否作为解释变量被保留在模型中。这一检验是由对变量的这一检验是由对变量的 t 检验完成的。检验完成的。46 1.t统计量统计量由于由于以以c ii表示矩阵表示矩阵(XX)-1 主对角线上的第主对角线上的第i个元素，个元素，于是参数估计量的方差为：于是参数估计量的方差为：其中其中 2为随机误差项的方差，在实际计算为随机误差项的方差，在实际计算时，用它的估计量代替时，用它的估计量代替:47因此，可构造如下因此，可构造如下t统计量统计量易知易知服从如下的正态分布：服从如下的正态分布：48 2.t检验检验设计原假设与备择假设：设计原假设与备择假设：H1：i0 给定显著性水平给定显著性水平，可得到临界值，可得到临界值t/2(n-k-1)，由样本求出统计量，由样本求出统计量t的数值，通过的数值，通过|t|t|t/2(n-k-1)或或|t|t|t/2(n-k-1)来拒绝或接受原假设来拒绝或接受原假设H0，从而，从而判定对应的解释变判定对应的解释变量是否应包括在模型中。量是否应包括在模型中。H0：i=0 （i=1,2k）49注意：注意：一元线性回归中，一元线性回归中，t t检验与检验与F F检验一致检验一致一方面一方面，t检验与检验与F检验都是对相同的原假设检验都是对相同的原假设H0：1=0=0进行检验进行检验;另一方面另一方面，两个统计量之间有如下关系：，两个统计量之间有如下关系：50在例在例3.2.2中，由应用软件计算出参数的中，由应用软件计算出参数的t值：值：给定显著性水平给定显著性水平=0.05，查得相应临界，查得相应临界值：值：t0.025(28)=2.048。可可见见，计计算算的的所所有有t值值都都大大于于该该临临界界值值，所以拒绝原假设。即所以拒绝原假设。即:模模型型引引入入的的2个个解解释释变变量量都都在在5%的的显显著著水水平平下下，都通过了变量显著性检验。都通过了变量显著性检验。7.3782.20151四、四、参数的置信区间参数的置信区间参参数数的的置置信信区区间间用用来来考考察察：在在一一次次抽抽样样中中所所估计的参数值离参数的真实值有多估计的参数值离参数的真实值有多“近近”。在变量的显著性检验中已经知道：在变量的显著性检验中已经知道：52容易推出：在容易推出：在(1-(1-)的置信水平下的置信水平下 i的置信区间是的置信区间是其中，其中，t/2为显著性水平为为显著性水平为、自由度为、自由度为n-k-1的临界值。的临界值。在在例例3.2.2中中,给给定定=0.05，查查表表得得临临界界值值：t0.025(28)=2.04853计算得参数的置信区间：计算得参数的置信区间：1：(0.4014,0.7098)2：(0.0174,0.4828)从回归计算中已得到：从回归计算中已得到：54如何才能缩小置信区间？如何才能缩小置信区间？我们知道估计出来的参数我们知道估计出来的参数的标准差的表达式和的标准差的表达式和一元直线回归方程中一元直线回归方程中的标准差表达式如下：的标准差表达式如下：增大样本容量增大样本容量n n 因为在同样的样本容量下，因为在同样的样本容量下，n n越大，越大，t t分布表分布表中的临界值越小，同时，增大样本容量，还可使中的临界值越小，同时，增大样本容量，还可使样本参数估计量的标准差减小；样本参数估计量的标准差减小；55 提高模型的拟合优度。提高模型的拟合优度。因为样本参数估计量的标准差与残差平方和呈正因为样本参数估计量的标准差与残差平方和呈正比，模型优度越高，残差平方和应越小。比，模型优度越高，残差平方和应越小。提高样本观测值的分散度。提高样本观测值的分散度。一般情况下，样本观测值越分散，一般情况下，样本观测值越分散，(XX)-1的分母的分母的的|XX|的值越大，致使区间缩小。如在一元线性回归的值越大，致使区间缩小。如在一元线性回归中参数的标准差分别为：中参数的标准差分别为：563.4 3.4 多元线性回归模型的预测多元线性回归模型的预测一、一、E(Y0)的置信区间的置信区间二、二、Y0的置信区间的置信区间57对于模型对于模型给给定定样样本本以以外外的的解解释释变变量量的的观观测测值值X0=(1,X10,X20,Xk0)，可可以以得得到到被被解解释释变变量量的的预预测值：测值：它可以是总体均值它可以是总体均值E(Y0)或个值或个值Y0的预测。的预测。但严格地说，但严格地说，这只是被解释变量的预测值的这只是被解释变量的预测值的估计值，而不是预测值。估计值，而不是预测值。为了进行科学预测，还需求出预测值的置信为了进行科学预测，还需求出预测值的置信区间，包括区间，包括E(Y0)和和Y0的置信区间的置信区间。58由于由于为标量，因此为标量，因此一、一、E(Y0)的置信区间的置信区间易知易知利用了第利用了第6464页结论：页结论：5960容易证明容易证明于是，得到于是，得到(1-(1-)的置信度下的置信度下E(Y0)的的置信区间置信区间：其中，其中，t/2/2为为(1-(1-)的置信度下的的置信度下的临界值临界值。取随机扰动项的样本估计量取随机扰动项的样本估计量，构造如下，构造如下t t统计量统计量6162二、二、Y0的置信区间的置信区间如果已经知道实际的预测值如果已经知道实际的预测值Y0，那么预测误差为：，那么预测误差为：容易证明容易证明参见参见6363页结论页结论6364e0服从正态分布，即服从正态分布，即构造构造t统统计量计量可得给定可得给定(1-(1-)的置信水平下的置信水平下Y0的的置信区间置信区间：取随机扰动项的样本估计量取随机扰动项的样本估计量，可得，可得e e0 0 的方差的方差的估计量的估计量6566 例例3.2.23.2.2中：中：2006年人均可支配收入年人均可支配收入20000元，前一年人均消费支出元，前一年人均消费支出14000元，当年人均消元，当年人均消费支出预测值的置信区间可如下求出：费支出预测值的置信区间可如下求出：于是于是人均居民消费的预测值人均居民消费的预测值为为 2001=143.3+0.555620000+0.250114000=14757（元）（元）预测的置信区间预测的置信区间：在在95%95%的置信度下，临界值的置信度下，临界值t ta/2a/2(28)=2.048 (28)=2.048 =148 931.9 =148 931.967于是于是E(E(2001）的的95%的置信区间为的置信区间为:或或（14318.2，15196.6）0.4553076 -0.0000045-0.0000479-0.0000045 0.000 000-0.000 0001-0.0000479-0.0000001 0.00000010.308868 或或（13853.1,15661.7）同样，易得同样，易得 2001的的95%的置信区间为的置信区间为693.5 3.5 回归模型的其他函数形式回归模型的其他函数形式一、模型的类型与变换一、模型的类型与变换二、非线性回归实例二、非线性回归实例70说说明明在实际经济活动中，经济变量的关系是复杂在实际经济活动中，经济变量的关系是复杂的，直接表现为线性关系的情况并不多见。的，直接表现为线性关系的情况并不多见。如著名的恩格尔曲线如著名的恩格尔曲线(Engle curves)表现为幂表现为幂函数曲线形式、宏观经济学中的菲利普斯曲线函数曲线形式、宏观经济学中的菲利普斯曲线（Pillips cuves）表现为双曲线形式等。）表现为双曲线形式等。但是，大部分非线性关系又可以通过一些简但是，大部分非线性关系又可以通过一些简单的数学处理，使之化为数学上的线性关系，从单的数学处理，使之化为数学上的线性关系，从而可以运用线性回归模型的理论方法。而可以运用线性回归模型的理论方法。71一、模型的类型与变换一、模型的类型与变换 1.1.倒数模型、多项式模型与变量的直接置换法倒数模型、多项式模型与变量的直接置换法例如，描述税收与税率关系的拉弗曲线：抛物线例如，描述税收与税率关系的拉弗曲线：抛物线 s=a+b r+c r2 c0 s：税收；：税收；r：税率：税率设设X1=r，X2=r2，则原方程变换为则原方程变换为 s=a+b X1+c X2 c0 722.幂函数模型、指数函数模型与对数变换法幂函数模型、指数函数模型与对数变换法例如，例如，Cobb-Dauglas生产函数：幂函数生产函数：幂函数 Q=AKL Q：产出量，：产出量，K：投入的资本；：投入的资本；L：投入的劳动：投入的劳动方程两边取对数：方程两边取对数：ln Q=ln A+ln K+ln L733.复杂函数模型与级数展开法复杂函数模型与级数展开法方程两边取对数后，得到：方程两边取对数后，得到：(1+2=1)Q:产出量，产出量，K：资本投入，：资本投入，L：劳动投入：劳动投入：替代参数，：替代参数，1、2：分配参数：分配参数例如，常替代弹性例如，常替代弹性CES生产函数生产函数将式中将式中ln(1K-+2L-)在在=0处展开泰勒处展开泰勒级数级数,取关于取关于的线性项，即得到一个线性近似式。的线性项，即得到一个线性近似式。74二、非线性回归实例二、非线性回归实例例例3.5.1 建立中国城镇居民食品消费需求函数建立中国城镇居民食品消费需求函数模型。模型。根据需求理论，居民对食品的消费需求函数根据需求理论，居民对食品的消费需求函数大致为大致为:Q:居民对食品的需求量居民对食品的需求量 X：消费者的消费支出总额消费者的消费支出总额P1：食品价格指数：食品价格指数 P0：居民消费价格总指数：居民消费价格总指数(3.5.13)75 零阶齐次性零阶齐次性，当所有商品和消费者货币支，当所有商品和消费者货币支出总额按同一比例变动时，需求量保持不变。出总额按同一比例变动时，需求量保持不变。(3.5.14)为了进行比较，将同时估计（为了进行比较，将同时估计（*）式与（）式与（*）式。）式。76 根据根据恩格尔定律恩格尔定律，居民对食品的消费支出与，居民对食品的消费支出与居民的总支出间呈幂函数的变化关系居民的总支出间呈幂函数的变化关系:首先首先,确定具体的函数形式确定具体的函数形式对数变换对数变换:(3.5.15)(3.5.16)77考虑到考虑到零阶齐次性零阶齐次性时时(*)式也可看成是对（式也可看成是对（*）式施加如下约束）式施加如下约束而得而得:因因此此，对对（*）式式进进行行回回归归，就就意意味味着着原原需需求函数满足零阶齐次性条件求函数满足零阶齐次性条件。(3.5.17)78表表3.5.13.5.1中国城镇居民人均消费支出中国城镇居民人均消费支出X XX1X1当年价当年价GPGP（上年（上年=100=100）FPFP（上年（上年=100=100）Q Q（20002000年价）年价）P0P0（0000年为年为100100）P1P1（0000年年100100）19851985673.2673.2351.4351.4111.9111.9116.5116.51315.91315.928.128.126.726.719861986799799418.9418.9107107107.2107.21463.31463.330.130.128.628.619871987884.4884.4472.9472.9108.8108.81121121475147532.832.832.132.11988198811041104567567120.7120.7125.2125.21412.51412.539.539.540.140.11989198912111211660660116.3116.3114.4114.41437.21437.2464645.945.9199019901278.91278.9693.8693.8101.3101.398.898.81529.21529.246.646.645.445.4199119911453.81453.8782.5782.5105.1105.1105.4105.41636.31636.3494947.847.8199219921671.71671.7884.8884.8108.6108.6110.7110.71671.41671.453.253.252.952.9199319932110.82110.81058.21058.2116.1116.1116.5116.51715.91715.961.761.761.761.7199419942851.32851.31422.51422.5125125134.2134.21718.71718.777.277.282.882.8199519953537.63537.61771.91771.9116.8116.8123.6123.61732.11732.190.190.1102.3102.3199619963919.53919.51904.71904.7108.8108.8107.9107.91725.61725.698.198.1110.4110.4199719974185.64185.61942.61942.6103.1103.1100.1100.11758.21758.2101.1101.1110.5110.5199819984331.64331.61926.91926.999.499.496.996.91799.81799.8100.5100.5107.1107.1199919994615.94615.91932.11932.198.798.795.795.71885.71885.799.299.2102.5102.520002000499849981971.31971.3100.8100.897.697.61971.31971.310010010010020012001530953092027.92027.9100.7100.7100.7100.72013.82013.8100.7100.7100.7100.7200220026029.96029.92271.82271.8999999.999.92258.32258.399.799.7100.6100.6200320036510.96510.92416.92416.9100.9100.9103.4103.42323.52323.5100.6100.6104104200420047182.17182.12709.62709.6103.3103.3109.9109.92370.22370.2103.9103.9114.3114.3200520057942.97942.92914.42914.4101.6101.6103.1103.12472.72472.7105.6105.6117.9117.9200620068696.68696.63111.93111.9101.5101.5102.6102.62573.42573.4107.2107.2120.9120.97980按照按照3.5.163.5.16式回归，式回归，EviewsEviews软件的输出结果如下：软件的输出结果如下：(59.4)(14.78)(-1.45)(-1.41)各变量的弹性和比较接近于零，但不为零。各变量的弹性和比较接近于零，但不为零。5.530.5400.2580.2880.97730.9735258.848182按按零阶齐次性零阶齐次性表达式回归表达式回归:（66.47）(23.03)(-1.82)为了比较，改写该式为为了比较，改写该式为：5.52 0.5340.2750.97730.9749408.95.52 0.5340.2755.520.5340.2750.259与与3.5.16估计结果比较接近，这估计结果比较接近，这意味着意味着所建立的食品需求所建立的食品需求函数满足零阶齐次性特征。函数满足零阶齐次性特征。833.6 3.6 受约束回归受约束回归一、模型参数的线性约束一、模型参数的线性约束二、对回归模型增加或减少解释变量二、对回归模型增加或减少解释变量84说说明明在建立回归模型时，有时根据经济理论需要对模型中的在建立回归模型时，有时根据经济理论需要对模型中的参数施加一定的约束条件。例如：参数施加一定的约束条件。例如：需求函数的需求函数的0阶齐次性条件阶齐次性条件生产函数的生产函数的1阶齐次性条件阶齐次性条件模型施加约束条件后进行回归，称为受约束回归模型施加约束条件后进行回归，称为受约束回归（restricted regression）;未加任何约束的回归称为无约束回归（未加任何约束的回归称为无约束回归（unrestricted regression）。）。85一、模型参数的线性约束一、模型参数的线性约束例如对模型例如对模型:施加约束施加约束:得得:或或:(3.6.1)(3.6.4)其中其中:Y*=Y-X2,X*=X1-X2,Xk-1=Xk-1+Xk(3.6.2)(3.6.3)86如果对（如果对（3.6.4）式回归得出）式回归得出:则由约束条件可得则由约束条件可得：然而，对所考查的具体问题能否施加约束？然而，对所考查的具体问题能否施加约束？需进一步进行相应的检验。常用的检验有：需进一步进行相应的检验。常用的检验有：F检检验、验、x2检验与检验与t检验。检验。87F检验检验在同一样本下，记无约束样本回归模型为在同一样本下，记无约束样本回归模型为:受约束样本回归模型为受约束样本回归模型为:于是于是:88 受约束样本回归模型的受约束样本回归模型的残差平方和残差平方和RSSR于是于是ee为无约束样本回归模型的为无约束样本回归模型的残差平方残差平方和和RSSU(*)受约束与无约束模型都有受约束与无约束模型都有相同的相同的TSS89 这这意意味味着着，通通常常情情况况下下，对对模模型型施施加加约约束束条件会降低模型的解释能力。条件会降低模型的解释能力。但但是是，如如果果约约束束条条件件为为真真，则则受受约约束束回回归归模模型型与与无无约约束束回回归归模模型型具具有有相相同同的的解解释释能能力力，RSSR 与与 RSSU的差异变小的差异变小。由（由（*）式）式 RSSR RSSU从而从而 ESSR ESSU90可用可用RSSR-RSSU的大小来检验约束的真实性的大小来检验约束的真实性根据数理统计学的知识：根据数理统计学的知识：于是：于是：91讨论：讨论：如果约束条件无效，如果约束条件无效，RSSR 与与 RSSU的差异较的差异较大，计算的大，计算的F值也较大。值也较大。于是，可用计算的于是，可用计算的F统计量的值与所给定的显统计量的值与所给定的显著性水平下的临界值作比较，对约束条件的真实性著性水平下的临界值作比较，对约束条件的真实性进行检验。进行检验。注意，注意，kU-kR恰为约束条件的个数。恰为约束条件的个数。92 例例3.6.1 3.6.1 中中国国城城镇镇居居民民对对食食品品的的人人均均消消费费需需求求实例中，对零阶齐次性检验：实例中，对零阶齐次性检验：无约束回归无约束回归:RSSU=0.017748，kU=3 受约束回归受约束回归:RSSR=0.017787，KR=2 样本容量样本容量 n=22，约束条件个数约束条件个数 kU-kR=3-2=193取取=5%，查得临界值，查得临界值 F0.05(1,18)=4.41结论结论：不能拒绝中国城镇居民对食品的人均消费不能拒绝中国城镇居民对食品的人均消费需求函数具有零阶齐次特性这一假设需求函数具有零阶齐次特性这一假设。这里的这里的F F检验适合所有关于参数线性约束的检验。检验适合所有关于参数线性约束的检验。如：多元回归中对方程总体线性性的如：多元回归中对方程总体线性性的F检验：检验：H0：j=0 j=1,2,k94这里：受约束回归模型为这里：受约束回归模型为这里，运用了这里，运用了ESSR 0。95二、对回归模型增加或减少解释变量二、对回归模型增加或减少解释变量考虑如下两个回归模型考虑如下两个回归模型(3.6.13)(3.6.14)(3.6.13)式可看成是式可看成是（3.6.14）式的受约束回归：式的受约束回归：H0：96相应的相应的统计量为统计量为：统计量的另一个等价式统计量的另一个等价式97 证明过程如下：证明过程如下：分子分母同除以分子分母同除以TSS就得到了：就得到了：98 在在3.5节中，中国城镇居民对食品的人均消费需求实例节中，中国城镇居民对食品的人均消费需求实例中，中，t检验发现食品价格与城镇居民的总消费价格的变动检验发现食品价格与城镇居民的总消费价格的变动好像不对城镇居民人均食品消费产生影响，似乎可以去好像不对城镇居民人均食品消费产生影响，似乎可以去掉。但另一方面，由于两价格指数具有很强的相关性，掉。但另一方面，由于两价格指数具有很强的相关性，也可能使得模型无法准确地分辨出它们各自的影响。这也可能使得模型无法准确地分辨出它们各自的影响。这里可以通过里可以通过F检验来判断是否可以将两个价格因素从模型检验来判断是否可以将两个价格因素从模型中去掉，或者只去掉其中之一。中去掉，或者只去掉其中之一。无约束模型仍是（无约束模型仍是（3.5.18）式，其残差平方和为）式，其残差平方和为RSSU=0.017748。去掉两价格因素的受约束模型回归结果如下：。去掉两

注意事项

本文（多元线性回归.ppt）为本站会员（豆****）主动上传，淘文阁 - 分享文档赚钱的网站仅提供信息存储空间，仅对用户上传内容的表现方式做保护处理，对上载内容本身不做任何修改或编辑。若此文所含内容侵犯了您的版权或隐私，请立即通知淘文阁 - 分享文档赚钱的网站（点击联系客服），我们立即给予删除！

温馨提示：如果因为网速或其他原因下载失败请重新下载，重复下载不扣分。