计量经济学-第三章(共11页).doc
精选优质文档-倾情为你奉上第三章、经典单方程计量经济学模型:多元线性回归模型例1某地区通过一个样本容量为722的调查数据得到劳动力受教育的一个回归方程为 R2=0.214式中,edu为劳动力受教育年数,sibs为该劳动力家庭中兄弟姐妹的个数,medu与fedu分别为母亲与父亲受到教育的年数。问(1)sibs是否具有预期的影响?为什么?若medu与fedu保持不变,为了使预测的受教育水平减少一年,需要sibs增加多少?(2)请对medu的系数给予适当的解释。(3)如果两个劳动力都没有兄弟姐妹,但其中一个的父母受教育的年数为12年,另一个的父母受教育的年数为16年,则两人受教育的年数预期相差多少?解答:(1)预期sibs对劳动者受教育的年数有影响。因此在收入及支出预算约束一定的条件下,子女越多的家庭,每个孩子接受教育的时间会越短。根据多元回归模型偏回归系数的含义,sibs前的参数估计值-0.094表明,在其他条件不变的情况下,每增加1个兄弟姐妹,受教育年数会减少0.094年,因此,要减少1年受教育的时间,兄弟姐妹需增加1/0.094=10.6个。(2)medu的系数表示当兄弟姐妹数与父亲受教育的年数保持不变时,母亲每增加1年受教育的机会,其子女作为劳动者就会预期增加0.131年的教育机会。(3)首先计算两人受教育的年数分别为10.36+0.131´12+0.210´12=14.45210.36+0.131´16+0.210´16=15.816因此,两人的受教育年限的差别为15.816-14.452=1.364例2以企业研发支出(R&D)占销售额的比重为被解释变量(Y),以企业销售额(X1)与利润占销售额的比重(X2)为解释变量,一个有32容量的样本企业的估计结果如下:其中括号中为系数估计值的标准差。(1)解释log(X1)的系数。如果X1增加10%,估计Y会变化多少个百分点?这在经济上是一个很大的影响吗?(2)针对R&D强度随销售额的增加而提高这一备择假设,检验它不虽X1而变化的假设。分别在5%和10%的显著性水平上进行这个检验。(3)利润占销售额的比重X2对R&D强度Y是否在统计上有显著的影响?解答:(1)log(x1)的系数表明在其他条件不变时,log(x1)变化1个单位,Y变化的单位数,即DY=0.32Dlog(X1)»0.32(DX1/X1)=0.32´100%,换言之,当企业销售X1增长100%时,企业研发支出占销售额的比重Y会增加0.32个百分点。由此,如果X1增加10%,Y会增加0.032个百分点。这在经济上不是一个较大的影响。(2)针对备择假设H1:,检验原假设H0:。易知计算的t统计量的值为t=0.32/0.22=1.468。在5%的显著性水平下,自由度为32-3=29的t 分布的临界值为1.699(单侧),计算的t值小于该临界值,所以不拒绝原假设。意味着R&D强度不随销售额的增加而变化。在10%的显著性水平下,t分布的临界值为1.311,计算的t 值小于该值,拒绝原假设,意味着R&D强度随销售额的增加而增加。(3)对X2,参数估计值的t统计值为0.05/0.46=1.087,它比在10%的显著性水平下的临界值还小,因此可以认为它对Y在统计上没有显著的影响。例3下表为有关经批准的私人住房单位及其决定因素的4个模型的估计量和相关统计值(括号内为p-值)(如果某项为空,则意味着模型中没有此变量)。数据为美国40个城市的数据。模型如下:式中housing实际颁发的建筑许可证数量,density每平方英里的人口密度,value自由房屋的均值(单位:百美元),income平均家庭的收入(单位:千美元),popchang19801992年的人口增长百分比,unemp失业率,localtax人均交纳的地方税,statetax人均缴纳的州税(1) 检验模型A中的每一个回归系数在10%水平下是否为零(括号中的值为双边备择p-值)。根据检验结果,你认为应该把变量保留在模型中还是去掉?(2) 在模型A中,在10%水平下检验联合假设H0:bi =0(i=1,5,6,7)。说明被择假设,计算检验统计值,说明其在零假设条件下的分布,拒绝或接受零假设的标准。说明你的结论。(3) 哪个模型是“最优的”?解释你的选择标准。(4) 说明最优模型中有哪些系数的符号是“错误的”。说明你的预期符号并解释原因。确认其是否为正确符号。解答:(1)直接给出了P-值,所以没有必要计算t-统计值以及查t分布表。根据题意,如果p-值<0.10,则我们拒绝参数为零的原假设。由于表中所有参数的p-值都超过了10%,所以没有系数是显著不为零的。但由此去掉所有解释变量,则会得到非常奇怪的结果。其实正如我们所知道的,多元回去归中在省略变量时一定要谨慎,要有所选择。本例中,value、income、popchang的p-值仅比0.1稍大一点,在略掉unemp、localtax、statetax的模型C中,这些变量的系数都是显著的。(2)针对联合假设H0:bi =0(i=1,5,6,7)的备择假设为H1:bi =0(i=1,5,6,7) 中至少有一个不为零。检验假设H0,实际上就是参数的约束性检验,非约束模型为模型A,约束模型为模型D,检验统计值为显然,在H0假设下,上述统计量满足F分布,在10%的显著性水平下,自由度为(4,32)的F分布的临界值位于2.09和2.14之间。显然,计算的F值小于临界值,我们不能拒绝H0,所以i(i=1,5,6,7)是联合不显著的。(3)模型D中的3个解释变量全部通过显著性检验。尽管R2与残差平方和较大,但相对来说其AIC值最低,所以我们选择该模型为最优的模型。(4)随着收入的增加,我们预期住房需要会随之增加。所以可以预期3>0,事实上其估计值确是大于零的。同样地,随着人口的增加,住房需求也会随之增加,所以我们预期4>0,事实其估计值也是如此。随着房屋价格的上升,我们预期对住房的需求人数减少,即我们预期3估计值的符号为负,回归结果与直觉相符。出乎预料的是,地方税与州税为不显著的。由于税收的增加将使可支配收入降低,所以我们预期住房的需求将下降。虽然模型A是这种情况,但它们的影响却非常微弱。4、在经典线性模型基本假定下,对含有三个自变量的多元回归模型:你想检验的虚拟假设是H0:。 (1)用的方差及其协方差求出。 (2)写出检验H0:的t统计量。 (3)如果定义,写出一个涉及b0、q、b2和b3的回归方程,以便能直接得到q估计值及其标准误。解答:(1)由数理统计学知识易知 (2)由数理统计学知识易知,其中为的标准差。 (3)由知,代入原模型得这就是所需的模型,其中q估计值及其标准误都能通过对该模型进行估计得到。3-2观察下列方程并判断其变量是否呈线性?系数是否呈线性?或都是?或都不是?1)2)3)4)5)6)7) 3-3多元线性回归模型与一元线性回归模型有哪些区别?3-4为什么说最小二乘估计量是最优的线性无偏估计量?多元线性回归最小二乘估计的正规方程组,能解出唯一的参数估计的条件是什么?3-5多元线性回归模型的基本假设是什么?试说明在证明最小二乘估计量的无偏性和有效性的过程中,哪些基本假设起了作用? 3-6请说明区间估计的含义。 3-7什么是正规方程组?分别用非矩阵形式和矩阵形式写出模型:,的正规方程组,及其推导过程。3-16考虑下列两个模型:、要求:(1)证明: , ,(2)证明:残差的最小二乘估计量相同,即:(3)在何种情况下,模型的拟合优度会小于模型拟合优度。 3-17假设要求你建立一个计量经济模型来说明在学校跑道上慢跑一英里或一英里以上的人数,以便决定是否修建第二条跑道以满足所有的锻炼者。你通过整个学年收集数据,得到两个可能的解释性方程:方程A: 方程B: 其中:某天慢跑者的人数 该天降雨的英寸数该天日照的小时数该天的最高温度(按华氏温度)第二天需交学期论文的班级数请回答下列问题:(1)这两个方程你认为哪个更合理些,为什么?(2)为什么用相同的数据去估计相同变量的系数得到不同的符号?3-18对下列模型: (1) (2)求出的最小二乘估计值;并将结果与下面的三变量回归方程的最小二乘估计值作比较:(3) ,你认为哪一个估计值更好?3-19假定以校园内食堂每天卖出的盒饭数量作为被解释变量,盒饭价格、气温、附近餐厅的盒饭价格、学校当日的学生数量(单位:千人)作为解释变量,进行回归分析;假设不管是否有假期,食堂都营业。不幸的是,食堂内的计算机被一次病毒侵犯,所有的存储丢失,无法恢复,你不能说出独立变量分别代表着哪一项!下面是回归结果(括号内为标准差): (2.6) (6.3) (0.61) (5.9) 要求:(1)试判定每项结果对应着哪一个变量?(2)对你的判定结论做出说明。 3-22下面给出依据15个观察值计算得到的数据: , , , , , , 其中小写字母代表了各值与其样本均值的离差。要求:(1)估计三个多元回归系数;(2)估计它们的标准差;并求出与?(3)估计、95%的置信区间;(4)在下,检验估计的每个回归系数的统计显著性(双边检验);(5)检验在下所有的部分系数都为零,并给出方差分析表。3-28考虑以下预测的回归方程: 其中:第t年的玉米产量(蒲式耳/亩)第t年的施肥强度(磅/亩)第t年的降雨量(英寸)要求回答下列问题:(1)从和对的影响方面,说出本方程中系数和的含义;(2)常数项是否意味着玉米的负产量可能存在?(3)假定的真实值为,则估计值是否有偏?为什么?(4)假定该方程并不满足所有的古典模型假设,即并不是最佳线性无偏估计值,则是否意味着的真实值绝对不等于?为什么? 3-29已知线性回归模型式中(0,),且(为样本容量,为参数的个数),由二次型的最小化得到如下线性方程组:要求:(1)把问题写成矩阵向量的形式;用求逆矩阵的方法求解之;(2)如果,求;(3)求出的方差协方差矩阵。习题答案3-2答:变量非线性、系数线性;变量、系数均线性;变量、系数均线性;变量线性、系数非线性;变量、系数均为非线性;变量、系数均为非线性;变量、系数均为线性。3-3答:多元线性回归模型与一元线性回归模型的区别表现在如下几方面:一是解释变量的个数不同;二是模型的经典假设不同,多元线性回归模型比一元线性回归模型多了“解释变量之间不存在线性相关关系”的假定;三是多元线性回归模型的参数估计式的表达更复杂;3-4在多元线性回归模型中,参数的最小二乘估计量具备线性、无偏性、最小方差性,同时多元线性回归模型满足经典假定,所以此时的最小二乘估计量是最优的线性无偏估计量,又称BLUE估计量。对于多元线性回归最小二乘估计的正规方程组,3-5答:多元线性回归模型的基本假定有:零均值假定、随机项独立同方差假定、解释变量的非随机性假定、解释变量之间不存在线性相关关系假定、随机误差项服从均值为0方差为的正态分布假定。在证明最小二乘估计量的无偏性中,利用了解释变量与随机误差项不相关的假定;在有效性的证明中,利用了随机项独立同方差假定。3-6答:区间估计是指研究用未知参数的点估计值(从一组样本观测值算得的)作为近似值的精确程度和误差范围。3-7答:含有待估关系估计量的方程组称为正规方程组。正规方程组的非矩阵形式如下:正规方程组的矩阵形式如下:3-16解:(1)证明:由参数估计公式可得下列参数估计值证明: 设:I式的拟合优度为:II式的拟合优度为:在中已经证得成立,即二式分子相同,若要模型II的拟合优度小于模型I的拟合优度,必须满足:。3-17答:方程B更合理些。原因是:方程B中的参数估计值的符号与现实更接近些,如与日照的小时数同向变化,天长则慢跑的人会多些;与第二天需交学期论文的班级数成反向变化,这一点在学校的跑道模型中是一个合理的解释变量。解释变量的系数表明该变量的单位变化在方程中其他解释变量不变的条件下对被解释变量的影响,在方程A和方程B中由于选择了不同的解释变量,如方程A选择的是“该天的最高温度”而方程B选择的是“第二天需交学期论文的班级数”,由此造成与这两个变量之间的关系不同,所以用相同的数据估计相同的变量得到不同的符号。3-18答:将模型改写成,则的估计值为:将模型改写成,则的估计值为:这两个模型都是三变量回归模型在某种限制条件下的变形。如果限制条件正确,则前两个回归参数会更有效;如果限制条件不正确则前两个回归参数会有偏。3-19答:答案并不唯一,猜测为:为学生数量,为附近餐厅的盒饭价格,为气温,为校园内食堂的盒饭价格; 理由是被解释变量应与学生数量成正比,并且应该影响显著;与本食堂盒饭价格成反比,这与需求理论相吻合;与附近餐厅的盒饭价格成正比,因为彼此是替代品;与气温的变化关系不是十分显著,因为大多数学生不会因为气温升高不吃饭。3-22解:其中:同理,可得:,拟合优度为: ,查表得,得到,得到,查表得临界值为则:所有的部分系数为0,即:,等价于方差来源平方和自由度平方和的均值来自回归65963.018232981.509来自残差79.2507126.6042总离差66042.269,临界值为3.89值是显著的,所以拒绝零假设。3-28解:在降雨量不变时,每亩增加一磅肥料将使第年的玉米产量增加0.1蒲式耳/亩;在每亩施肥量不变的情况下,每增加一英寸的降雨量将使第年的玉米产量增加5.33蒲式耳/亩;在种地的一年中不施肥、也不下雨的现象同时发生的可能性极小,所以玉米的负产量不可能存在;如果的真实值为0.40,并不能说明0.1是有偏的估计,理由是0.1是本题估计的参数,而0.40是从总体得到的系数的均值。不一定。即便该方程并不满足所有的古典模型假设、不是最佳线性无偏估计值,也有可能得出的估计系数等于5.33。3-29解:该方程组的矩阵向量形式为:的方差协方差矩阵为:专心-专注-专业