计量经济学第四版习题及参考答案解析具体版.docx
计量经济学第四版习题及参考答案解析具体版计量经济学第四版习题参考答案潘省初第一章绪论1.1试列出计量经济分析的主要步骤。一般讲来,计量经济分析根据下面步骤进行:1陈述理论或假讲2建立计量经济模型3采集数据4估计参数5假设检验6预测和政策分析1.2计量经济模型中为何要包括扰动项?为了使模型更现实,我们有必要在模型中引进扰动项u来代表所有影响因变量的其它因素,这些因素包括相对而言不重要因此未被引入模型的变量,以及纯粹的随机因素。1.3什么是时间序列和横截面数据?试举例讲明二者的区别。时间序列数据是按时间周期即按固定的时间间隔采集的数据,如年度或季度的国民生产总值、就业、货币供应、财政赤字或某人一生中每年的收入都是时间序列的例子。横截面数据是在同一时点采集的不同个体如个人、公司、国家等的数据。如人口普查数据、世界各国2000年国民生产总值、全班学生计量经济学成绩等都是横截面数据的例子。1.4估计量和估计值有何区别?估计量是指一个公式或方法,它告诉人们如何用手中样本所提供的信息去估计总体参数。在一项应用中,根据估计量算出的一个详细的数值,称为估计值。如Y就是一个估计量,1niiYYn=。现有一样本,共4个数,100,104,96,130,则根据这个样本的数据运用均值估计量得出的均值估计值为5.107413096104100=+。第二章计量经济分析的统计学基础2.1略,参考教材。2.2请用例2.2中的数据求北京男生平均身高的99置信区间NSSx=45=1.25用=0.05,N-1=15个自由度查表得005.0t=2.947,故99%置信限为xStX005.0±=174±2.947×1.25=174±3.684也就是讲,根据样本,我们有99%的把握讲,北京男高中生的平均身高在170.316至177.684厘米之间。2.325个雇员的随机样本的平均周薪为130元,试问此样本能否取自一个均值为120元、标准差为10元的正态总体?原假设120:0=H备择假设120:1H检验统计量 ()10/25XX-Z=查表96.1025.0=Z由于Z=5>96.1025.0=Z,故拒绝原假设,即此样本不是取自一个均值为120元、标准差为10元的正态总体。2.4某月对零售商店的调查结果表明,市郊食品店的月平均销售额为2500元,在下一个月份中,取出16个这种食品店的一个样本,其月平均销售额为2600元,销售额的标准差为480元。试问能否得出结论,从上次调查以来,平均月销售额已经发生了变化?原假设:2500:0=H备择假设:2500:1H()100/1200.83?XXt-=查表得131.2)116(025.0=-t由于t=0.833.3证实:1Y的真实值与OLS拟合值有共同的均值,即YnYnY=?;2OLS残差与拟合值不相关,即0?=tteY。1,得两边除以,n?0?)?(?=+=?+=?+=ttttttttttttYYeeYYeYYeYYYnYnY=?,即Y的真实值和拟合值有共同的均值。2的拟合值与残差无关。,即因而,教材中已证实,由于Y0?),?(0?0,0e?)?(?22t=+=+=ttttttttttttttttteYeYeYCoveYeXeXeeXeY3.4证实本章中3.18和3.19两式:1=222)?(ttxnXVar2-=22)?,?(txXCov1222222222221112222222?,?()?2u()()?()2()()()()?2()()?2()iitttinnntiijiiijijijijtYXYXuuXuXXuuxuXXnnxuuuxuxuXXnnxuuuxuxxuuXnnx=+=+-=-=-+-=-?+-+=-?+-+=-?+-2X2222222222222222()?2E()1()2()()2iijiiijijijijtiijijiijijiiijijijtuuuxuxxuuEEXEXnnxuuuEEuEuunnnnxuxxuuXEnx?+?-=-?+?=+=?+两边取期望值,有:等式右端三项分别推导如下:22222222222222222222212()()()200?E()()?0iiiijijiijttttttttxXxEuxxEuuXxnxnxXXxxnXXXEnxnxnx?=+=-=+-=-+=因而=222)?(ttxnXVar即22222?,?()?(,)()()()?()()?0()01?()tYXYXuuXCovEEuXEuXEXEXVarXx=+=+-=-=-=-=-=-=-=-第一项为的证实见此题3.5考虑下列双变量模型:模型1:iiiuXY+=21模型2:iiiuXXY+-+=)(2111和1的OLS估计量一样吗?它们的方差相等吗?22和2的OLS估计量一样吗?它们的方差相等吗?1XY21?-=,注意到nxnxxxnxVarxnXVarYxYxxXXxiiiiiiiii22222221222121)()?()?(?,0,0,=-=-=-=则我们有进而由上述结果,能够看到,无论是两个截距的估计量还是它们的方差都不一样。2=-=222222222)?()?()()(?,?iiiiiiiiiixVarVarxyxxxYYxxxyx容易验证,这表明,两个斜率的估计量和方差都一样。3.6有人使用19801994年度数据,研究汇率和相对价格的关系,得到如下结果:)333.1()22.1(:528.0318.4682.6?2SeRXYtt=-=其中,Y马克对美元的汇率X美、德两国消费者价格指数CPI之比,代表两国的相对价格1请解释回归系数的含义;2Xt的系数为负值有经济意义吗?3假如我们重新定义X为德国CPI与美国CPI之比,X的符号会变化吗?为什么?1斜率的值4.318表明,在19801994期间,相对价格每上升一个单位,GM/$汇率下降约4.32个单位。也就是讲,美元贬值。截距项6.682的含义是,假如相对价格为0,1美元可兑换6.682马克。当然,这一解释没有经济意义。2斜率系数为负符合经济理论和常识,由于假如美国价格上升快于德国,则美国消费者将倾向于买德国货,这就增大了对马克的需求,导致马克的升值。3在这种情况下,斜率系数被预期为正数,由于,德国CPI相对于美国CPI越高,德国相对的通货膨胀就越高,这将导致美元对马克升值。3.7随机调查200位男性的身高和体重,并用体重对身高进行回归,结果如下:)31.0()15.2(:81.031.126.76?2SeRHeighteightW=+-=其中Weight的单位是磅lb,Height的单位是厘米cm。1当身高分别为177.67cm、164.98cm、187.82cm时,对应的体重的拟合值为多少?2假设在一年中某人身高增高了3.81cm,此人体重增加了多少?178.16982.187*31.126.76?86.13998.164*31.126.76?49.15667.177*31.126.76?=+-=+-=+-=eightWeightWeightW299.481.3*31.1*31.1?=?=?heighteightW3.8设有10名工人的数据如下:X1071058867910Y11101261079101110其中X=劳动工时,Y=产量1试估计Y=+X+u要求列出计算表格;2提供回归结果按标准格式并适当讲明;3检验原假设=1.0。(1)6.910/96=nYYt810/80=nXXt75.028/21?2=tttxyx6.38*75.06.9*?=-=-=XY估计方程为:ttXY75.06.3?+=2222?(2)()(2)(30.40.75*21)/81.83125ttttenyxyn=-=-=-=934.2?)?(/?2=txSet733.1?)?(/?22=ttxnXSet518.0)4.30*28/21()(22222=ttttyxyxR回归结果为括号中数字为t值:ttXY75.06.3?+=R2=0.518(1.73)(2.93)讲明:Xt的系数符号为正,符合理论预期,0.75表明劳动工时增加一个单位,产量增加0.75个单位,拟合情况。R2为0.518,作为横截面数据,拟合情况还能够.系数的显著性。斜率系数的t值为2.93,表明该系数显著异于0,即Xt对Yt有影响.(3)原假设:0.1:0=H备择假设:0.1:1H检验统计量?(1.0)/()(0.751.0)/0.25560.978tSe=-=-=-查t表,0.025(8)2.306ctt=,由于t=0.9782352350.29=±=±即234.71235.29。也就是讲,我们有95%的把握预测0y将位于234.71至235.29之间.3.10设有某变量Y和变量X19951999年的数据如下: (1)试用OLS法估计Yt=+Xt+ut要求列出计算表格;(2)22?R求和;(3)试预测X0=10时Y0的值,并求Y0的95%置信区间。1列表计算如下:35/15=nYYt115/55=XXt365.074/27?2=tttxyx015.111*365.03*?-=-=-=XY我们有:ttXY365.0015.1?+-=(2)048.03/)27*365.010()2()?()2222=-=-=-=nyxynetttt985.0)10*74/27()(22222=ttttyxyxR(3)对于0X=10,点预测值0?Y=-1.015+0.365*10=2.6350Y的95%置信区间为:-+-±220025.00)(/11?*)25(?xXXntY=770.0635.274/)1110(5/11*048.0*182.3635.22±=-+±即1.8953.099,也就是讲,我们有95%的把握预测0Y将位于1.865至3.405之间.3.11根据上题的数据及回归结果,现有一对新观测值X020,Y07.62,试问它们能否可能来自产生样本数据的同一总体?问题可化为“预测误差能否显著地大?当X0=20时,285.620365.0015.1?0=?+-=Y预测误差335.1285.662.7?000=-=-=YYe原假设0H:0)(0=eE备择假设1H:0)(0eE检验:若0H为真,则021.4332.0335.174)1120(511048.00335.1)(11?)(222000=-+-=-+-=xXXneEet对于5-2=3个自由度,查表得5%显著性水平检验的t临界值为:182.3=ct结论:由于4.0213.182t=>故拒绝原假设0H,接受备则假设H1,即新观测值与样本观测值来自不同的总体。3.12有人估计消费函数iiiCYu=+,得到如下结果括号中数字为t值:iC?15+0.81iY2R0.982.76.5n=191检验原假设:0取显著性水平为52计算参数估计值的标准误差;3求的95置信区间,这个区间包括0吗?1原假设0:0=H备择假设0:1H检验统计量5.6)?()0?(=-=Set查t表,在5%显著水平下11.2)1119(025.0=-t,由于t=6.5>2.11故拒绝原假设,即0,讲明收入对消费有显著的影响。2由回归结果,立即可得:556.57.215)?(=Se125.05.681.0)?(=Se3的95置信区间为:。括所以在这个区间中不包之间在的把握讲也就是讲有即为0,074.1546.095,074.1546.0264.081.0125.0*11.281.0)?(?2±=±=±Set3.13回归之前先对数据进行处理。把名义数据转换为实际数据,公式如下:人均消费CC/P*100(价格指数)人均可支配收入YYr*rpop/100+Yu*(1-rpop/100)/P*100农村人均消费CrCr/Pr*100城镇人均消费CuCu/Pu*100农村人均纯收入YrYr/Pr*100城镇人均可支配收入YuYu/Pu*100处理好的数据如下表所示:根据表中的数据用软件回归结果如下:tC=90.93+0.692tYR2=0.997t:(11.45)(74.82)DW=1.15农村:tCr=106.41+0.60tYrR2=0.979t:(8.82)(28.42)DW=0.76城镇:tCu=106.41+0.71tYuR2=0.998t:(13.74)(91.06)DW=2.02从回归结果来看,三个方程的R2都很高,讲明人均可支配收入较好地解释了人均消费支出。三个消费模型中,可支配收入对人均消费的影响均是显著的,并且都大于0小于1,符合经济理论。而斜率系数最大的是城镇的斜率系数,其次是全国平均的斜率,最小的是农村的斜率。讲明城镇居民的边际消费倾向高于农村居民。第四章多元线性回归模型4.1应采用1,由于由2和3的回归结果可知,除X1外,其余解释变量的系数均不显著。检验经过略4.2(1)斜率系数含义如下:0.273:年净收益的土地投入弹性,即土地投入每上升1%,资金投入不变的情况下,引起年净收益上升0.273%.0.733:年净收益的资金投入弹性,即资金投入每上升1%,土地投入不变的情况下,引起年净收益上升0.733%.拟合情况:92.0129)94.01(*811)1)(1(122=-=-=knRnR,表明模型拟合程度较高.(2)原假设0:0=H备择假设0:1H检验统计量022.2135.0/273.0)?(?=Set查表,447.2)6(025.0=t由于t=2.022)6(025.0t,故拒绝原假设,即显著异于0,表明资金投入变动对年净收益变动有显著的影响.3原假设0:0=H备择假设1H:原假设不成立检验统计量47)129/()94.01(2/94.0)1/()1(/22=-=-=knRkRF查表,在5%显著水平下14.5)6,2(=F由于F=47>5.14,故拒绝原假设。结论,:土地投入和资金投入变动作为一个整体对年净收益变动有影响.4.3检验两个时期能否有显著构造变化,可分别检验方程中D和D?X的系数能否显著异于0.(1)原假设0:20=H备择假设0:21H检验统计量155.34704.0/4839.1)?(?22=Set查表145.2)418(025.0=-t由于t=3.155>)14(025.0t,故拒绝原假设,即2显著异于0。(2)原假设0:40=H备择假设0:41H检验统计量115.30332.0/1034.0)?(?44-=-=Set查表145.2)418(025.0=-t由于|t|=3.155>)14(025.0t,故拒绝原假设,即4显著异于0。结论:两个时期有显著的构造性变化。4.41,模型可线性化。参数线性,变量非线性则模型转换为设,1,1221xzxz=uzzy+=221102变量、参数皆非线性,无法将模型转化为线性模型。3变量、参数皆非线性,但可转化为线性模型。取倒数得:)(1011uxey+-+=把1移到左边,取对数为:uxyy+=-101ln,令则有,1lnyyz-=uxz+=104.51截距项为-58.9,在此没有什么意义。X1的系数表明在其它条件不变时,个人年消费量增加1百万美元,某国对进口的需求平均增加20万美元。X2的系数表明在其它条件不变时,进口商品与国内商品的比价增加1单位,某国对进口的需求平均减少10万美元。2Y的总变差中被回归方程解释的部分为96%,未被回归方程解释的部分为4%。3检验全部斜率系数均为0的原假设。)1/(/)1/()1(/22-=-=knRSSkESSknRkRF=19216/04.02/96.0=由于F192>F0.05(2,16)=3.63,故拒绝原假设,回归方程很好地解释了应变量Y。4A.原假设H0:1=0备择假设H1:1011?0.221.74?0.0092()tS=>t0.025(16)=2.12,故拒绝原假设,1显著异于零,讲明个人消费支出X1对进口需求有解释作用,这个变量应该留在模型中。B.原假设H0:2=0备择假设H1:2022?0.11.19?0.084()tS-=FC,则拒绝原假设H0,接受备择假设H1。4.1012个,111200DD?=?大型企业中型企业其他其他24个,111112340000DDDD?=?小学初中大学高中其他其他其他其他4.110123(),019791,1979ttttyDxDxuDtDt=+?+=>其中4.12对数据处理如下:lngdplngdp/plnk=lnk/plnL=lnL/P对模型两边取对数,则有lnYlnAlnKlnLlnv用途理后的数据回归,结果如下:lkdpgln18.0ln96.026.0?ln+-=97.02=Rt:(0.95)(16.46)(3.13)由修正决定系数可知,方程的拟合程度很高;资本和劳动力的斜率系数均显著tc=2.048,资本投入增加1,gdp增加0.96%,劳动投入增加1,gdp增加0.18%,产出的资本弹性是产出的劳动弹性的5.33倍。第五章模型的建立与估计中的问题及对策5.11对2对3错即便解释变量两两之间的相关系数都低,也不能排除存在多重共线性的可能性。4对5错在扰动项自相关的情况下OLS估计量仍为无偏估计量,但不再具有最小方差的性质,即不是BLUE。6对7错模型中包括无关的解释变量,参数估计量仍无偏,但会增大估计量的方差,即增大误差。8错。在多重共线性的情况下,尽管全部“斜率系数各自经t检验都不显著,R2值仍可能高。9错。存在异方差的情况下,OLS法通常会高估系数估计量的标准误差,但不总是。10错。异方差性是关于扰动项的方差,而不是关于解释变量的方差。5.2对模型两边取对数,有lnYt=lnY+t*ln(1+r)+lnut,令LYlnYt,alnY,bln(1+r),vlnut,模型线性化为:LYabtv估计出b之后,就能够求出样本期内的年均增长率r了。5.31DW=0.81,查表n=21,k=3,=5%得dL=1.026。DW=0.811.026结论:存在正自相关。2DW=2.25,则DW=42.25=1.75查表n=15,k=2,=5%得du=1.543。1.543DW=1.752结论:无自相关。3DW=1.56,查表n=30,k=5,=5%得dL=1.071,du=1.833。1.071DW=1.561.833结论:无法判定能否存在自相关。5.4(1)横截面数据.(2)不能采用OLS法进行估计,由于各个县经济实力差距大,可能存在异方差性。(3)GLS法或WLS法。5.51可能存在多重共线性。由于X3的系数符号不符合实际.R2很高,但解释变量的t值低:t2=0.9415/0.8229=1.144,t3=0.0424/0.0807=0.525.解决方法:可考虑增加观测值或去掉解释变量X3.2DW=0.8252,查表(n=16,k=1,=5%)得dL=1.106.DW=0.8252Fc1.97,故拒绝原假设原假设H0:2321=。结论:存在异方差性。5.12将模型变换为:)2()()1(221112102211tttttttXXXYYY+-+-=-若1、2为已知,则可直接估计2式。一般情况下,1、2为未知,因而需要先估计它们。首先用OLS法估计原模型(1)式,得到残差et,然后估计:tttteee+=-2211其中t为误差项。用得到的1和2的估计值1?和2?生成2211?-*-=ttttYYYY2211?-*-=ttttXXXX令)1(210-=,用OLS法估计tttXY+=*1即可得到?和1?,进而得到原模型1的系数估计值0?和1?。5.131全国居民人均消费支出方程:tC=90.93+0.692tYR2=0.997t:(11.45)(74.82)DW=1.15DW=1.15,查表n=19,k=1,=5%得dL=1.18。DW=1.151.18结论:存在正自相关。可对原模型进行如下变换:Ct-Ct-1=(1-)+(Yt-Yt-1)+ut-ut-1由?1/20.425DW-有令:C't=Ct0.425Ct-1,Y't=Yt-0.425Yt-1,=0.575然后估计C't='+Y't+t,结果如下:'tC=55.57+0.688'tYR2=0.994t:(11.45)(74.82)DW=1.97DW=1.97,查表n=19,k=1,=5%得du=1.401。DW=1.97>1.18,故模型已不存在自相关。2农村居民人均消费支出模型:农村:tCr=106.41+0.60tYrR2=0.979t:(8.82)(28.42)DW=0.76DW=0.76,查表n=19,k=1,=5%得dL=1.18。DW=0.761.18,故存在自相关。解决方法与1同,略。3城镇:tCu=106.41+0.71tYuR2=0.998t:(13.74)(91.06)DW=2.02DW=2.02,非常接近2,无自相关。5.141用表中的数据回归,得到如下结果:Y?=54.19+0.061X1+1.98*X2+0.03X3-0.06X4R20.91t:(1.41)(1.58)(3.81)(1.14)(-1.78)根据tc(=0.05,n-k-1=26)=2.056,只要X2的系数显著。2理论上看,有效灌溉面积、农作物总播种面积是农业总产值的重要正向影响因素。在一定范围内,随着有效灌溉面积、播种面积的增加,农业总产值会相应增加。受灾面积与农业总产值呈反向关系,也应有一定的影响。而从模型看,这些因素都没显著影响。这是为什么呢?这是由于变量有效灌溉面积、施肥量与播种面积间有较强的相关性,所以方程存在多重共线性。如今我们看看各解释变量间的相关性,相关系数矩阵如下:X1X2X3X4X1X2X3X4表中r120.896,r130.895,讲明施肥量与有效灌溉面积和播种面积间高度相关。我们能够通过对变量X2的变换来消除多重共线性。令X22X2/X3公斤/亩,这样就大大降低了施肥量与面积之间的相关性,用变量X22代替X2,对模型重新回归,结果如下:Y?=233.62+0.088X1+13.66*X2+0.096X3-0.099X4R20.91t:(-3.10)(2.48)(3.91)(4.77)(-3.19)10.8960.8800.7150.89610.8950.6850.8800.89510.8830.7150.6850.8831从回归结果的t值能够看出,如今各个变量都已通过显著性检验,讲明多重共线性问题基本得到解决。