计量经济学课程设计evlg.docx
目录1、 续论11.1、中国汽车业简介 11.2、课题的意义 12、 影响中国汽车产量的要素及模型的建立2 2.1、影响中国汽车产量的要素 22.2、模型的建立 23、 回归模型的检验和修正53.1、经济学意义检验及显著性检验 53.2、多重共线性 73.3、异方差性173.4、序列相关性203.5、滞后变量模型213.6、模型的检验与预测244、 结论 265、 参考文献 271.绪论1.1中国汽车业简介 汽车产业是资本、技术密集型产业,又是劳动密集型产业,具有很大的前后关联度和很强的波及效果。对于国民经济有很强的带动作用。 中国汽车产业在中国经济的发展中起着越来越重要的作用。据机械部预测,汽车工业正以每年14的速度增长,仅次于电子工业15的增长率而远远高于其它产业。1997年,汽车税收达200亿元,占全国税收总额的5.0。在国家支柱工业中名列第二。同时,可解决7.5的就业人数。 汽车工业反映了制造业的整体技术水平。中国汽车产业关联度与发达国家相比差距较大。 美国的汽车制造、经销与零部件领域直接提供200万人的工作岗位,并使1300万人以上的人们工作于相关产业中, 美国汽车工业提供了17的工作岗位。中国汽车产业在中国影响系数较大的前10个部门中位居第二,中国汽车工业对其它产业发展的带动作用很强,高于全国平均水平22.8。 中国汽车产业可以粗略地分为两大体系:“纯粹”的中国汽车产业和在华的国际汽车集团。中国汽车产业主要具备以下几方面的优势: 1.中国将成为21世纪最大的汽车消费国。2.建立了一个比较完整的汽车工业体系,部分产品已达到90年代的国际水平。3.桑塔纳、捷达、奥迪、别克零部件的国产化率已达到相当的程度,显示出后发优势的作用。4.劳动力成本低是中国在国际竞争中的比较优势。中国汽车工业的劣势有下列几个方面:1.技术至少落后10年以上。按技术来源可分为四类:全部引进;测绘仿制;基本仿制和部分引进;参照国外车型自行设计。引进技术产品达到80年代水平的占30;进行开发的换代产品达到80年代水平的占30;技术落后的占402。2.开发能力差。还不具备独立的开发能力。3.产品结构不合理。早期以发展中型载重汽车为主,“缺重少轻,轿车几乎空白”,到目前轿车缺口依然很大。4.规模经济效益低。全部产量不及通用公司的五分之一。5.零部件工业发展滞后,发动机和电子件最为薄弱。1.2课题的意义 我国正处于全面建设小康社会的重要战略机遇期,大力发展汽车产业,全面推进国民经济各部门持续健康发展,使我们当前面临的重大任务 。因此通过建立计量经济学模型,研究汽车产量和相关因素的依存度,对于调整产业结构,促进国民经济快速健康发展具有重要的战略意义。2影响中国汽车产量的要素及模型的建立2.1影响中国汽车产量的要素为了应对入世后更为激烈的市场竞争,在更高层次上发展我国的民族汽车产业,切实把握我国汽车产量的影响因素是当务之急。而影响到汽车产量的因素是多方面的。主要包括包括成品钢产量、石油消费总量、铁路运输量、私人汽车拥有量、公路运输线路长度等因素的影响。2.2模型的建立 根据统计数据建立中国汽车产量的模型,影响汽车产量的要素包括成品钢产量、石油消费总量、铁路运输量、私人汽车拥有量、公路运输线路长度。因此建立以下模型: 其中Y是汽车总产量(万辆) 是成品钢产量(万吨) 是公路运输线路长度(万公里) 是石油消费总量(万吨) 是私人汽车拥有量(万辆) 是铁路总运量(万吨)是常数项,(i=1、2、3、4、5)是待估参数,u是随机干扰项。具体数据如下表1:年份YX1X2X3X4X5199051.46635102.8316384.69881.62150681199171.427100104.1117746.89396.041528931992106.678094105.6719104.75118.041576271993129.858956108.3521110.726155.271627941994136.699261111.7821356.238205.421632161995145.279535.99115.722955.8249.961659821996147.5210124.06118.5825280.904289.671710241997158.2510894.17122.6427725.436358.36172149199816311559127.8528326.272423.651643091999183.212426135.1730222.335533.88167554200020712850140.2732307.882625.331785812001234.1715163.44169.832788.508770.781931892002325.118236.61176.5235553.113968.982049562003444.3922233.6180.9838963.9041219.232242482004509.1128291.09187.0745466.1281481.662490172005570.4935323.98334.5246727.4061848.072692962006727.8941914.85345.699949924.4682333.322882242007888.8948928.8358.371552735.5042876.223142372008930.5950305.75373.016453334.9843501.3933035420091379.5357218.23386.082354889.8134574.91333348通过Eviews得到上述数据的散点图如下图:应用计量经济学Eviews软件,对数据进行最小二乘估计得到模型的回归结果如下表2:Dependent Variable: YMethod: Least SquaresDate: 06/08/11 Time: 14:04Sample: 1990 2009Included observations: 20VariableCoefficientStd. Errort-StatisticProb. X10.0183400.0081452.2515660.0409X2-0.9838550.432036-2.2772540.0390X30.0004260.0023210.1833850.8571X40.2033930.0413504.9188110.0002X5-0.0017460.001458-1.1976860.2509C295.5612170.67951.7316740.1053R-squared0.993428 Mean dependent var375.5215Adjusted R-squared0.991081 S.D. dependent var358.1339S.E. of regression33.82194 Akaike info criterion10.12342Sum squared resid16014.93 Schwarz criterion10.42214Log likelihood-95.23421 F-statistic423.2665Durbin-Watson stat1.767760 Prob(F-statistic)0.000000根据Eviews结果得到估计模型结果如下: (1.731674) (2.251566)(-2.277254) (0.183358) (4.918811) (-1.198676)=0.991081 =0.993428 F-statistic=423.226 D-W=1.767760在利用最小二乘估计进行多元函数回归时,需要满足以下假设条件:(1) 回归模型是正确设定的。(2) 解释变量、.是非随机变量的或是固定的,且各之间不存在严格的线性相关性(无完全多重共线性)。(3) 各解释变量在所抽取的样本中具有变异性,而且随着样本容量的无限增加,各解释变量的样本方差趋于一个非零的常数,即n+时, (4)随机误差项具有条件零均值、同方差及不序列相关性 ij3回归模型的检验和修正3.1经济学意义检验及显著性检验 根据参数估计量的符号以及参数估计量大小的检验,在经济意义上是合理的。即由于成品钢产量、石油消费总量、私人汽车拥有量的系数为正,而公路运输线路长度、铁路运输量的系数为负,所以汽车生产总量随着成品钢产量、石油消费总量、私人汽车拥有量的增加而增长,成正比例关系,随公路运输线路长度、铁路运输量的增加而减少。3.1.1拟合优度检验 在经济学中用可决系数来检验模型的拟合优度,完全拟合情况为,则可决系数越接近1,模型的拟合优度越好。在上节中用Eviews软件得到模型的可决系数=0.993428,说明模型你过得拟合优度很好。3.1.2对回归系数进行T检验 对进行检验:提出原假设:;备择假设:.T=2.251566假定显著水平,查t 分布表中自由度为14(n-k-1=20-5-1=14;n为选取数据组数,k为变量的个数),的临界值,得到1.761。显然,T=2.251566>1.761,故拒绝原假设,接受备择假设.,即是显著的。 对进行检验:提出原假设:;备择假设:。T=-2.277254假定显著水平,查t 分布表中自由度为14(n-k-1=20-5-1=14;n为选取数据组数,k为变量的个数),的临界值,得到1.761。显然T=-2.277254<1.761,故接受原假设,拒绝备择假设,即不显著。 对进行检验:提出原假设:;备择假设:。T=0.183385假定显著水平,查t 分布表中自由度为14(n-k-1=20-5-1=14;n为选取数据组数,k为变量的个数),的临界值,得到1.761。T=0.183385<1.761,故接受原假设,拒绝备择假设,即不显著。 对进行检验:提出原假设:;备择假设:。T=4.918811假定显著水平,查t 分布表中自由度为14(n-k-1=20-5-1=14;n为选取数据组数,k为变量的个数),的临界值,得到1.761。显然,T=4.918811>1.761,故拒绝原假设,接受备择假设.,即是显著的。 对进行检验:提出原假设:;备择假设:。T=-1.197686假定显著水平,查t 分布表中自由度为14(n-k-1=20-5-1=14;n为选取数据组数,k为变量的个数),的临界值,得到1.761。T=-1.197686<1.761,故接受原假设,拒绝备择假设,即不显著。3.1.3对方程进行F检验根据Eviews表得到F-statistic=423.226在假定显著水平,查自由度为5和自由度为14的F分布表,得临界值<423.226,则说明模型的线性关系在95%置信水平下显著成立。3.2多重共线性检验3.2.1实际经济问题中的多重共线性问题(1) 计量经济学中检验多重共线性的方法 相关系数检验法 辅助回归模型检验 方差膨胀因子检验 特征值检验 根据回归结果判断(2) 产生多重共线性的原因 经济变量相关的共同趋势 滞后变量的引入 样本资料的限制(3) 多重共线性的后果 完全共线性下参数估计量不存在 近似共线性下普通最小二乘法参数估计量方差变大 参数估计量经济意义不合理 变量的显著性检验和模型的预测功能失去意义下面用相关系数检验法检验解释变量的多重共线性,经过软件运算得到变量之间的相关系数为下表3:X1X2X3X4X5X1 1.000000 0.981308 0.951282 0.983753 0.994427X2 0.981308 1.000000 0.935470 0.950857 0.976841X3 0.951282 0.935470 1.000000 0.920248 0.963293X4 0.983753 0.950857 0.920248 1.000000 0.970610X5 0.994427 0.976841 0.963293 0.970610 1.000000由上表得:变量之间的相关系数均在0.92以上,这说明变量之间存在着高度的多重共线性,即成品钢产量、石油消费总量、铁路运输量、私人汽车拥有量、公路运输线路长度存在比较严重的多重共线性。3.2.2多重共线性的消除多重共线性的消除方法:a. 保留重要的解释变量,去掉次要的或可替代的解释变量b. 利用先验信息改变参数的约束形式c. 增加样本容量d. 逐步回归法e. 主成分回归法3.2.3 用逐步回归法进行修正 逐步回归法的步骤如下: 利用相关系数从所有解释变量中选取相关性最强的变量建立一元回归模型。 在一元回归模型中分别引入第二变量,共建立k-1个二元线性回归模型(设有k个解释是变量),从这些模型中再选取一个较优的模型,选取时要求每个解释变量影响显著,参数符号正确,的值有所提高。 在选取的二元回归模型中以同样的方法引入第三变量,如此进行下去,直至不能引入新变量为止。在引入新的解释变量的回归方程中:a. 如果新引入的变量在符合经济意义的前提下,能使拟合优度有所提高,并每个参数统计检验显著,则可以采纳该解释变量。b. 如果新引入的变量不能使拟合优度提高,同时对其他参数没有影响,则可舍去该变量。c. 如果新引入的变量能是拟合度有所提高,但是对其他参数的符号和数值有明显影响,统计检验也不显著。可以断定新的解释变量引起了共线。按照前面叙述的检验方法,考察变量之间的线性相关形式和程度,并进行经济意义的判断,在共线性最高的两个变量中,舍去对被解释变量影响较小,经济意义相对次要的一个,保留影响较大,相对重要的一个,但不要轻易的舍去新引入的变量,否则会造成模型的设定偏误和随机干扰项与解释变量相关。由于的多重共线性的存在,对模型进行修正采用,逐步回归法 。 首先对汽车总产量Y与成品钢产量进行回归分析,结果如下图4所示:Dependent Variable: YMethod: Least SquaresDate: 06/08/11 Time: 19:32Sample: 1990 2009Included observations: 20VariableCoefficientStd. Errort-StatisticProb. X10.0214160.00098521.735070.0000C-79.6283926.21020-3.0380680.0071R-squared0.963296 Mean dependent var375.5215Adjusted R-squared0.961257 S.D. dependent var358.1339S.E. of regression70.49220 Akaike info criterion11.44352Sum squared resid89444.70 Schwarz criterion11.54309Log likelihood-112.4352 F-statistic472.4133Durbin-Watson stat1.188466 Prob(F-statistic)0.000000根据Eviews表的结果得到一元回归模型: (-3.038068) (21.73507) =0.961257 F-tistics=472.413 D-W=1.188466然后对汽车总产量Y与公路运输线路长度进行回归分析,结构如下表5:Dependent Variable: YMethod: Least SquaresDate: 06/08/11 Time: 20:04Sample: 1990 2009Included observations: 20VariableCoefficientStd. Errort-StatisticProb. X23.2432660.27298811.880600.0000C-241.511458.84712-4.1040480.0007R-squared0.886898 Mean dependent var375.5215Adjusted R-squared0.880615 S.D. dependent var358.1339S.E. of regression123.7430 Akaike info criterion12.56893Sum squared resid275622.1 Schwarz criterion12.66850Log likelihood-123.6893 F-statistic141.1486Durbin-Watson stat1.423358 Prob(F-statistic)0.000000由表可得到回归模型: (-4.104048) (11.88060) =0.8806615 F-tistics=141.1486 D-W=1.4233358然后对汽车总产量Y与石油消费总量进行回归分析,结构如下表6:Dependent Variable: YMethod: Least SquaresDate: 06/08/11 Time: 20:21Sample: 1990 2009Included observations: 20VariableCoefficientStd. Errort-StatisticProb. X30.0255580.0026049.8152800.0000C-484.395393.49423-5.1810180.0001R-squared0.842574 Mean dependent var375.5215Adjusted R-squared0.833829 S.D. dependent var358.1339S.E. of regression145.9902 Akaike info criterion12.89960Sum squared resid383636.3 Schwarz criterion12.99917Log likelihood-126.9960 F-statistic96.33972Durbin-Watson stat0.532817 Prob(F-statistic)0.000000由表可得到回归模型:(-5.81018) (9.815280)=0.833829 =0.842574 F-tistics=96.3397 D-W=0.532817然后对汽车总产量Y与私人汽车拥有量进行回归分析,结构如下表7:Dependent Variable: YMethod: Least SquaresDate: 06/08/11 Time: 20:32Sample: 1990 2009Included observations: 20VariableCoefficientStd. Errort-StatisticProb. X40.2791480.00649143.003060.0000C58.5239410.935885.3515530.0000R-squared0.990360 Mean dependent var375.5215Adjusted R-squared0.989825 S.D. dependent var358.1339S.E. of regression36.12596 Akaike info criterion10.10654Sum squared resid23491.54 Schwarz criterion10.20611Log likelihood-99.06540 F-statistic1849.263Durbin-Watson stat2.039368 Prob(F-statistic)0.000000由表可得到回归模型: (5.351558) (43.00306)=0.989825 =0.990360 F-tistics=1849.263 D-W=2.039368这表明两者之间相关性较强,拟合优度较大,从而保留。然后对汽车总产量Y与铁路总运量进行回归分析,结构如下表8:Dependent Variable: YMethod: Least SquaresDate: 06/08/11 Time: 20:41Sample: 1990 2009Included observations: 20VariableCoefficientStd. Errort-StatisticProb. X50.0054780.00034016.104050.0000C-778.662674.67255-10.427690.0000R-squared0.935098 Mean dependent var375.5215Adjusted R-squared0.931492 S.D. dependent var358.1339S.E. of regression93.73798 Akaike info criterion12.01352Sum squared resid158162.6 Schwarz criterion12.11310Log likelihood-118.1352 F-statistic259.3404Durbin-Watson stat1.316364 Prob(F-statistic)0.000000由表可得到回归模型: (-10.42769) (16.10405)=0.931492 =0.935098 F-tistics=259.3404 D-W=1.316364则对于变量的解释能力依次是: 将这五个一元回归模型进行比较,Y与的较大,所以将作为基本变量引入,将Y与进行回归分析。得下图9:Dependent Variable: YMethod: Least SquaresDate: 06/08/11 Time: 21:00Sample: 1990 2009Included observations: 20VariableCoefficientStd. Errort-StatisticProb. X10.0016760.0028660.5850200.5662X40.2579470.0368387.0022220.0000C46.9704522.674832.0714790.0538R-squared0.990550 Mean dependent var375.5215Adjusted R-squared0.989439 S.D. dependent var358.1339S.E. of regression36.80468 Akaike info criterion10.18661Sum squared resid23027.93 Schwarz criterion10.33597Log likelihood-98.86608 F-statistic891.0149Durbin-Watson stat2.113415 Prob(F-statistic)0.000000由表可得到回归模型:(2.071479) (0.585020) (7.002222)=0.989493 =0.990550 F-tistics=891.0149 D-W=2.113415引入,尽管拟合度有所提高,但是的参数未能通过T检验,故将舍去。将Y与进行回归分析。得下图10:Dependent Variable: YMethod: Least SquaresDate: 06/08/11 Time: 21:45Sample: 1990 2009Included observations: 20VariableCoefficientStd. Errort-StatisticProb. X50.0001060.0005600.1893110.8521X40.2740530.0277269.8842290.0000C41.9748488.137390.4762430.6400R-squared0.990381 Mean dependent var375.5215Adjusted R-squared0.989249 S.D. dependent var358.1339S.E. of regression37.13419 Akaike info criterion10.20443Sum squared resid23442.12 Schwarz criterion10.35379Log likelihood-99.04434 F-statistic875.1219Durbin-Watson stat2.090741 Prob(F-statistic)0.000000由表可得到回归模型:(0.476243) (0.189311) (9.884229)=0.989249 =0.990381 F-tistics=875.1219 D-W=2.090741引入,尽管拟合度有所提高,但是的参数未能通过T检验,故将舍去。将Y与进行回归分析。得下图11:Dependent Variable: YMethod: Least SquaresDate: 06/08/11 Time: 21:15Sample: 1990 2009Included observations: 20VariableCoefficientStd. Errort-StatisticProb. X2-0.1620230.261926-0.6185840.5444X40.2916960.02133413.672880.0000C75.0992329.014502.5883340.0191R-squared0.990572 Mean dependent var375.5215Adjusted R-squared0.989463 S.D. dependent var358.1339S.E. of regression36.76188 Akaike info criterion10.18428Sum squared resid22974.41 Schwarz criterion10.33364Log likelihood-98.84281 F-statistic893.1102Durbin-Watson stat1.929931 Prob(F-statistic)0.000000由表可得到回归模型:(2.588334) (-0.618584) (13.67288)=0.989463 =0.990572 F-tistics=893.1102 D-W=1.929931引入,尽管拟合度有所提高,但是的参数未能通过T检验,且符号不符,故将舍去。将Y与进行回归分析。得下图12:Dependent Variable: YMethod: Least SquaresDate: 06/08/11 Time: 21:32Sample: 1990 2009Included observations: 20VariableCoefficientStd. Errort-StatisticProb. X30.0003850.0016920.2275260.8227X40.2755800.01704316.170020.0000C49.6258140.690251.2195990.2393R-squared0.990389 Mean dependent var375.5215Adjusted R-squared0.989259 S.D. dependent var358.1339S.E. of regression37.11684 Akaike info criterion10.20350Sum squared resid23420.22 Schwarz criterion10.35286Log likelihood-99.03500 F-statistic875.9481Durbin-Watson stat2.060761 Prob(F-statistic)0.000000由表可得到回归模型: (1.219599) (0.227526) (16.17002)=0.989259 =0.990389 F-tistics=875.9481 D-W=2.060721引入,尽管拟合度有所提高,但是的参数未能通过T检验,故将舍去。故最有的模型为3.3异方差性3.3.1异方差性 异方差性产生的主要原因: 模型中遗漏了随时间变化影响逐渐增大的因素。(即测量误差变化) 模型函数形式设定误差。 随机因素的影响。(即截面数据中总体各单位的差异)异方差性的后果:(1)最小二乘估计不再是有效估计(即估计方差不再是最小) (2)无法正确估计系数的标准误差; (3)t检验的可靠性降低; (4)增大模型的预测误差。异方差性的检验方法: (1)图示检验法 (2) 戈德菲尔德匡特(GoldfeldQuandt)检验 (3) 怀特(White)检验 (4)帕克(Park)检验和戈里瑟(Gleiser)检验 (5)ARCH检验3.3.2异方差性检验G-Q检验模型:1)将n组样本观测值按某一被认为有可能引起异方差性的解释变量观测值的大小排队。 2)将中间的大约个观测值出去,并将剩下的观测值划分为较小与较大的容量相同的两个子样本,每个子样本的容量均为 3)对字样进行普通最小二乘回归,并计算参差平方和。 4)在同方差性假定下,构造F分布统计量 5)给定显著性水平,确定F分布相应的临界值。若F>,则拒绝原假设,存在异方差性。 对选定的20组样本进行G-Q检验:1) 将样本出去中间部分,并分为观测值一个较大和一个较小的样本,如图13,14。 图13:Dependent Variable: YMethod: Least SquaresDate: 06/0