《应用回归课程论文.doc》由会员分享,可在线阅读,更多相关《应用回归课程论文.doc(12页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、【精品文档】如有侵权,请联系网站删除,仅供学习与交流应用回归课程论文.精品文档.四川理工学院应用回归分析课程设计报告题目:中国地方财政教育支出的影响因素分析学 生:雷鹏程 何君 李西京曾学成 白俊明专 业:统计学指导教师:张海燕四川理工学院理学院二零一 四 年十二月摘要本文主要研究中国地方财政教育支出主要的影响因素,针对影响地方财政教育支出的主要因素进行了分析。选取了5个影响指标作为方程的初始自变量,建立起了影响地方财政教育支出的线性回归模型,利用SPSS软件对地方财政教育支出进行初步线性回归分析,以及利用逐步回归方法解决了自变量之间的多重共线性,并对模型的异方差进行了检验和自相关性的检验,进
2、而得到修正后的回归模型,并对回归模型进行了分析,得到方程效果良好的结论,指出模型的应用价值。在此基础上同时给出相应的政策与建议。关键字:多元线性回归、逐步回归、自相关。一、问题提出改革开放以来,随着经济的快速增长,中国各级政府对教育的投入不断增加。2012年中央和地方公共财政预算、政府性基金预算用于教育的预算支出21994亿元,达到了占国内生产总值4%的目标。据财政部公布的数据,2011年,全国中央和地方财政的教育支出16497亿元,占全部财政支出的15.1%,其中,中央财政教育支出999亿元,地方财政支出15498亿元。在全国中央和地方财政的教育支出中,地方财政的教育支出约占94%,地方财政
3、支出是财政教育经费的主要来源。然而,由于各地区社会经济发展差异较大,各地区财政的教育支出水平也差异明显。2011年人均地方财政教育支出最低的湖南仅为819.99元,北京是湖南的3.14倍。为了研究影响中国地方财政教育支出差异的主要原因,分析地方财政教育支出增长的数量规律,预测中国地方财政教育支出的增长趋势,需要建立起经济回归模型,。二、模型设定为了全面反映中国地方财政教育经费支出的差异,选择地方财政教育支出为被解释变量。根据对影响中国地方财政教育支出主要因素的分析,选择“地区生产总值”作为地区经济规模的代表;各地区居民对教育模式的需求,选择各地区“年末人口数量”作为代表。选择“居民平均每人教育
4、现金消费”代表居民对教育质量的需求;选择居民教育消费价格指数作为价格变动影响的因素,地方政府教育投入的能力与意愿难以直接量化,选择“教育支出在地方支出中的比重”作为其代表。以国家统计局已经公布的2011年31个省份的数据为样本从中国统计年鉴2012可以收集到数据。三、模型建立与求解鉴于数据的可获性以及影响的重要性,对于地方财政教育支出的主要影响因素我们主要选取了以下五个影响因素:地区生产总值、年末人口数、居民平均每人教育现金消费、CPI(居民消费价格指数)、教育支出在地方财政支出中的比重。我们的数据来源于国家统计公布的2011年31个省份为数据样本参考附录表1,经过对这31个省份的经济数据进行
5、分析,设定“地区生产总值”为,年末人口数为,居民平均每人教育现金消费为,CPI为,教育支出在地方财政支出中的比重为,作为自变量;地方财政教育支出设为,作为因变量。根据所选区的生产总值、年末人口数、居民平均每人教育现金消费、CPI(居民消费价格指数)、教育支出在地方财政支出中的比重五项指标,建立如下的多元线性回归模型: :表示在没有任何因素影响下地方财政教育支出:表示地区生产总值对地方财政教育支出的影响:表示年末人口数对地方财政教育支出的影响:表示居民平均每人教育现金消费对地方财政教育支出的影响:表示CPI对地方财政教育支出的影响:表示教育支出在地方财政支出中的比重对地方财政教育支出的影响:随机
6、扰动项3.1最小二乘法对一般形式多元回归模型的参数估计理论基础:设随机变量与随机变量, 的线性回归模型为:是随机扰动项,与一元回归一样,随机扰动项我们常假定:对于一个实际问题,如果我们可以获得n组观测数据,则多元线性回归模型的矩阵形式表示为:其中最小二乘法就是寻找参数,的估计值,使离差平方和(,)=达到极小,即寻找,满足:=(3.1)依照(3.1)式中求出的,就称为回归系数,的最小二乘估计。从(3.1)式中求出,是一个极值问题。由于是关于,的非负二次函数,因而它的最小值总存在的。根据微积分中求极值原理,应满足下列方程组:以上方程组经过整理后,得到矩阵形式表示的正规方程组为:移项得:,当存在时,
7、可得到回归参数的最小二乘估计为:四、模型的检验与修正利用SPSS(19.0)采用进入法计算出的回归参数估计结果如下表:Model SummarybModelRR SquareAdjusted R SquareStd. Error of the EstimateDurbin-Watson1.979a.958.95061.604901.908a. Predictors: (Constant), x5, x3, x4, x1, x2b. Dependent Variable: y表1模型拟合优度表ANOVAbModelSum of SquaresdfMean SquareFSig.1Regressi
8、on2179849.6205435969.924114.875.000aResidual94879.100253795.164Total2274728.72130a. Predictors: (Constant), x5, x3, x4, x1, x2b. Dependent Variable: y表2模型F值检验表CoefficientsaModelUnstandardized CoefficientsStandardized CoefficientstSig.BStd. ErrorBeta1(Constant)-1794.5421181.234-1.519.141x1.014.002.68
9、18.279.000x2.033.008.3293.992.001x3.003.010.015.325.748x418.35811.542.0701.591.124x5296.100489.849.030.604.551a. Dependent Variable: y表3回归参数估计结果表由上表1、2、3知该回归模型为: (1181.234) (0.002) (0.008) (0.01) (11.542) (489.949) t=(-1.519)(8.279)(3.992)(0.325)(1.591)(0.604) F=114.875 该模型可初步通过经济意义上的检验,系数符号均符合经济意义,
10、并且我们发现出了模型的F值大于其临界值,说明5个变量联合起来对模型有显著影响,同时,由此可得该模型的拟合度很好。但是部分回归系数的显著性检验不能通过,我们猜测模型中存在多重共线性,使得其他因素的影响的准确度受到了影响。因此我们需要进一步对模型进行多重共线性检验与修正。1.多重共线性检验与修正4-1.1多重共线性检验利用SPSS(19.0)计算出各个自变量之间的相关系数表,如下表4所示:Correlationsx1x2x3x4x5x1Pearson Correlation1.842*.026-.242.543*Sig. (2-tailed).000.891.190.002N3131313131x
11、2Pearson Correlation.842*1-.157-.105.518*Sig. (2-tailed).000.400.574.003N3131313131x3Pearson Correlation.026-.1571-.290.132Sig. (2-tailed).891.400.113.481N3131313131x4Pearson Correlation-.242-.105-.2901-.176Sig. (2-tailed).190.574.113.344N3131313131x5Pearson Correlation.543*.518*.132-.1761Sig. (2-ta
12、iled).002.003.481.344N3131313131*. Correlation is significant at the 0.01 level (2-tailed).表4各个自变量的相关系数矩阵由相关系数矩阵看出与、之间存在较高的相关系数,显然模型存在多重共线性。4-1.2多重共线性修正利用SPSS(19.0)软件采用逐步回归方法对模型的多重共线性问题进行修正,输出的参数回归结果如下表5所示,其余结果表见附录表所示:CoefficientsaModelUnstandardized CoefficientsStandardized CoefficientstSig.BStd. E
13、rrorBeta1(Constant)164.25623.5526.974.000x1.020.001.95818.017.0002(Constant)117.07420.7145.652.000x1.014.002.6638.773.000x2.035.008.3504.631.000a. Dependent Variable: y表5共线性后修正后的模型参数回归结果表多重共线性修正后的回归模型为:117.047+0.014+0.035+ (20.714)(0.002)(0.008) t=(5.652) (8.773) (4.631) =0.954 =0.95 F=287.471模型修正多重
14、共线性后,模型的拟合程度很好, =0.954,并且整个回归模型是显著的,每个自变量的t检验也是较为显著。所以接下来我们考虑到模型可能存在自相关与异方差,所以我们又对模型进行了异方差与自相关的检验与修正。2异方差检验与修正4-2.1 等级相关系数检验利用SPSS(19.0)软件对消除多重共线性后的模型进行等级相关系数检验,检验表如下表6所示:Correlationssx1x2Spearmans rhosCorrelation Coefficient1.000-.215-.271Sig. (2-tailed).247.141N313131x1Correlation Coefficient-.215
15、1.000.807*Sig. (2-tailed).247.000N313131x2Correlation Coefficient-.271.807*1.000Sig. (2-tailed).141.000.N313131*. Correlation is significant at the 0.01 level (2-tailed).表6等级相关系数检验表由上表6可得,残差绝对值与自变量、的等级相关系数分别为=-0.215,=-0.271,且P值分别为:0.247,0.141,我们可认为残差绝对值与自变量、不显著相关,所以回归模型不存在异方差。3.1自相关检验与修正3-3.1DW检验由修正
16、多重共线性后的模型回归表知道DW=2.077,在显著性水平0.05下,查DW表知道,当n=31,k=2时,得到上临界值=1.297,下临界值=1.570。所以DW(2,28),所以拒绝原假设,说明回归方程显著,即“地区生产总值”、“年末人口数”变量联合起来确实对“地方财政教育支出”有显著性影响。t检验:分别对:=0(j=1,2),给定=5%显著水平下,查t分布表查出自由度为n-k=28临界值为2.048,由回归表5中数据可得、对应的t统计量分别8.773、4.631,其绝对值均大于临界值2.048,这说明应该分别拒绝:=0(j=1,2),也就是说,当其他解释变量不变的情况下,解释变量“区生产总
17、值”、“年末人口数”变量分别对被解释变量“地方财政教育支出”的影响显著。由最终回归模型模型估计结果表明,在假定其他变量不变的情况下,当地区生产总值每增加1亿元时,地方政府财政教育支出就平均增加0.014亿元,当年末人口数每增加1万人时,地方政府的财政教育支出就平均增加0.035亿元。在其他假定变量不增加时,地方政府也会支出教育费用117.047亿元,但是这个常数项对模型的解释程度较低,以上的的回归结果与理论分析和经验判断相一致,现实中的定性分析结果一致。5.2模型的推广多元回归模型在现实的经济社会中有许多重要的应用,本文利用多元回归解决了中国地方政府教育支出的问题,在实际的经济社会中多元回归的
18、应用比较广泛。在分析一个国家或者一个企业的经济现象时,利用多元回归模型会很好的解决一些现实的经济现象。六 问题的思考及政策建议6.1问题思考一个地区的生产总值以及宏观的经济环境对全国的地方财政教育支出的发展起到了决定性的影响,通过多元回归模型的分析我们得知,无论如何变幻因素的组合,地区生产总值的精确程度始终最高,拟合程度也基本都是最好的,其次是年末人口数,因为这些都与宏观经济发展速度以及人均收入情况息息相关。当今世界,知识成为经济的最基本资源和生产的最核心要素,教育对于国家综合国力的增强具有基础性的地位,呈现由经济社会边缘向经济社会中心发展的趋势;教育公平是实现社会公平、构建和谐社会的重要基础
19、。加强国家财政对教育的支持力度,建立充足、公平、有效的教育财政制度,避免区域之间、城乡之间经济发展不平衡导致受教育机会的不公平,使每一个人都能获得基本均等的教育机会,避免因教育机会不均等所造成的贫富差距的进一步扩大,有利于实现社会公平。目前,国际上通常用财政教育支出占GDP的比例和财政教育支出占公共财政支出的比例两方面指标考察一国财政教育支出水平,从整体水平上看,在其他国家教育财政支出占公共财政支出比重总体上呈稳定缓慢上升态势时,中国呈现明显下降的趋势,这充分说明在其他国家不断增大政府对教育投入的努力程度的同时,我国对教育的财政支持力度却在相对下降。6.2政策建议由教育对于国家综合国力的增强具
20、有基础性的地位,所以财政教育的支出就起来了举足轻重的作用,由模型可得提高地方的生产总值进而就能提高财政教育支出,就能提高我国的教育能力,所以一个国家的GDP是提高教育支出的必然一点,还有就是继续进行计划生育。因此加大对教育支出的财政支持力度,优化财政性教育,缩小与世界其他国家的差距是我国教育发展的重要目标。七 参考文献1何晓群、刘文卿编著.应用回归分析(第三版)M.北京:中国人民大学出版社,2011.2何晓群.回归分析与经济数据建模M.北京:中国人民大学出版社,1997.3庞浩.计量经济学(第三版)M.北京:科学出版社,2014.4韩爽、韩继深.我国财政教育支出问题分析J.经济师,2010(3
21、):69.附录:表1 2011年各地区地方财政教育支出及主要影响因素数据统计表地区地方财政教育支出/(亿元)地区生产总值/(亿元)年末人口数/(万人)居民平均每人教育现金消费(元/人)居民消费价格指数教育支出占地方财政支出比重/%北京520.0816251.932018.61171.28101.1540.1603天津302.3211307.2813557808.85100.22480.1683河北652.1124515.767240.51523.54100.88150.1843山西421.7911237.553593722.92102.81310.1784内蒙古390.6914359.8824
22、81.71740.41101.34710.1307辽宁544.0922226.74383757.94101.20310.1393吉林319.8210568.832749.71739.14100.48680.1453黑龙江373.83125823834598.7102.08620.1338上海549.2419195.692347.461285.61101.76470.1403江苏1093.2249110.277898.81005.65102.30580.1757浙江751.4232318.8554631332.6399.826730.1956安徽564.7115300.655968776.910
23、0.62230.171福建406.7317576.183720629.1199.340250.185江西474.4311702.824488.437616.69101.32770.1872山东1047.945361.859637656.83100.76610.2095河南857.1426931.039388544.6101.79410.2017湖北488.1619632.265757.5690.86101.02190.1519湖南540.8319669.566595.6626.86102.56550.1536广东1227.8753210.2810504.85929.03101.29250.18
24、29广西456.8911720.874645561.81102.80540.1795海南127.272522.66877.34565.68100.89380.1634重庆318.710011.372919460.09101.84850.124四川684.6621026.688050534.18101.59560.1465贵州376.865701.843468.72487.36101.41190.1075云南4838893.124630.8462.62102.31860.1049西藏77.81605.83303.3227.79100.62020.1026陕西529.4612512.733742.
25、6873.23101.65740.1807甘肃284.335020.372564.19447.01104.37240.1587青海130.111607.44568.17328.25103.26310.1345宁夏103.022102.21639.45566.71102.21490.1459新疆399.86610.052208.71514.57102.81530.175表2逐步回归的模型拟合优度表Model SummarycModelRR SquareAdjusted R SquareStd. Error of the EstimateDurbin-Watson1.958a.918.91580.
26、206512.977b.954.95061.422462.077a. Predictors: (Constant), x1b. Predictors: (Constant), x1, x2c. Dependent Variable: y表3逐步回归各个模型F检验表ANOVAcModelSum of SquaresdfMean SquareFSig.1Regression2088169.27612088169.276324.598.000aResidual186559.444296433.084Total2274728.721302Regression2169092.61321084546.30
27、6287.471.000bResidual105636.108283772.718Total2274728.72130a. Predictors: (Constant), x1b. Predictors: (Constant), x1, x2c. Dependent Variable: y表4逐步回归系数估计结果表Excluded VariablescModelBeta IntSig.Partial CorrelationCollinearity StatisticsTolerance1x2.350a4.631.000.659.290x3-.060a-1.141.263-.211.999x4.099a1.884.070.335.942x5.057a.894.379.167.7052x3.002b.054.957.010.890x4.065b1.549.133.286.908x5.027b.544.591.104.692a. Predictors in the Model: (Constant), x1b. Predictors in the Model: (Constant), x1, x2c. Dependent Variable: y
限制150内