应用回归分析结课影响财政收入的相关因素的分析大学论文.doc
《应用回归分析结课影响财政收入的相关因素的分析大学论文.doc》由会员分享,可在线阅读,更多相关《应用回归分析结课影响财政收入的相关因素的分析大学论文.doc(28页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、应用回归分析结课论文 影响财政收入的相关因素的分析班级: 姓名: 学号:目 录1.问题的提出42.数据来源43.回归分析的模型方法介绍和总结53.1多元线性回归模型53.1.1多元线性回归模型的一般形式53.1.2多元线性回归模型的基本假定63.2.多元线性回归参数的最小二乘估计74.SAS程序及结果输出84.1.建立数据集,进行相关分析84.2.将数据做标准化处理,建立回归方程104.3.异方差检验114.4自相关检验134.5. 多重共线性检验144.5.1方差扩大因子法144.5.2特征根判定法144.6消除多重共线性154.6.1后退法154.6.2.逐步回归194.7最佳子集回归22
2、4.8岭回归224.9主成分回归254.10偏最小二乘回归265.结论27参考文献28摘要本文选1985-2003年的农业增加值,工业增加值,建筑业增加值,社会消费总额,人口数,受灾面积六个因素通过多元线性回归分析和岭回归对国家财政收入行分析,主要分析分析影响财政收入的主要原因,并联系实际进行分析,以供参考。关键词:财政收入 多元线性回归 多重共线性 岭回归1.问题的提出财政参与分配社会产品,在一国经济发展和分配体系中占有重要地位和作用。可以有力地促进经济的发展促进科学、教育、文化、卫生事业的发展,促进人民生活水平的提高,为巩固国防提供可靠的物质保障。且可调节资源配置,促进社会公平,改善人民生
3、活。促进经济机构的优化和经济发展方式的转变。在我国,财政收入的主体是税收收入,因此在税收体制及政策不变的条件下,财政收入会随着经济繁荣而增加,随着经济衰退而下降。本文利用回归分析,确定影响我国财政收入主要因素。2.数据来源在研究国家收入时,我们把财政收入按形式分为:各项税收收入,企业收入,债务收入,国家能源交通重点建设基金收入,基本建设贷款归还收入,国家调节基金收入,其他收入等。为了建立国家财政收入回归模型,我们以财政收入y(亿元)为因变量,自变量如下:x1为农业增加值(亿元);x2为工业增加值(亿元);x3为建筑业增加值(亿元);x4为人口数(万人);X5为社会消费总额(亿元);x6为 受灾
4、面积(万公顷)。根据中国统计年鉴,得到1985-2003年数据,如图:3.回归分析的模型方法介绍和总结3.1多元线性回归模型3.1.1多元线性回归模型的一般形式 设随机变量与一般变量, ,的线性回归模型为: (3.1)式中,是个未知参数,称为回归常数,称为回归系数。称为被解释变量(因变量),是个可以精确测量并控制的一般变量。称为解释变量(自变量)。时,式(3.1)为一元线性回归模型;时,我们就称式(3.1)为多元线性回归模型。是随机误差,与一元线性回归一样,对随机误差项我们常假定 (3.2) 称 (3.3)为理论回归方程。 对一个实际问题,如果我们获得组观测数,则线性回归模型式(3.1)可表示
5、为: (3.4) 写成矩阵形式为: (3.5) 是一个阶矩阵,称为回归设计矩阵或资料矩阵。在实验设计中,的元素是预先设定并可以控制的,人的主观因素可作用其中,因而称为设计矩阵。3.1.2多元线性回归模型的基本假定 为了方便地进行模型的参数估计,对回归方程式(3.4)有如下一些基本假定 (1)解释变量, ,是确定性变量,不是随机变量,且要求。这里的,表明设计矩阵中的自变量列之间不相关,样本量的个数应大于解释变量的个数,是一满秩矩阵。 (2)随机误差性具有零均值和等方差,即 , , 这个假定通常称为高斯马尔柯夫条件。,即假设观测值没有系统误差,随机误差项的平均值为零,随机误差项的协方差为零,表明随
6、机误差项在不同的样本点之间是不相关的(在正态假定下即为独立的),不存在序列相关,并且有相同的精度。 (3)正态分布的假定条件为: 相互独立对于多元线性回归的矩阵模型式(3.5),这个条件便可表示为: 由上述假定和多元正态分布的性质可知,随机变量服从维正态分布,回归模型式(3.5)的期望向量 因此 3.2.多元线性回归参数的最小二乘估计多元线性回归模型未知参数,的估计与一元线性回归方程的参数估计原理一样,仍可采用最小二乘估计。对于,所谓最小二乘法,就是寻找参数,的估计值,使离差平方和Q(,)极小,即: 4.SAS程序及结果输出4.1.建立数据集,进行相关分析程序1data a;input yea
7、r y x1-x6;cards;19852004.823619.59716675.11058.513801.4443.6519862122.01401311194808.071075.074374471.419872199.354675.713813954.6510935115420.919882357.245865.3182251131.651110.266534.6508.719892664.96534.7220171282.981127.047074.2469.9119902937.17662.1239241345.011143.337250.3384.7419913149.488157
8、266251564.331158.238245.7554.7219923483.379084.7345992174.441171.719704.8513.3319934348.9510995.5484023253.51185.1712462.1488.2919945218.115750.5701764653.321198.516264.7550.4319956242.220340.9918945793.751267.4320620546.8819967407.9922353.7995958282.251211.2124774.1458.2119978651.1423788.4113733912
9、6.481223.8927298.9469.8919989875.9524542.911904810061.991276.2729152.5521.55199911444.0824519.112611111152.861236.2631134.7534.29200013395.2324915.885673.712497.61284.53334152.6471.19200116386.0426179.69548.9815361.561247.6137595.2501.45200218903.6427390.811076.518527.181257.8642027.1499.81200321715
10、.2529691.814771.223083.871292.2745842545.06;run;proc print;run;proc corr data=a noprob;var y x1-x6;run;结果:表一分析:从相关阵看出,y与x2的相关系数偏小,x2是工业增加值,这说明工业增加值对财政收入无显著影响。4.2.将数据做标准化处理,建立回归方程程序2:proc standard data=a mean=0 std=1 out=out1;var y x1-x6;run;proc print data=out1;run;proc reg data=out1;model y=x1-x6;r
11、un;结果:表二因为数据为标准化数据,所以方程中不含有常数项。所以有回归方程为:Y=0.117.8x1-0.11696x2+0.87288x3+0.01659x+0.04690x5+0.01022x6由决定系数R方=0.9957,调整R方=0.9936,得回归方程高度显著。又有F=463.63,PF模型6674884516112480753463.63FIntercept-733.030475750.126543942.677580.020.9007x10.076530.101541378050.570.4656x2-0.016860.0070214010785.780.0333x30.797
12、380.100781518587662.59F模型5674871688134974338600.07FIntercept553.063221285.69944416220.190.6741x10.091750.074123447241.530.2376x2-0.017240.0065715516386.900.0209x30.789040.090551707971875.93F模型4674780920168695230783.36FIntercept1343.77319315.04852391776018.190.0008x10.095490.072293757341.740.2077x2-0
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 应用 回归 分析 影响 财政收入 相关 因素 大学 论文
限制150内