多元线性回归模型及其应用.docx
《多元线性回归模型及其应用.docx》由会员分享,可在线阅读,更多相关《多元线性回归模型及其应用.docx(20页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、多元线性回归模型及其应用摘要 本文介绍了多元线性回归模型,其过程分为模型构建、模型参数估计、模型检验和模型预测等几个方面。通过对与我国物价指数CPI相关的几个因素建立初始多元线性回归模型,分析CPI的影响因素,之后对该模型进行各种统计检验,在模型检验中发现初始模型中有部分变量的系数不能通过检验,可能存在多重共线性的问题,最后采用逐步回归分析法来进行去除显著性不高的变量,并且建立新的模型,最终找出了影响CPI的关键要素是农业生产资料价格和人均GDP,通过最终确定的CPI与其影响因素之间的线性回归方程可以清晰地得到各个指标对CPI的影响大小,进而为我国控制CPI提供方向性的建议指导。关键词 多元线
2、性回归 CPI影响因素 逐步回归 Multiple linear regression model and its applicationAbstract This article introduces the multiple linear regression model, and its process is divided into several aspects: model construction, model parameter estimation, model testing and model prediction. By establishing an initial
3、multiple linear regression model on several factors related to Chinas price index CPI, analyzing the influencing factors of CPI, and then carrying out various statistical tests on the model, it is found in the model test that the coefficients of some variables in the initial model cannot pass Test,
4、there may be a problem of multicollinearity, and finally use a stepwise regression analysis method to remove less significant variables, and establish a new model, and finally find out that the key factors affecting CPI are agricultural production materials prices and GDP per capita, Through the fin
5、al linear regression equation between the CPI and its influencing factors, we can clearly get the impact of various indicators on the CPI, and then provide directional recommendations for the control of CPI in China.Key words Multiple linear regression CPI influencing factors stepwise regression目 录引
6、 言11.多元线性回归分析基本理论21.1多元线性回归模型的一般形式21.2多元线性回归模型的基本假设21.3参数估计21.3.1回归系数的估计21.3.2样本方差的估计31.4模型检验31.4.1回归方程的显著性检验41.4.2回归系数的显著性检验41.4.3回归方程的拟合优度检验41.5模型预测51.6自变量的筛选方法52.多元线性回归在CPI影响因素中的应用62.1数据筛选62.1.1指标选取62.1.2数据收集62.2实证分析72.1.3建立模型72.1.4参数估计82.1.5模型检验82.1.6模型优化92.1.7残差检验11结论与建议13参考文献14致 谢15引 言在大学课程的学习
7、中我们接触到了应用数理统计方法,比较常用的方法有方差分析、回归分析、聚类分析等,然而,多元统计分析Error! Reference source not found.p64-65中的重要方法之一就是多元线性回归分析Error! Reference source not found.,在人文科学和自然科学的许多领域都有应用。多元线性回归模型是研究一个随机变量与两个或两个以上一般变量之间相依关系的模型,它的基本步骤大致分为模型的建立、模型求解、模型的检验与模型的预测。 我们对居民消费价格指数(CPI) Error! Reference source not found.波动的理解是基于商品价格浮动
8、的直观认识,但在现实生活中商品价格的变化也会受到各类商品的市场供求关系、产业发展、收入变化、人民生活水平以及经济发展水平等诸多因素的影响。为了能够进一步解释研究影响CPI的主要因素,通过翻阅相关文献可以看出,国内有关CPI影响因素的研究较多,为了分析辽宁省的CPI,刘茹玉选取了固定资产投资、CPI的构成、工业的产出量以及农业生产资料价格这几个指标作为自变量Error! Reference source not found.p23-24;董荣花从生产者价格指数、实际产出、货币供应量这几个方面研究了与CPI的相干关系Error! Reference source not found.p34-35;
9、刘懿枞、李明洋、王虹博选取了货币和准货币供应量(M2)社会商品消费零售总额、固定资产投资(FAI)、国内生产总值(GDP)和进出口总额作为相关指标,研究了这些指标对我国CPI的影响Error! Reference source not found.。从分析上述研究文献可以发现,虽然研究指标选取范围很广,但是没有用不同方法地对我国CPI影响因素进行多元线性回归研究。因此,本文将用不同的回归方法来研究我国CPI的主要影响因素。本文在此背景下,分析借鉴了前人的研究和经验,依据多元线性回归模型的构建,初步筛选了6项与CPI有关的宏观经济指标作为影响变量,并在多元线性回归分析中采用不同的回归方法进行比较
10、分析,以此来构建CPI及其影响因素之间的线性回归方程,我们可以清晰地看到各个指标对CPI的影响,从而找出了影响CPI的关键要素是农业生产资料价格和人均GDP,进而为我国经济发展提供方向性的建议指导。1. 多元线性回归分析基本理论一个被解释变量与多个解释变量形成的线性关系模型就是多元线性回归模型。1.1 多元线性回归模型的一般形式设随机被解释变量与一般解释变量线性回归模型的标准形式如下:式中,是被解释变量的第个观测值;是第个解释变量的第个观测值;表示模型的回归系数;为随机误差项。1.2 多元线性回归模型的基本假设为了能够在统计学上很好地描述参数估计的特性,模型必须符合下面几个假设:1. 解释变量
11、非随机或固定,且各之间不存在严格线性关系。2. 样本中获得的每个解释变量都具有差异性,并且每个的均约等于一个不等于零的常数。3. 期望为0的,相等并且没有序列相关性。4. 与之间没有关联。5. 。1.3 参数估计1.3.1 回归系数的估计在确定回归理论模型后,将基于收集的样本数据估算模型中的未知参数。回归系数和总体方差属于该模型的未知参数。目前应用最广泛的方法是普通最小二乘法,也就是经典的估计方法。 求多元线性回归模型中的回归系数,最小二乘法是目前应用最广泛的估计方法,不过这个方法必须是基于模型的基本假定之上的,因为有一些因此方法而导致模型不符合基本假设,所以一些新的方法就被人们所提出来了,比
12、如偏最小二乘估计、主成分回归、岭回归Error! Reference source not found.p66-67等,但是这一切都基于普通最小二乘法这一估计方法。 最小二乘法就是使残差平方和取得最小值。因为是的非负二次式,所以最小值一定存在。依据数学分析的极值原理,应满足下述方程:称为标准回归方程组,将代入式中整理得:由此可求得的值。1.3.2 样本方差的估计多元线性回归模型中随机误差项的样本方差计算公式如下:其中,为样本观测值的个数,为回归系数的个数,为残差平方和,为总体方差的无偏估计。又被称为回归估计的标准误差,越小说明回归方程的代表性越强。1.4 模型检验回归方程被建立之后,还必须进行
13、各类统计检验,回归方程的R2检验、回归方程的F检验、回归系数的t检验都包含在模型的检验之中。1.4.1 回归方程的显著性检验模型假设为:。检验统计量:是解释变量的个数,统计量服从自由度的分布。用统计软件会自动计算出检验统计量的观测值及相应的概率值,假如,则应拒绝原假定,认为回归系数不全为0,表明回归方程具有显著意义;若,则反之。1.4.2 回归系数的显著性检验模型假设为:。构造检验统计量:服从自由度为的分布。假如,则拒绝原假定,认为某一个回归系数不为0;若,则反之。1.4.3 回归方程的拟合优度检验在线性回归模型中,用判定系数表示拟合程度, 记为:其中表示总离差平方和,表示回归平方和, 表示残
14、差平方和。为了避免由于添加自变量而导致高估。通常也采用调整过的多重判定系数来进行拟合优度检验,其中:或的值越接近1,说明拟合度越高,相反或越接近0,拟合效果越差。1.5 模型预测如果回归模型顺利通过了前面的各种统计检验,那么还可以利用模型对被解释变量进行预测。在当期各解释变量的样本量被提供之后,则可以通过最优回归模型来求解解释变量。基本公式如下:其中,是给定的在预测期的具体数值,为已经估计出来的样本回归系数,为给定时的预测值。标准误差的计算方法如下:在给定显著性水平之下的置信区间如下:是显著性水平的分布双侧临界值。1.6 自变量的筛选方法在多元线性回归模型中,引入自变量的选择直接影响到模型的质
15、量。在模型中,重要的自变量不能被忽略,而且还要避免太多变量引起的诸多负面影响,例如,一方面加大计算量,进而增加了误差,另一方面,还有可能会出现多重共线性的问题,因此我们要对变量进行筛选处理。利用SPSS软件Error! Reference source not found.p27-29可以通过以下几种方法选择自变量进入回归方程:逐步回归法、向后剔除法和向前引入法。向前引入法(Forward),它是一种只选不剔、自变量从无到有的筛选方法。首先,将每个自变量与因变量进行线性回归,并分析其相关性,将相关性最强或者P值最小的自变量放入回归模型中,接下来就是在此基础上,再检验剩余自变量与因变量之间的相关
16、性,继续选择相关性最强或者P值最小的自变量进入模型中,并重复执行这个过程,直至模型外自变量的P0.05为止。向后剔除法(Backward),它是一种只剔不选的自变量筛选方法。首先将自变量框中的所有自变量选入方程,之后将P值最大的自变量剔除,然后使用剩余的自变量建立新的回归方程,重复此过程,直到无法剔除方程中不显著的自变量。逐步回归法(Stepwise),它是一种先选后剔、双向筛选的方法。这个方法首先用向前引入法的方法引入自变量,在每引入一个自变量之后,同时用向后剔除法的方法对自变量逐个检验并剔除不显著变量,重复这个过程,直到无法从模型外引入自变量,并且模型中也无法消除自变量。从逐步回归法的过程
17、来看,这个方法是一种瞻前顾后的方法,每当将新的自变量引入模型时,都有必要考虑一下之前引入的自变量还是不是依然有统计学意义,这也是我们在筛选自变量的时候最经常用到的一种方法。2. 多元线性回归在CPI影响因素中的应用2.1 数据筛选2.1.1 指标选取在本文中,我们选择居民消费价格指数作为因变量,以社会商品零售价格指数、农业生产资料价格指数、固定资产投资价格指数、工业生产者出厂价格指数、人均GDP指数和进出口总额指数作为自变量,这些数据都是定量变量,它们的符号和经济意义见下表:表1变量的经济意义变量符号经济意义居民消费价格指数居民消费水平商品零售价格指数商业发展水平农业生产资料价格指数农业发展水
18、平固定资产投资价格指数固定资产支出水平工业生产者出厂价格指数工业发展水平人均GDP指数居民收入水平进出口总额指数贸易发展水平2.1.2 数据收集为了便于进行回归分析以及比较研究,本文基于中国统计年鉴2019Error! Reference source not found.,收集了自新世纪初以来2001至2018年各项经济指标的数据,对原始数据进行简单分析我们可以看出,作为因变量的我国居民消费价格指数呈现出逐年上升的趋势, 作为自变量的六个指标中,除了进出口总额和农业生产资料价格在2010年前后变化幅度较大以外,其他指标均呈现线性关系。商品零售价格、固定资产投资价格和工业生产者出厂价格增长缓慢
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 多元 线性 回归 模型 及其 应用
限制150内