《多元线性回归模型备课讲稿.ppt》由会员分享,可在线阅读,更多相关《多元线性回归模型备课讲稿.ppt(69页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、多元线性回归模型分析中国汽车行业未来的趋势分析中国汽车行业未来的趋势,应具体分析这样一些问题:应具体分析这样一些问题:中国汽车市场发展的状况如何?中国汽车市场发展的状况如何?(用销售量观测)(用销售量观测)影响中国汽车销量的主要因素是什么?影响中国汽车销量的主要因素是什么?(如收入、价格、费用、道路状况、能源、政策环境等)(如收入、价格、费用、道路状况、能源、政策环境等)各种因素对汽车销量影响的性质怎样?各种因素对汽车销量影响的性质怎样?(正、负)(正、负)各种因素影响汽车销量的具体数量关系是什么?各种因素影响汽车销量的具体数量关系是什么?所得到的数量结论是否可靠?所得到的数量结论是否可靠?中
2、国汽车行业今后的发展前景怎样?应当如何制定汽车的中国汽车行业今后的发展前景怎样?应当如何制定汽车的产业政策?产业政策?很明显,只用一个解释变量已很难分析汽车产业的发展很明显,只用一个解释变量已很难分析汽车产业的发展,还需要寻求有更多个解释变量情况的回归分析方法。还需要寻求有更多个解释变量情况的回归分析方法。怎样分析多种因素的影响?怎样分析多种因素的影响?2第三章第三章 多元线性回归模型多元线性回归模型 本章主要讨论本章主要讨论:多元线性回归模型及古典假定多元线性回归模型及古典假定 多元线性回归模型的估计多元线性回归模型的估计 多元线性回归模型的检验多元线性回归模型的检验 多元线性回归模型的预测
3、多元线性回归模型的预测3 第一节第一节 多元线性回归模型及古典假定多元线性回归模型及古典假定 本节基本内容本节基本内容:一、多元线性回归模型的意义一、多元线性回归模型的意义 二、多元线性回归模型的矩阵表示二、多元线性回归模型的矩阵表示 三、多元线性回归中的基本假定三、多元线性回归中的基本假定 4一、多元线性回归模型的意义一、多元线性回归模型的意义例如例如:有两个解释变量的电力消费模型有两个解释变量的电力消费模型其中其中:为各地区电力消费量;为各地区电力消费量;为各地区国内生产总值(为各地区国内生产总值(GDP););为各地区电力价格变动。为各地区电力价格变动。模型中参数的意义是什么呢模型中参数
4、的意义是什么呢?5多元线性回归模型的一般形式多元线性回归模型的一般形式一般形式:对于有一般形式:对于有个解释变量的线性回归模型个解释变量的线性回归模型模型中参数模型中参数是偏回归系数,是偏回归系数,样本容量样本容量为为偏回归系数偏回归系数:控制其它解释量不变的条件下,第:控制其它解释量不变的条件下,第 个解释变量的单位变动对应变量平均值的影响。个解释变量的单位变动对应变量平均值的影响。6对各个回归系数而言是对各个回归系数而言是“线性线性”的,对变量则可的,对变量则可是线性的,也可是非线性的是线性的,也可是非线性的例如:生产函数例如:生产函数取自然对数取自然对数多元线性回归多元线性回归7 的总体
5、条件均值表示为多个解释变量的函数的总体条件均值表示为多个解释变量的函数 总体回归函数也可表示为总体回归函数也可表示为:多元总体回归函数多元总体回归函数8 的样本条件均值表示为多个解释变量的函数的样本条件均值表示为多个解释变量的函数或或其中其中 回归剩余(残差):回归剩余(残差):多元样本回归函数多元样本回归函数9二、多元线性回归模型的矩阵表示二、多元线性回归模型的矩阵表示 个解释变量的多元线性回归模型的个解释变量的多元线性回归模型的 个观测个观测样本,可表示为样本,可表示为 10 用矩阵表示用矩阵表示11总体回归函数总体回归函数 或或样本回归函数样本回归函数 或或 其中:其中:都是有都是有 个
6、元素的列向量个元素的列向量 是有是有 个元素的列向量个元素的列向量 是第一列为是第一列为1 1的的 阶解释变量阶解释变量 数据矩阵数据矩阵(截距项可视为解释变量截距项可视为解释变量 取值为取值为1)1)12三、多元线性回归中的基本假定三、多元线性回归中的基本假定 假定假定1 1:零均值假定零均值假定 或或 假定假定2 2和假定和假定3 3:同方差和无自相关假定:同方差和无自相关假定 假定假定4 4:随机扰动项与解释变量不相关:随机扰动项与解释变量不相关 13假定假定5:5:无多重共线性假定无多重共线性假定 (多元中多元中)假定各解释变量之间不存在线性关系,或各个假定各解释变量之间不存在线性关系
7、,或各个解释变量观测值之间线性无关。或解释变量观解释变量观测值之间线性无关。或解释变量观测值矩阵测值矩阵 列满秩列满秩(列列)。即即 可逆可逆假定假定6 6:正态性假定正态性假定14 第二节第二节 多元线性回归模型的估计多元线性回归模型的估计 本节基本内容本节基本内容:普通最小二乘法(普通最小二乘法(OLSOLS)OLS OLS估计式的性质估计式的性质 OLS OLS估计的分布性质估计的分布性质 随机扰动项方差随机扰动项方差 的估计的估计 回归系数的区间估计回归系数的区间估计15 一、普通最小二乘法一、普通最小二乘法(OLSOLS)最小二乘原则最小二乘原则 剩余平方和最小:剩余平方和最小:求偏
8、导求偏导,令其为令其为0:0:16 即即 注意到注意到17 用矩阵表示用矩阵表示因为样本回归函数为因为样本回归函数为 两边乘两边乘 有:有:因为因为 ,则正规方程为:,则正规方程为:18 由正规方程由正规方程 多元回归中多元回归中 二元回归中二元回归中 注意:注意:和和 为为 的离差的离差 OLS估计式估计式19二、二、OLS估计式的性质估计式的性质 OLS估计式 1.1.线性特征线性特征:是是 的线性函数,因的线性函数,因 是非随机是非随机 或取固定值的矩阵或取固定值的矩阵 2.2.无偏特性无偏特性:203.最小方差特性最小方差特性在在所有的线性无偏估计中,所有的线性无偏估计中,OLS估计估
9、计具有具有最小方差最小方差结论结论:在古典假定下,多元线性回归的在古典假定下,多元线性回归的OLS估计估计式是最佳线性无偏估计式(式是最佳线性无偏估计式(BLUE)21三、三、OLS估计的分布性质估计的分布性质基本思想基本思想 是是随随机机变变量量,必必须须确确定定其其分分布布性性质质才才可可能能进行区间估计和假设检验进行区间估计和假设检验 是是服服从从正正态态分分布布的的随随机机变变量量,决决定定了了 也也是服从正态分布的随机变量是服从正态分布的随机变量 是是 的的线线性性函函数数,决决定定了了 也也是是服服从从正正态态分布的随机变量分布的随机变量22 的期望的期望 (由无偏性由无偏性)的方
10、差和标准误差:的方差和标准误差:可以证明可以证明 的方差的方差-协方差矩阵为协方差矩阵为 这里这里是是 矩阵矩阵 中第中第 行第行第 列的元素列的元素23 四、随机扰动项方差四、随机扰动项方差 的估计的估计 多元回归中多元回归中 的无偏估计为:的无偏估计为:或表示为或表示为 将将 作标准化变换:作标准化变换:24因因是未知的,可用是未知的,可用代替代替去估计参数去估计参数的标的标准误差准误差:当为大样本时,用估计的参数标准误差对当为大样本时,用估计的参数标准误差对作标作标准化变换,所得准化变换,所得Z统计量仍可视为服从正态分布统计量仍可视为服从正态分布当为小样本时,用估计的参数标准误差对当为小
11、样本时,用估计的参数标准误差对作标作标准化变换,所得的准化变换,所得的t统计量服从统计量服从t分布:分布:25五、回归系数的区间估计五、回归系数的区间估计由于由于给定给定 ,查,查t分布表的自由度为分布表的自由度为 的临界值的临界值或或:或表示为或表示为:26 第三节第三节多元线性回归模型的检验多元线性回归模型的检验本节基本内容本节基本内容:多元回归的拟合优度检验多元回归的拟合优度检验 回归方程的显著性检验(回归方程的显著性检验(F F检验)检验)各回归系数的显著性检验(各回归系数的显著性检验(t t检验)检验)27一、多元回归的拟合优度检验一、多元回归的拟合优度检验多重可决系数多重可决系数:
12、在多元回归模型中,由各个解释变量联合:在多元回归模型中,由各个解释变量联合解释了的解释了的 的变差,在的变差,在 的总变差中占的比重,用的总变差中占的比重,用 表表示示与简单线性回归中可决系数与简单线性回归中可决系数 的区别只是的区别只是 不同,多元不同,多元回归中回归中多重可决系数也可表示为多重可决系数也可表示为 28 特点特点:多重可决系数是模型中解释变量个数的多重可决系数是模型中解释变量个数的不减函数不减函数,这给对比不同模型的多重可决系数带来缺陷,所以这给对比不同模型的多重可决系数带来缺陷,所以需要修正。需要修正。多重可决系数的矩阵表示多重可决系数的矩阵表示29思想思想可决系数只涉及变
13、差,没有考虑可决系数只涉及变差,没有考虑自由度自由度。如果用。如果用自由度去校正所计算的变差,可纠正解释变量个自由度去校正所计算的变差,可纠正解释变量个数不同引起的对比困难。数不同引起的对比困难。自由度自由度统计量的自由度指可自由变化的样本观测值个数,统计量的自由度指可自由变化的样本观测值个数,它等于所用样本观测值的个数减去对观测值的约它等于所用样本观测值的个数减去对观测值的约束个数。束个数。修正的可决系数修正的可决系数30可决系数的修正方法可决系数的修正方法 总变差总变差 自由度为 解释了的变差解释了的变差 自由度为 剩余平方和剩余平方和 自由度为 修正的可决系数修正的可决系数为为 31 特
14、点特点 可决系数可决系数 必定非负,但修正的可决系数必定非负,但修正的可决系数 可能为负值,这时规定可能为负值,这时规定 修正的可决系数修正的可决系数与可决系数与可决系数的关系:的关系:32二、回归方程显著性检验(二、回归方程显著性检验(F F检验检验)基本思想基本思想在多元回归中有多个解释变量,需要说明所有解在多元回归中有多个解释变量,需要说明所有解释变量联合起来对应变量影响的总显著性释变量联合起来对应变量影响的总显著性,或整个或整个方程总的联合显著性。对方程总显著性检验需要方程总的联合显著性。对方程总显著性检验需要在方差分析的基础上进行在方差分析的基础上进行F检验。检验。33总变差总变差
15、自由度自由度 模型解释了的变差模型解释了的变差 自由度自由度 剩余变差剩余变差 自由度自由度变差来源变差来源 平方和平方和 自由度自由度 方差方差归于回归模型归于回归模型归于剩余归于剩余总变差总变差方差分析表方差分析表34 原假设原假设 备择假设备择假设 不全为不全为0 0 建立统计量建立统计量(可以证明可以证明):):给定显著性水平给定显著性水平 ,查,查F F分布表得临界值分布表得临界值 并通过样本观测值计算并通过样本观测值计算 值值F检验检验35如果如果 (小概率事件发生了小概率事件发生了)则则拒拒绝绝 ,说说明明回回归归模模型型有有显著意义,即所有解释变量联合起来对显著意义,即所有解释
16、变量联合起来对 有显著影响。有显著影响。如果如果 (大概率事件发生了大概率事件发生了)则则接接受受 ,说说明明回回归归模模型型没有显著意义,即所有解释变量联合起来对没有显著意义,即所有解释变量联合起来对 没有显著影响。没有显著影响。36可决系数与可决系数与F检验检验由方差分析可以看出,由方差分析可以看出,F检验与可决系数有密切联系,二者检验与可决系数有密切联系,二者都建立在对应变量变差分解的基础上。都建立在对应变量变差分解的基础上。F统计量也可通过可统计量也可通过可决系数计算:决系数计算:可看出:当可看出:当时,时,越大,越大,值也越大值也越大当当时,时,结结论论:对对方方程程联联合合显显著著
17、性性检检验验的的F检检验验,实实际际上上也也是是对对的的显著性检验显著性检验。37三、各回归系数的显著性检验三、各回归系数的显著性检验 (t t 检验)检验)目的:目的:在在多多元元回回归归中中,分分别别检检验验当当其其他他解解释释变变量量保保持持不不变变时,各个解释变量时,各个解释变量 对应变量对应变量 是否有显著影响。是否有显著影响。方法:方法:原假设原假设 备择假设备择假设 统计量为:统计量为:38t检验的方法检验的方法 给给定定显显著著性性水水平平 ,查查自自由由度度为为 时时t分分布布表表的的临界值为临界值为 如果如果 就不拒绝就不拒绝 而拒绝而拒绝 即即认认为为 所所对对应应的的解
18、解释释变变量量 对对应应变变量量 的的影影响不显著。响不显著。39 如果如果就拒绝就拒绝而不拒绝而不拒绝即认为即认为所对应的解释变量所对应的解释变量对应变量对应变量 的影响的影响是显著的。是显著的。在多元回归中,可分别对每个回归系数逐个地进在多元回归中,可分别对每个回归系数逐个地进行行t检验。检验。注意注意:在一元回归中在一元回归中F检验与检验与t检验等价检验等价,且且但在多元回归中但在多元回归中F检验与检验与t检验作用不同。检验作用不同。40第四节第四节多元线性回归模型的预测多元线性回归模型的预测 本节基本内容本节基本内容:应变量平均值预测应变量平均值预测 应变量个别值预测应变量个别值预测4
19、1一、应变量平均值预测一、应变量平均值预测 1.1.平均值的点预测平均值的点预测 将解释变量预测值代入估计的方程:将解释变量预测值代入估计的方程:多元回归时:多元回归时:或或 注意注意:预测期的预测期的 是第一个元素为是第一个元素为1 1的行向量的行向量,不是矩阵不是矩阵,也不是列向量也不是列向量 42基本思想:基本思想:由于存在抽样波动,预测的平均值由于存在抽样波动,预测的平均值不一定不一定等于真实平均值等于真实平均值,还需要对,还需要对作区间估计。作区间估计。为对为对 作区间预测,必须确定平均值预测值作区间预测,必须确定平均值预测值的抽样分布。必须找出与的抽样分布。必须找出与和和都有都有关
20、的统计量关的统计量。2.2.平均值的区间预测平均值的区间预测43 具体作法具体作法(回顾一元回归回顾一元回归)当当未知未知时,只得用时,只得用代替,代替,这时这时一元中已知一元中已知44多元回归时多元回归时,与与 和和 都有关的是偏差都有关的是偏差 从正态分布从正态分布,可证明可证明用用 代替代替 ,可构造可构造t统计量统计量 45 则给定显著性水平则给定显著性水平,查,查t分布表,得自由度分布表,得自由度的临界值的临界值,则,则或或46二、应变量个别值预测二、应变量个别值预测 基本思想:基本思想:既是对既是对 平均值的点预测,也是对平均值的点预测,也是对 个别值个别值的点预测。的点预测。由于
21、存在随机扰动由于存在随机扰动 的影响的影响,的平均值并不的平均值并不等于等于 的个别值的个别值 为了对为了对 的个别值的个别值 作区间预测,需要寻找与作区间预测,需要寻找与预测值预测值 和个别值和个别值 有关的统计量,并要明确其有关的统计量,并要明确其概率分布概率分布47已知剩余项已知剩余项是与预测值是与预测值和个别值和个别值都有关的都有关的变量,并且已知变量,并且已知服从正态分布,且可证明服从正态分布,且可证明当用当用代替代替时,对时,对标准化的变标准化的变量为:量为:具体作法具体作法48给定显著性水平给定显著性水平,查,查t分布表得自由度为分布表得自由度为的的临界值临界值则则因此,多元回归
22、时因此,多元回归时的个别值的置信度的个别值的置信度的预的预测区间的上下限为:测区间的上下限为:49第五节第五节 案例分析案例分析案例:中国税收增长的分析中国税收增长的分析提出问题提出问题改革开放以来,随着经济体制改革的深化和经济改革开放以来,随着经济体制改革的深化和经济的快速增长,中国的财政收支状况发生很大变化,的快速增长,中国的财政收支状况发生很大变化,为了研究影响中国税收收入增长的主要原因,分为了研究影响中国税收收入增长的主要原因,分析中央和地方税收收入的增长规律,预测中国税析中央和地方税收收入的增长规律,预测中国税收未来的增长趋势,需要建立计量经济模型。收未来的增长趋势,需要建立计量经济
23、模型。50影响中国税收收入增长的主要因素可能有:影响中国税收收入增长的主要因素可能有:(1)从宏观经济看,经济整体增长是税收增长的)从宏观经济看,经济整体增长是税收增长的基本源泉。基本源泉。(2)社会经济的发展和社会保障等都对公共财政)社会经济的发展和社会保障等都对公共财政提出要求,公共财政的需求对当年的税收收入可提出要求,公共财政的需求对当年的税收收入可能会有一定的影响。能会有一定的影响。(3)物价水平。中国的税制结构以流转税为主,)物价水平。中国的税制结构以流转税为主,以现行价格计算的以现行价格计算的GDP和经营者的收入水平都与和经营者的收入水平都与物价水平有关。物价水平有关。(4)税收政
24、策因素。)税收政策因素。理论分析理论分析51以以各项税收收入各项税收收入Y 作为被解释变量作为被解释变量以以GDP表示经济整体增长水平表示经济整体增长水平以财政支出表示公共财政的需求以财政支出表示公共财政的需求以以商品零售价格指数商品零售价格指数表示物价水平表示物价水平税收政策因素较难用数量表示税收政策因素较难用数量表示,暂时不予考虑暂时不予考虑建立模型建立模型52图中显示:1、比较平稳,变化不大;2、其它的变化逐年增长,特别是 更加明显。结论:不能用结论:不能用线性来处理。线性来处理。53线线性性化化处处理理54模型探索设定为模型探索设定为:其中:其中:各项税收收入(亿元)各项税收收入(亿元
25、)国内生产总值(亿元)国内生产总值(亿元)财政支出(亿元)财政支出(亿元)商品零售价格指数(商品零售价格指数(%)55参数估计:参数估计:EViews结果结果VariableCoefficientStd.Errort-StatisticProb.C-2.7553680.6400801-4.30472330.000210LNX20.45123350.14212833.174830200.003834LNX30.62713300.16156623.881584760.000636X40.01013580.00564491.795568270.084195R-squared0.98759065Mea
26、ndependentvar8.341376AdjustedR-squared0.98615880S.D.dependentvar1.357225S.E.ofregression0.15967566Akaikeinfocriterion-0.70777Sumsquaredresid0.66290423Schwarzcriterion-0.52095Loglikelihood14.6166758F-statistic689.7316D-Wstat0.61613625Prob(F-statistic)056模型估计的结果可表示为模型估计的结果可表示为 拟合优度:拟合优度:可决系数可决系数 较高,较高
27、,修正的可决系数修正的可决系数 也较高,也较高,结论:结论:表明模型拟合较好。表明模型拟合较好。57显著性检验显著性检验:F检验检验说明回归方程显著,即说明回归方程显著,即“国内生产总值国内生产总值”、“财政财政支出支出”、“商品零售物价指数商品零售物价指数”等变量等变量联合起来联合起来确确实对实对“税收收入税收收入”有显著影响。有显著影响。58说明在说明在5%的显著性水平下,表明国内生产总值、的显著性水平下,表明国内生产总值、财政支出对财政收入财政支出对财政收入分别都有分别都有显著影响。商品零显著影响。商品零售价格指数对财政收入售价格指数对财政收入没有没有显著影响。显著影响。显著性检验显著性
28、检验:t检验检验591 1、所估计的参数的符号与经济理论分析相一致、所估计的参数的符号与经济理论分析相一致2 2、在其他因素不变的情况下,当、在其他因素不变的情况下,当GDPGDP每增长每增长1%1%,税收收入将平均增长税收收入将平均增长0.4512%0.4512%;在其他因素不变的情况下,财政支出每增长在其他因素不变的情况下,财政支出每增长1%1%,税收收入将平均增长税收收入将平均增长0.6271%;0.6271%;在其他因素不变的情况下,在其他因素不变的情况下,商品零售物价指数每商品零售物价指数每增长增长1个百分点个百分点,平税收收入将平均增长平税收收入将平均增长0.0101%。经济检验及
29、偏回归系数的意义经济检验及偏回归系数的意义60预测预测1 1、估计标准误差估计标准误差2 2、预测、预测20102010年的税收收入:年的税收收入:已知已知20102010年我国的年我国的GDPGDP为为397983397983亿元,财政亿元,财政支出为支出为 8.96 8.96万亿元,商品零售价格指数为万亿元,商品零售价格指数为103.3%103.3%,则点预测为:,则点预测为:61 1.1.多元线性回归模型是将总体回归函数描述为一多元线性回归模型是将总体回归函数描述为一 个被解释变量与多个解释变量之间线性关系的个被解释变量与多个解释变量之间线性关系的 模型。模型。通常多元线性回归模型可以用
30、矩阵形式表示:通常多元线性回归模型可以用矩阵形式表示:2.2.多元线性回归模型中对随机扰动项多元线性回归模型中对随机扰动项u u的假定的假定:零零 均值假定、同方差假定、无自相关假定、随机均值假定、同方差假定、无自相关假定、随机 扰动与解释变量不相关假定、正态性假定、无扰动与解释变量不相关假定、正态性假定、无 多重共线性假定。多重共线性假定。第三章第三章 小结小结623.3.多元线性回归模型参数的最小二乘估计式及期多元线性回归模型参数的最小二乘估计式及期 望、方差和标准误差:望、方差和标准误差:4.4.在基本假定满足的条件下,多元线性回归模型在基本假定满足的条件下,多元线性回归模型 最小二乘估
31、计式是最佳线性无偏估计式。最小二乘估计式是最佳线性无偏估计式。635.多元线性回归模型中参数区间估计的方法。多元线性回归模型中参数区间估计的方法。6.多重可决系数的意义和计算方法:多重可决系数的意义和计算方法:修正可决系数的作用和方法:修正可决系数的作用和方法:647.F检验是对多元线性回归模型中所有解释变量联检验是对多元线性回归模型中所有解释变量联合显著性的检验,合显著性的检验,F检验是在方差分析基础上进检验是在方差分析基础上进行的。行的。658.多元回归分析中,为了分别检验当其它解释变多元回归分析中,为了分别检验当其它解释变量不变时,各个解释变量是否对被解释变量有量不变时,各个解释变量是否对被解释变量有显著影响,需要分别对所估计的各个回归系数显著影响,需要分别对所估计的各个回归系数作作t检验。检验。669.9.利用多元线性回归模型作被解释变量平均值预利用多元线性回归模型作被解释变量平均值预 测与个别值预测的方法。测与个别值预测的方法。点预测:点预测:平均值:平均值:个别值:个别值:67第第 三三 章章 结结 束了!束了!68此课件下载可自行编辑修改,仅供参考!此课件下载可自行编辑修改,仅供参考!感谢您的支持,我们努力做得更好!谢谢感谢您的支持,我们努力做得更好!谢谢
限制150内