最新应用统计学多重线性回归模型PPT课件.ppt
《最新应用统计学多重线性回归模型PPT课件.ppt》由会员分享,可在线阅读,更多相关《最新应用统计学多重线性回归模型PPT课件.ppt(82页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、应用统计学多重线性回归应用统计学多重线性回归模型模型重庆交通大学管理学院*17 十一月 2022v内内 容容 提提 要要模型简介模型简介简单实例分析简单实例分析逐步回归逐步回归残差分析残差分析模型进一步诊断与修正模型进一步诊断与修正小结小结重庆交通大学管理学院*17 十一月 2022重庆交通大学管理学院*17 十一月 2022重庆交通大学管理学院*17 十一月 2022重庆交通大学管理学院*17 十一月 2022重庆交通大学管理学院*17 十一月 2022重庆交通大学管理学院*17 十一月 2022重庆交通大学管理学院*17 十一月 2022简单分析实例简单分析实例重庆交通大学管理学院*17
2、十一月 2022简单分析实例简单分析实例重庆交通大学管理学院*17 十一月 2022简单分析实例简单分析实例结果分析结果分析v 给给出出了了自自变变量量进进入入模模型型的的方方式式,此此处处尚尚未未涉涉及及变变量量筛筛选选问问题题,因因为为两两个个变变量量是是被被强强行行纳纳入入模模型型的的(MethodMethod为为EnterEnter),当然就不存在剔除变量的事情了。),当然就不存在剔除变量的事情了。重庆交通大学管理学院*17 十一月 2022简单分析实例简单分析实例结果分析结果分析v 模型拟合优度情况的检验,结果显示,复相关系数为模型拟合优度情况的检验,结果显示,复相关系数为0.840
3、0.840,决定系数为,决定系数为0.7060.706,调整的决定系数为,调整的决定系数为0.6860.686,还,还输出了剩余标准差。输出了剩余标准差。重庆交通大学管理学院*17 十一月 2022简单分析实例简单分析实例结果分析结果分析v 回回归归模模型型的的假假设设检检验验结结果果,显显示示F F34.808,P P 33的观测为异常值。的观测为异常值。探测自变量中强影响点:杠杆值探测自变量中强影响点:杠杆值,hij,hij大于大于2 2或或3 3倍的平均值倍的平均值即为异常;库克距离即为异常;库克距离11为异常;标准化回归系数和标准化为异常;标准化回归系数和标准化预测值的变化;预测值的变
4、化;模型的进一步诊断与修正模型的进一步诊断与修正重庆交通大学管理学院*17 十一月 2022v强影响点的处理强影响点的处理模型的进一步诊断与修正模型的进一步诊断与修正 考虑是否录入错误,如果是,予以改正;否则予以删考虑是否录入错误,如果是,予以改正;否则予以删除强影响点记录;除强影响点记录;进行稳健回归,如最小一乘法和加权最小二乘法;进行稳健回归,如最小一乘法和加权最小二乘法;进行非参数回归及变量变换等。进行非参数回归及变量变换等。重庆交通大学管理学院*17 十一月 2022v多重共线性的识别多重共线性的识别模型的进一步诊断与修正模型的进一步诊断与修正多重共线性:是指自变量间存在相关关系,即一
5、个自变量可以用其他一多重共线性:是指自变量间存在相关关系,即一个自变量可以用其他一个或几个自变量的线性表达式进行表示。有以下表现形式:个或几个自变量的线性表达式进行表示。有以下表现形式:整个模型的方差分析结果为整个模型的方差分析结果为PP P ;专业上认为应该有统计学意义的自变量检验结果却无统计学意义;专业上认为应该有统计学意义的自变量检验结果却无统计学意义;自变量的偏回归系数取值大小甚至符号明显与实际情况违背,难以自变量的偏回归系数取值大小甚至符号明显与实际情况违背,难以解释;解释;增加或删除一条记录或一个自变量,偏回归系数发生很大变化。增加或删除一条记录或一个自变量,偏回归系数发生很大变化
6、。重庆交通大学管理学院*17 十一月 2022v多重共线性的识别多重共线性的识别模型的进一步诊断与修正模型的进一步诊断与修正可以通过可以通过statistics statistics 子对话框中的子对话框中的Collinearity Collinearity Diagnostics Diagnostics 复选框予以实现。其中提供了以下统计量:复选框予以实现。其中提供了以下统计量:容忍度容忍度 方差膨胀因子方差膨胀因子 条件指数条件指数 变异构成变异构成重庆交通大学管理学院*17 十一月 2022容忍度容忍度(Toli=1-Ri2)(Toli=1-Ri2):Ri2Ri2是自变量是自变量xixi
7、与其他自变量间与其他自变量间的决定系数。的决定系数。方差膨胀因子(方差膨胀因子(VIF=1/ToliVIF=1/Toli)1010,表明共线性严重,表明共线性严重特征根特征根:最大特征根远远大于其他特征根,说明自:最大特征根远远大于其他特征根,说明自变量间有大量的信息重叠。变量间有大量的信息重叠。条件指数条件指数ki=SQRTki=SQRT(m/i m/i):):1010,表明存在,表明存在共线性。共线性。模型的进一步诊断与修正模型的进一步诊断与修正重庆交通大学管理学院*17 十一月 2022v多重共线性的识别(例多重共线性的识别(例2分析结果)分析结果)模型的进一步诊断与修正模型的进一步诊断
8、与修正重庆交通大学管理学院*17 十一月 2022v多重共线性的处理多重共线性的处理模型的进一步诊断与修正模型的进一步诊断与修正增加样本量增加样本量逐步回归(当共线性很严重时,仍然不行)逐步回归(当共线性很严重时,仍然不行);岭回归(岭回归(RidgeRegression,为有偏估计)为有偏估计);主成分回归主成分回归;路径分析。路径分析。重庆交通大学管理学院*17 十一月 2022小小结结v回归模型的建立步骤回归模型的建立步骤回归分析已经被应用的非常广泛,作为一个严肃的统计学模型,它有着自己严格的适用条件,在拟合时需要不断进行这些适用条件的判断。但是,许多使用者往往忽视了这一点,只是把模型做
9、完就好了。这不仅浪费信息,更有可能得出错误的结论。这里给出一个比较合适的回归分析操作步骤,供大家参考。重庆交通大学管理学院*17 十一月 2022小小结结v回归模型的建立步骤回归模型的建立步骤 绘制散点图,观察变量间的趋势。(不能随意省略)考察数据分布,进行必要的预处理。进行直线回归分析。残差分析。(最重要和直观的方法是图示法)强影响点的诊断和多重共线性的判断。重庆交通大学管理学院*17 十一月 2022小小结结建立一个“完美”的多重线性回归模型是一个需要反复进行的过程,不能指望一蹴而就。重庆交通大学管理学院*17 十一月 2022基本操作:Analyze-Regression-LinearD
10、ependent:Dependent:因变量因变量Independent:Independent:自变量自变量Method:Method:自变量筛选方法自变量筛选方法,默认为默认为EnterEnterBlock:Block:不同变量有不同筛选方法时可定义不同变量有不同筛选方法时可定义BlockBlockSelection Variable:Selection Variable:变量值满足条件的样本才参与分析变量值满足条件的样本才参与分析Case Labels:Case Labels:指定图示中数据点的标志变量指定图示中数据点的标志变量重庆交通大学管理学院*17 十一月 2022重庆交通大学管理
11、学院*17 十一月 2022重庆交通大学管理学院*17 十一月 2022重庆交通大学管理学院*17 十一月 2022重庆交通大学管理学院*17 十一月 2022重庆交通大学管理学院*17 十一月 2022对于呈非线性关系的变量之间的统计关系进行大体估计对于呈非线性关系的变量之间的统计关系进行大体估计(但经变量变换可转化为线性关系(但经变量变换可转化为线性关系本质线性关系)。本质线性关系)。绘制拟合曲线并进行预测。绘制拟合曲线并进行预测。做为线性回归分析的预分析步骤:选择变量变换的方法。做为线性回归分析的预分析步骤:选择变量变换的方法。曲线估计曲线估计重庆交通大学管理学院*17 十一月 2022
12、常用的几种非线性模型(一)抛物线模型(一)抛物线模型(二次曲线模型二次曲线模型)具体形式为:具体形式为:式中式中00、1 1 和和2 2 为待估计参数。为待估计参数。判断某种现象是否适合应用抛物线,可以利用判断某种现象是否适合应用抛物线,可以利用“差分法差分法”。其步骤如下:首先将样本。其步骤如下:首先将样本观察值按观察值按X X 的大小顺序排列,然后按以下两式计算的大小顺序排列,然后按以下两式计算X X 和和Y Y 的一阶差分的一阶差分XtXt、Yt Yt 以以及及Y Y 的二阶差分的二阶差分Y2tY2t。Xt=Xt-Xt-1;Yt=Yt-Yt-1Xt=Xt-Xt-1;Yt=Yt-Yt-1
13、Y2t=Yt-Yt-1 Y2t=Yt-Yt-1当当Xt Xt 接近于一常数,而接近于一常数,而Y2t Y2t 的绝对值接近于常数时,的绝对值接近于常数时,Y Y 与与X X 之间的关系可以用之间的关系可以用抛物线模型近似加以反映。抛物线模型近似加以反映。重庆交通大学管理学院*17 十一月 2022(二)双曲线模型假如假如Y Y 随着随着X X 的增加而增加(或减少),最初增加(或的增加而增加(或减少),最初增加(或减少)很快,以后逐渐放慢并趋于稳定,则可以选用双减少)很快,以后逐渐放慢并趋于稳定,则可以选用双曲线来拟合。双曲线模型形式是:曲线来拟合。双曲线模型形式是:Y=0+1(1/X)+Y=
14、0+1(1/X)+重庆交通大学管理学院*17 十一月 2022(三)幂函数模型(三)幂函数模型幂函数模型的一般形式是:幂函数模型的一般形式是:这类函数的优点在于:方程中的参数可以直接反映因变量这类函数的优点在于:方程中的参数可以直接反映因变量Y Y 对于某对于某一个自变量的弹性。一个自变量的弹性。所谓所谓Y Y 对于对于Xj Xj 的弹性,是指在其他情况不变的条件下,的弹性,是指在其他情况不变的条件下,Xj Xj 变动变动时所引起时所引起Y Y 变动的百分比。变动的百分比。弹性是一个无量纲的数值,它是经济弹性是一个无量纲的数值,它是经济定量分析中常用的一个尺度。它在生产函数分析和需求函数分析中
15、,定量分析中常用的一个尺度。它在生产函数分析和需求函数分析中,得到了广泛的应用。得到了广泛的应用。重庆交通大学管理学院*17 十一月 2022(四)指数函数模型指数函数模型为:指数函数模型为:这种曲线被广泛应用于描述社会经济现象的变动趋势。例如产值、产这种曲线被广泛应用于描述社会经济现象的变动趋势。例如产值、产量按一定比率增长量按一定比率增长,成本、原材料消耗按一定比例降低。成本、原材料消耗按一定比例降低。重庆交通大学管理学院*17 十一月 2022(五)逻辑曲线模型逻辑曲线的方程式如下:逻辑曲线的方程式如下:逻辑曲线具有以下性质。逻辑曲线具有以下性质。Y Y 是是X X 的非减函数,开始时随
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 最新 应用 统计学 多重 线性 回归 模型 PPT 课件
限制150内