多元回归分析 (2)精选PPT.ppt
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_05.gif)
《多元回归分析 (2)精选PPT.ppt》由会员分享,可在线阅读,更多相关《多元回归分析 (2)精选PPT.ppt(65页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、关于多元回归分析(2)第1页,讲稿共65张,创作于星期日2023/4/22第2页,讲稿共65张,创作于星期日2023/4/23l多元线性回归模型、回归方程与估计的回归方程多元线性回归模型、回归方程与估计的回归方程l回归方程的拟合优度与显著性检验回归方程的拟合优度与显著性检验l多重共线性问题及其处理多重共线性问题及其处理l利用回归方程进行预测利用回归方程进行预测l虚拟自变量的回归虚拟自变量的回归l用用Excel和和SPSS进行回归分析进行回归分析学习目标第3页,讲稿共65张,创作于星期日42023/4/2身高受那些因素影响?决决定定身身高高的的因因素素是是什什么么?父父母母遗遗传传、生生活活环环
2、境境、体体育育锻锻炼炼,还还是以上各因素的共同作用是以上各因素的共同作用2004年年12月月,中中国国人人民民大大学学国国民民经经济济管管理理系系02级级的的两两位位学学生生,对对人人大大在在校校生生进进行行了了问问卷卷调调查查。问问卷卷采采取取随随机机发发放放、当当面面提提问当场收回问当场收回调调查查的的样样本本量量为为98人人,男男性性55人人,女女性性43人人。调调查查内内容容包包括括被被调调查查者者的的身身高高(单单位位:cm)、性性别别、其其父父母母身身高高、是是否否经经常常参参加加体体育育锻锻炼炼、家家庭庭所所在在地地是是在在南南方方还还是是在在北北方方等等等等。部部分分数数据据如
3、如下下页的表所示页的表所示(1代表男性,代表男性,0代表女性代表女性)父父亲亲身身高高、母母亲亲身身高高、性性别别是是不不是是影影响响子子女女身身高高的的主主要要因因素素呢呢?如如果果是是,子子女女身身高高与与这这些些因因素素之之间间能能否否建建立立一一个个线线性性关关系方程,并根据这一方程对身高做出预测?系方程,并根据这一方程对身高做出预测?这就是本章将要讨论的多元线性回归问题这就是本章将要讨论的多元线性回归问题 第4页,讲稿共65张,创作于星期日2023/4/25子女子女身高身高父亲父亲身高身高母亲母亲身高身高子女子女性别性别子女子女身高身高父亲父亲身高身高母亲母亲身高身高子女子女性别性别
4、17116615811551651570174171158116118216501771791681166166156017817416011701781600180173162115817316001811701601160170165015916815311601711500169168153116216715801701701671165175160017017016011681721620调查数据单位:单位:cm0:女:女1:男:男第5页,讲稿共65张,创作于星期日2023/4/26 一、回归模型与回归方程 二、参数的最小二乘估计第6页,讲稿共65张,创作于星期日2023/4/27一、
5、回归模型与回归方程第7页,讲稿共65张,创作于星期日2023/4/28l一个因变量与两个及两个以上自变量的回归一个因变量与两个及两个以上自变量的回归l描描述述因因变变量量 y 如如何何依依赖赖于于自自变变量量 x1,x2,xk 和和误差项误差项 的方程,称为多元回归模型的方程,称为多元回归模型l涉涉及及 k 个自变量的多元线性回归模型可表示为个自变量的多元线性回归模型可表示为多元回归模型(multiple linear regression model)0 ,1 1,k是参数是参数 是被称为误差项的随机变量是被称为误差项的随机变量 y 是是x1,x2 ,xk 的线性函数加上误差项的线性函数加上
6、误差项 包含在包含在y里面但不能被里面但不能被k个自变量的线性关系所解个自变量的线性关系所解 释的变异性释的变异性第8页,讲稿共65张,创作于星期日2023/4/29l正正态态性性。误误差差项项是是一一个个服服从从正正态态分分布布的的随随机机变变量量,且期望值为且期望值为0,即,即N(0,2)l方方差差齐齐性性。对对于于自自变变量量x1,x2,xk的的所所有有值值,的的方差方差 2都相同都相同l独独立立性性。对对于于自自变变量量x1,x2,xk的的一一组组特特定定值值,它它所对应的所对应的 与任意一组其他值所对应的不相关与任意一组其他值所对应的不相关多元回归模型的基本假定 第9页,讲稿共65张
7、,创作于星期日2023/4/2101.描描述述因因变变量量 y 的的平平均均值值或或期期望望值值如如何何依依赖赖于于自自变变量量 x1,x2,xk的方程的方程2.多多元线性回归方程的形式为元线性回归方程的形式为 E(y)=0+1 x1+2 x2+k xk多元线性回归方程(multiple linear regression equation)1 1,k称为偏回归系数称为偏回归系数 i 表示假定其他变量不变,当表示假定其他变量不变,当 xi 每变动一个单位每变动一个单位 时,时,y 的平均变动值的平均变动值第10页,讲稿共65张,创作于星期日2023/4/211l用样本统计量用样本统计量 估计回
8、归方程中估计回归方程中的的 参数参数 时得到的方程时得到的方程l由最小二乘法求得由最小二乘法求得l一般形式为一般形式为 估计的多元线性回归方程(estimated multiple linear regression equation)是是 估计值估计值 是是 y 的估计值的估计值第11页,讲稿共65张,创作于星期日2023/4/212二、参数的最小二乘估计第12页,讲稿共65张,创作于星期日2023/4/213参数的最小二乘估计参数的最小二乘估计求求解解各回归参数的标准方程如下各回归参数的标准方程如下使使因因变变量量的的观观察察值值与与估估计计值值之之间间的的离离差差平平方方和和达达到到最小
9、来求得最小来求得 。即。即第13页,讲稿共65张,创作于星期日2023/4/214参数的最小二乘法(例题分析)【例例】一一家家大大型型商商业业银银行行在在多多个个地地区区设设有有分分行行,为为弄弄清清楚楚不不良良贷贷款款形形成成的的原原因因,抽抽取取了了该该银银行行所所属属的的25家家分分行行2002年年的的有有关关业业务务数数据据。试试建建立立不不良良贷贷款款y与与贷贷款款余余额额x1、累累计计应应收收贷贷款款x2、贷贷款款项项目目个个数数x3和和固固定定资资产产投投资资额额x4的的线线性性回回归归方方程程,并并解解释各回归系数的含义释各回归系数的含义 用用Excel进行回归进行回归第14页
10、,讲稿共65张,创作于星期日2023/4/215数据表第15页,讲稿共65张,创作于星期日2023/4/216参数的最小二乘估计(例题分析)F F检验检验检验检验t t 检验检验检验检验偏回归系数偏回归系数偏回归系数偏回归系数第16页,讲稿共65张,创作于星期日2023/4/217第17页,讲稿共65张,创作于星期日2023/4/218一、回归方程的拟合优度第18页,讲稿共65张,创作于星期日2023/4/219变差分解xy 来自回归(系统影响)来自残差(随机影响)第19页,讲稿共65张,创作于星期日2023/4/220变差平方和关系平方和关系:平方和关系:SST=SSR+SSE自由度关系:自
11、由度关系:n-1=k+(n-k-1)总平方和总平方和(SST)自由度:自由度:n-1 回归平方回归平方(SSR)自由度:自由度:k残差平方和残差平方和(SSE)自由度:自由度:n-k-1 第20页,讲稿共65张,创作于星期日2023/4/221l回归平方和占总平方和的比例回归平方和占总平方和的比例l计算公式为计算公式为l因因变变量量取取值值的的变变差差中中,能能被被估估计计的的多多元元回回归归方方程程所解释的比例所解释的比例 多重判定系数(multiple coefficient of determination)第21页,讲稿共65张,创作于星期日2023/4/222l用样本量用样本量n n
12、和自变量的个数和自变量的个数k k去修正去修正R R2 2得到得到 l计算公式为计算公式为l避免增加自变量而高估避免增加自变量而高估 R R2 2l意义与意义与 R R2 2类似类似l数值小于数值小于R R2 2修正多重判定系数(adjusted multiple coefficient of determination)用用Excel进行回归进行回归第22页,讲稿共65张,创作于星期日2023/4/223多重相关系数(multiple correlation coefficient)多重判定系数的平方根多重判定系数的平方根R反映因变量反映因变量y与与k个自变量之间的相关程度个自变量之间的相关
13、程度实实际际上上R度度量量的的是是因因变变量量的的观观测测值值 与与由由多多元元回回归归方方程程得得到到的的预预测测值值 之之间间的的关关系系强强度度,即即多多重重相相关关系系数数R等等于于因因变变量量的的观观测测值值 与与估估计计值值 之间的简单相关系数之间的简单相关系数即:即:(一元相关系数一元相关系数r也是如此,也是如此,即即 。读者自己去验证。读者自己去验证)第23页,讲稿共65张,创作于星期日2023/4/224l对误差项对误差项 的标准差的标准差 的的一个估计值一个估计值l衡量多元回归方程的拟合优度衡量多元回归方程的拟合优度l计算公式为计算公式为估计标准误差 Se 用用Excel进
14、行回归进行回归第24页,讲稿共65张,创作于星期日2023/4/225二、显著性检验第25页,讲稿共65张,创作于星期日2023/4/226l检检验验因因变变量量与与所所有有自自变变量量之之间间的的线线性性关关系系是是否否显显著著l也被称为总体的显著性检验也被称为总体的显著性检验l检检验验方方法法是是将将回回归归均均方方(MSR)同同残残差差均均方方(MSE)加加以以比比较较,运运用用 F 检检验验来来分分析析二二者者之之间间的的差差别别是是否显著否显著l如如果果是是显显著著的的,因因变变量量与与自自变变量量之之间间存存在在线线性性关关系系l如果不显著,因变量与自变量之间不存在线性关系如果不显
15、著,因变量与自变量之间不存在线性关系线性关系检验第26页,讲稿共65张,创作于星期日2023/4/2271.1.提出提出假设假设H0:1 2 k=0 线性关系不显著线性关系不显著H1:1,2,k至少有一个不等于至少有一个不等于0线性关系检验2.计算计算检验统计量检验统计量F3.确定确定显著性水平显著性水平 和分子自由度和分子自由度k、分母自由度、分母自由度n-k-1找出临找出临 界值界值F 4.作出作出决策:若决策:若FF ,拒绝,拒绝H0第27页,讲稿共65张,创作于星期日2023/4/228l线线性性关关系系检检验验通通过过后后,对对各各个个回回归归系系数数有有选选择择地地进进行行一次或多
16、次检验一次或多次检验l究究竟竟要要对对哪哪几几个个回回归归系系数数进进行行检检验验,通通常常需需要要在在建建立立模模型型之之前作出决定前作出决定l对对回回归归系系数数检检验验的的个个数数进进行行限限制制,以以避避免免犯犯过过多多的的第第类类错误错误(弃真错误弃真错误)l对每一个自变量都要单独进行检验对每一个自变量都要单独进行检验l应用应用 t t 检验统计量检验统计量回归系数的检验第28页,讲稿共65张,创作于星期日2023/4/2291.提出假设提出假设H0:(自变量自变量 xi 与与 因变量因变量 y 没有线性关系没有线性关系)H1:(自变量自变量 xi 与与 因变量因变量 y有线性关系有
17、线性关系)2.计算检验的统计量计算检验的统计量 t回归系数的检验(步骤)3.确定显著性水平确定显著性水平,并进行决策,并进行决策 t t ,拒绝,拒绝H0;t t ,不拒绝,不拒绝H0第29页,讲稿共65张,创作于星期日2023/4/230l回归系数在回归系数在(1-(1-)%)%置信水平下的置信区间为置信水平下的置信区间为l 回归系数的推断(置信区间)回归系数的抽样标准差回归系数的抽样标准差自由度第30页,讲稿共65张,创作于星期日2023/4/231第三节 多重共线性及其处理一、多重共线性及其识别二、变量选择与逐步回归第31页,讲稿共65张,创作于星期日2023/4/232一、多重共线性及
18、其识别第32页,讲稿共65张,创作于星期日2023/4/2331.回归模型中两个或两个以上的自变量彼此相关回归模型中两个或两个以上的自变量彼此相关2.多重共线性带来的问题有多重共线性带来的问题有 l可可能能会会使使回回归归的的结结果果造造成成混混乱乱,甚甚至至会会把把分分析析引入歧途引入歧途,F检验显著,检验显著,t检验不显著检验不显著l可可能能对对参参数数估估计计值值的的正正负负号号产产生生影影响响,特特别别是是各各回回归归系系数数的的正正负负号号有有可可能能同同预预期期的的正正负负号号相相反反 l参参数数估估计计量量的的方方差差变变大大,参参数数检检验验有有可可能能失失效效,有些回归系数通
19、不过显著性检验有些回归系数通不过显著性检验多重共线性(multicollinearity)第33页,讲稿共65张,创作于星期日2023/4/2341.检检测测多多重重共共线线性性的的最最简简单单的的一一种种办办法法是是计计算算模模型型中中各各对对自自变变量量之间的相关系数,并对各相关系数进行显著性检验之间的相关系数,并对各相关系数进行显著性检验若若有有一一个个或或多多个个相相关关系系数数显显著著,就就表表示示模模型型中中所所用用的的自变量之间相关,存在着多重共线性自变量之间相关,存在着多重共线性2.如果出现下列情况,暗示存在多重共线性(如果出现下列情况,暗示存在多重共线性(经验判断经验判断)l
20、模型中各对自变量之间显著相关模型中各对自变量之间显著相关l当当模模型型的的线线性性关关系系检检验验(F检检验验)显显著著时时,几几乎乎所所有有回回归归系系数数的的t检验却不显著检验却不显著 l回归系数的正负号与预期的相反回归系数的正负号与预期的相反多重共线性的识别第34页,讲稿共65张,创作于星期日2023/4/2351.将一个或多个相关的自变量从模型中剔除,使保将一个或多个相关的自变量从模型中剔除,使保 留的自变量尽可能不相关留的自变量尽可能不相关2.如果要在模型中保留所有的自变量,则应如果要在模型中保留所有的自变量,则应l避免根据避免根据 t 统计量对单个参数进行检验统计量对单个参数进行检
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 多元回归分析 2精选PPT 多元 回归 分析 精选 PPT
![提示](https://www.taowenge.com/images/bang_tan.gif)
限制150内