第七章多元回归分析.ppt
《第七章多元回归分析.ppt》由会员分享,可在线阅读,更多相关《第七章多元回归分析.ppt(47页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、第七章多元回归分析现在学习的是第1页,共47页v在许多经济问题中,一元线性回归只不过是回归分析中的一种特例,它通常是对影响某种经济现象的许多因素进行了简化考虑的结果。v若某公司管理人员要预测来年该公司的销售额y时,研究认为影响销售额的因素不只是广告宣传费x1,还有个人可支配收入x2,价格x3,研究与发展费用x4,各种投资x5,销售费用x6.v因此我们需要进一步讨论多元回归问题。现在学习的是第2页,共47页v第一节 多元线性回归v第二节 可化为多元线性回归的问题v第三节 自变量的选择与逐步回归现在学习的是第3页,共47页第一节 多元线性回归v多元线性回归模型一般形式 其中,是p+1个未知参数,为
2、回归常数,为回归系数。y称为被解释变量,,,是p个可以精确测量并可以控制的一般变量,称为解释变量现在学习的是第4页,共47页对一实际问题,若得到n组观测数据(,;),i=1,2,n,则线性模型可表示为:现在学习的是第5页,共47页v写成矩阵形式 y1 1 x11 x21 x1p Y=y2 x=1 x12 x22 x2p yn 1 x1n x2n xnp 1 2 e=nv则 Y=X+e现在学习的是第6页,共47页v一、多元线性回归模型的基本假定v解释变量x1,x2,xp是确定性变量,不是随机变量,而且rk(X)=P+1F,拒绝H0,表明回归总体有显著性关系.若Ft /2,说明拒绝原假设 若tt
3、/2,则接受原假设.现在学习的是第14页,共47页v当有多个自变量对因变量y无显著影响时,可以剔除多余变量,但由于自变量间的交互作用,不能一次剔除所有不显著变量。一般是将t值(绝对值)最小的变量删除掉,每次只剔除1个变量,再对求得的新的回归方程进行检验,直到保留的变量都对y有显著影响为止。返回现在学习的是第15页,共47页v3.拟合优度v拟合优度用于检验回归方程对样本观测值的拟合程度。样本决定系数 的取值在(0,1)区间内,越接近1,回归拟合的效果越好;越接近0,回归拟合的效果越差。现在学习的是第16页,共47页v四、复相关系数和偏相关系数v复相关系数R是由SSR和SST构造的统计量,用来表示
4、回归方程对原有数据拟合程度的好坏,衡量作为一个整体的x1,x2,xp与y的线性关系的大小。现在学习的是第17页,共47页v复相关系数表示的是因变量与全体自变量之间的线性关系,它的符号不能由某一自变量的回归系数的符号来确定,因而复相关系数都取正号。现在学习的是第18页,共47页v其它变量被固定后,计算任意两个变量之间的相关系数,这种相关系数称为偏相关系数。现在学习的是第19页,共47页v简单相关系数只是一种数量表面上的相关系数,而并非本质的东西。在多元回归分析中,偏相关系数才真正反映因变量y与自变量 以及自变量 与 的相关性的数量。v返回现在学习的是第20页,共47页v五、预测v所谓预测就是给定
5、解释变量一组值 通过建立的多元回归模型,估计出对应的v1、y0的点预测:v2、y0以概率(1-)落在某区间的区间预测:其中 为随机误差项的标准差现在学习的是第21页,共47页第二节 可化为多元线性回归的问题在自然科学中,y关于x 的数量关系多数都不是简单的线性关系,而是各种各样的非线性关系,于是我们常会遇到非线性回归模型,在非线性回归模型中,一种类型是可以通过变量变换化为线性模型,然后按线性模型加以解决;另一种类型的非线性模型是用任何变量变换办法都不能或不方便直接化为线性模型求得参数的估计值。现在学习的是第22页,共47页v多项式函数vY=0+1x+2x2+pxpv设i=xiv则多项式化为:Y
6、=0+1 1+2 2+p pv多元幂函数 y=x1 1 x2 2 xp p lny=ln +1ln x1+pln xp 令z=lny,0=ln ,i=ln xi z=0+1 1+2 2+p p现在学习的是第23页,共47页v指数函数 y=ae ixi y=a+1x1+2x2+pxp z=y,0=a,则 z=0+1x1+2x2+pxpv多元对数函数 y=a+1x1+2x2+pxp 设i=xi,则 y=a+1 1+2 2+p p 现在学习的是第24页,共47页v指数函数与幂函数的积 y=aexp ixi xibi y=a+1x1+2x2+pxp +b1x1+b2x2+bpxp 令z=y,0=a,i
7、=xi z=0+1x1+2x2+pxp+b1 1+b2 2+bp p现在学习的是第25页,共47页v如果自变量相邻数值之间大小间隔相等,而且相邻样本点对应的因变量y的二次差分大致相同,则该总体可配合二次多项式函数v如果是三次差分大致相同,则可配合三次多项式函数现在学习的是第26页,共47页第三节 自变量选择与逐步回归v在建立一个实际问题的回归模型,我们应该如何确定回归自变量。v如果遗漏了某些重要的变量,回归方程的效果肯定不好。v如果考虑过多的变量,在这些变量中有些自变量对问题研究可能不重要,有些变量可能与其它变量有很大程度的重叠。如果模型把这些变量也引入的话,不仅计算量增大,而且得到的回归方程
8、的稳定性也很差,直接影响了回归方程的应用。现在学习的是第27页,共47页v在实际应用中,希望拟合这样一个模型,它既能较好的反映问题的本质,又包含尽可能少的自变量。这两个方面的一个适当折中就是回归方程的选取问题,其基本思想是在一定的准则下选取对因变量影响较为显著的自变量,建立一个既合理又简单实用的回归模型。现在学习的是第28页,共47页v在前面,我们认为残差平方和 最小和复相关系数 来衡量回归拟合的好坏。v因为当引入的自变量的个数增大时,残差平方和随之减少,而复相关系数也随之增大。因此如果按上述原则来选择自变量,不论什么变量多取就行。但是由于变量之间的多重共显性,给自变量的估计值带来了不稳定性,
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 第七 多元 回归 分析
限制150内