古典回归模型下讲稿.ppt
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_05.gif)
《古典回归模型下讲稿.ppt》由会员分享,可在线阅读,更多相关《古典回归模型下讲稿.ppt(39页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、古典回归模型下第一页,讲稿共三十九页哦第三节第三节 回归模型的统计检验回归模型的统计检验 回归分析中主要是通过一些统计检验方法来保回归分析中主要是通过一些统计检验方法来保证模型在统计意义上(即以样本推断总体)的可证模型在统计意义上(即以样本推断总体)的可靠性。靠性。一、一、模型的拟合优度检验模型的拟合优度检验 所谓所谓“拟合优度拟合优度”,即模型对样本数据的近似程度,即模型对样本数据的近似程度(回归直线与样本数据趋势的吻合程度),常用判定系数反映。,常用判定系数反映。第二页,讲稿共三十九页哦1 1总平方和分解公式总平方和分解公式222)()(iiieyyyy(2-6)上式记成上式记成 TSS
2、=ESS +RSS其中,其中,TSS称为总平方和(或总离差平方和),称为总平方和(或总离差平方和),ESS称为回归称为回归平方和(或可解释的平方和),平方和(或可解释的平方和),RSS称为残差平方和(或剩余称为残差平方和(或剩余平方和)。平方和)。(2-62-6)式称为总平方和分解公式)式称为总平方和分解公式 第三页,讲稿共三十九页哦yyiYiiiiyyeyyyiyixyeyyyy第四页,讲稿共三十九页哦如果如果Y Yi i=i i 即实际观测值落在样本回归即实际观测值落在样本回归“线线”上,则拟合最好上,则拟合最好。可认为,。可认为,“离差离差”全部来自回归线,而与全部来自回归线,而与“残差
3、残差”无关。无关。第五页,讲稿共三十九页哦2 2判定系数判定系数R R2 2:用用回归平方和回归平方和(ESS)(ESS)占总平方和占总平方和(TSS)(TSS)的比重的比重作为衡量模型对样作为衡量模型对样本拟合优度的指标,该指标称为判定系数(或可决系数),用符本拟合优度的指标,该指标称为判定系数(或可决系数),用符号号R2表示,即表示,即 (2-7)显然,显然,0 R21,R2的值越接近于的值越接近于1,则表明模型对样本数据的,则表明模型对样本数据的拟合优度越高。拟合优度越高。判定系数不仅反映了拟合程度的优劣,而且有直观的判定系数不仅反映了拟合程度的优劣,而且有直观的经济含经济含义:义:它定
4、量地描述了它定量地描述了y 的变化中可以用解释变量的变化来说明的的变化中可以用解释变量的变化来说明的部分,即模型的可解释程度。部分,即模型的可解释程度。22222)(11)()(yyeTSSRSSyyyyTSSESSRiiii判定系数是一个非负的统计量判定系数是一个非负的统计量,随着抽样的不同而不同。随着抽样的不同而不同。第六页,讲稿共三十九页哦 调整判定系数调整判定系数:判定系数受解释变量判定系数受解释变量X的个数的个数k的影响,的影响,在在k的的个数不同的模型之间进行比较时,判定系数必须进行调整个数不同的模型之间进行比较时,判定系数必须进行调整。调整的思路是。调整的思路是:将残差平方和与总
5、离差平方和分别除以各自的将残差平方和与总离差平方和分别除以各自的自由度,以剔除变量个数对拟合优度的影响。自由度,以剔除变量个数对拟合优度的影响。在一定程度上避在一定程度上避免将影响微弱的变量错误地加入到模型中。)免将影响微弱的变量错误地加入到模型中。)除了调整的判定系数除了调整的判定系数 之外,人们还使用另外两个指标之外,人们还使用另外两个指标SCSC(Schwarz CriterionSchwarz Criterion,施瓦兹准则施瓦兹准则)和)和AIC AIC(Akaike(Akaike Information CriterionInformation Criterion,赤池信息准则赤池
6、信息准则)来比较含有不同解释来比较含有不同解释变量个数模型的拟合优度:变量个数模型的拟合优度:)1(111)1/()1/(122RknnnTSSknRSSR2RnnkneSCiln1)ln(2nkneAICi)1(2)ln(2其值越小表明模型的拟合优度越高其值越小表明模型的拟合优度越高。第七页,讲稿共三十九页哦二、模型的显著性检验二、模型的显著性检验 模型的显著性检验,就是检验模型对总体的近似程度。最常用模型的显著性检验,就是检验模型对总体的近似程度。最常用的检验方法是的检验方法是F检验。检验。1 1F F检验检验 对于多元线性回归模型对于多元线性回归模型 假设假设H0:b1=b2=bk=0
7、在原假设成立的情况下,可以证明:在原假设成立的情况下,可以证明:ikikiiixbxbxbby22110)1,(1/)(22knkFknekyyFii 对于给定的显著水平对于给定的显著水平,可由,可由F分布表查得临界值分布表查得临界值F(注意(注意是单侧检验):是单侧检验):第八页,讲稿共三十九页哦若若F F,则拒绝,则拒绝H0,可以认为模型的线性关系是显著的,可以认为模型的线性关系是显著的;(一;(一般在软件回归结果里用般在软件回归结果里用P值决策)值决策)若若F 时,便有时,便有F FF F 。注意:注意:F F检验是一个联合检验,即使所有的检验是一个联合检验,即使所有的t t统计量都是不
8、显著的统计量都是不显著的,F F统计量也可能是显著的。统计量也可能是显著的。2211/1)1/(/RRkknTSSRSSTSSESSkknknRSSkESSFR2FF2R2R2R图图2-7 F2-7 F统计量与统计量与R R2 2的关系的关系第十页,讲稿共三十九页哦三、解释变量的显著性检验三、解释变量的显著性检验(偏回归系数检验偏回归系数检验)由高斯由高斯马尔可夫定理的证明可以得到:马尔可夫定理的证明可以得到:由于正态分布的线性组合仍然服从正态分布,而且分布形式由其由于正态分布的线性组合仍然服从正态分布,而且分布形式由其均值和方差唯一确定,所以,均值和方差唯一确定,所以,bbE)(xxSbD/
9、)(2而且而且 )(iiiiibxakykb假定假定 ),0(2Ni)/,(2xxSbNb)/,(222xxinSxaNa第十一页,讲稿共三十九页哦系数的估计误差系数的估计误差 平均误差(平方)平均误差(平方)=(由无偏性)(由无偏性)其中涉及到随机误差项其中涉及到随机误差项i的方差的方差2,这个值通常并不知道,实,这个值通常并不知道,实际计算中一般采用际计算中一般采用2的无偏估计量:的无偏估计量:即等于估计量的方差;所以估计量关于均值的平均偏差即等于估计量的方差;所以估计量关于均值的平均偏差方方差也就了反映估计量与参数真值的平均偏差差也就了反映估计量与参数真值的平均偏差。参数估计量的平均误差
10、为参数估计量的平均误差为:2)(bbE2)(bEbExxSbD2)(xxSbDbbE22)()(222nei 来估计来估计2,第十二页,讲稿共三十九页哦并且用符号并且用符号 表示系数表示系数b的估计误差:的估计误差:EViews软件在估计回归模型时,将同时输出系数的估计值和标准软件在估计回归模型时,将同时输出系数的估计值和标准差。差。需要指出的是,系数的标准误差只是反映了估计量与真值的需要指出的是,系数的标准误差只是反映了估计量与真值的相对偏离程度。相对偏离程度。同理同理a的估计误差为:的估计误差为:,又称为系数的标准误差(或标准差)。又称为系数的标准误差(或标准差)。)(bsxxixxSne
11、Sbs)2()(22xxiiSnnxeas)2()()(22)(bs)(as第十三页,讲稿共三十九页哦 利用利用OLSOLS估计式估计式(2-1)(2-1)得到的只是系数的点估计,为了对系数的取得到的只是系数的点估计,为了对系数的取值情况有更多的了解,可以按一定的可靠性确定系数的取值范围值情况有更多的了解,可以按一定的可靠性确定系数的取值范围:用统计术语来说,就是在一定的置信度下,求得系数的置信区:用统计术语来说,就是在一定的置信度下,求得系数的置信区间。间。可以证明,统计量可以证明,统计量 )2()(ntbSbbt)1()(kntbSbbtiii 对于对于多元线性回归模型多元线性回归模型,统
12、计量,统计量 为:为:第十四页,讲稿共三十九页哦三、解释变量的显著性检验三、解释变量的显著性检验(偏回归系数检验偏回归系数检验)对于多元线性回归模型,为了对于多元线性回归模型,为了检验某个解释变量检验某个解释变量xi对对y是否有显是否有显著影响,著影响,可以建立原假设:可以建立原假设:H0:bi=0 即假设即假设xi对对y没有显著影响。没有显著影响。构造统计量构造统计量 对于给定的显著水平对于给定的显著水平,可由,可由t分布表查得临界值分布表查得临界值t/2,若若|t|t/2,拒绝拒绝H0,xi 对对y有显著影响;有显著影响;若若|t|t/2,接受,接受H0,认为,认为xi 对对y影响不显著,
13、应考虑将影响不显著,应考虑将xi 从模从模型中剔除,重新建立模型。型中剔除,重新建立模型。)1()(kntbSbbtiii第十五页,讲稿共三十九页哦解释变量显著性检验通不过的原因可能在于解释变量显著性检验通不过的原因可能在于:(1)x xi i与与y y不存在线性相关关系不存在线性相关关系 ;(2)x(2)xi i与与y y不存在任何关系不存在任何关系 ;(3)x(3)xi i与与x xj j(ij)(ij)存在线性相关关系。存在线性相关关系。在在EViewsEViews软件输出的回归分析结果中,在每个软件输出的回归分析结果中,在每个t t统计量统计量值值t ti i的右端还列出了一个概率值的
14、右端还列出了一个概率值p p(又称为(又称为p p值),值),它表示它表示:P P(|t|t|t|ti i)=p=p 即给出了所谓即给出了所谓“精确的显著水平精确的显著水平”。第十六页,讲稿共三十九页哦参数的置信区间参数的置信区间 利用利用OLSOLS估计式得到的只是系数的点估计,为了对系数的取值估计式得到的只是系数的点估计,为了对系数的取值情况有更多的了解,可以按一定的可靠性确定系数的取值范围情况有更多的了解,可以按一定的可靠性确定系数的取值范围:用统计术语来说,就是在一定的置信度下,求得系数的置信:用统计术语来说,就是在一定的置信度下,求得系数的置信区间。区间。对于给定的置信度对于给定的置
15、信度1-,由,由t分布表可以查得临界值分布表可以查得临界值t/2,1)()(2/2/bStbbbStbP第十七页,讲稿共三十九页哦所以系数所以系数b b的的100(1-)%100(1-)%置信区间为置信区间为:即以即以100(1-)%100(1-)%的概率保证回归系数属于该区间内。的概率保证回归系数属于该区间内。显然,置信区间越小,对回归系数的估计精度就越高显然,置信区间越小,对回归系数的估计精度就越高。所以置信区间的长度主要取决于系数的标准差。所以置信区间的长度主要取决于系数的标准差 对于多元线性回归模型,因为统计量对于多元线性回归模型,因为统计量 )(),(2/2/bStbbStb)(bs
16、)1()(kntbSbbtiii第十八页,讲稿共三十九页哦所以,对于给定的置信度所以,对于给定的置信度1-1-,回归系数,回归系数b bi i的的100(1-)%100(1-)%置信区置信区间为间为:)(),(2/2/iiiibStbbStb第十九页,讲稿共三十九页哦第四节 非线性回归模型一、可线性化模型一、可线性化模型 二、不可线性化模型二、不可线性化模型 三、回归模型的比较三、回归模型的比较 练习题练习题第二十页,讲稿共三十九页哦第四节第四节 非线性回归模型非线性回归模型 对于非线性模型,通常是将其转化成线性模型进行估计。对于非线性模型,通常是将其转化成线性模型进行估计。xbay1一、可线
17、性化模型一、可线性化模型 模型经过适当的变量变换或函数变换就可以转化模型经过适当的变量变换或函数变换就可以转化成线性回归模型,成线性回归模型,称这类模型为可线性化模型。称这类模型为可线性化模型。1 1倒数变换模型(双曲函数模型)倒数变换模型(双曲函数模型)对于模型对于模型 xx1*设设:则上式变换为则上式变换为:bxay第二十一页,讲稿共三十九页哦设设:xbay11 上面二个模型进行变量的倒数变换,就可以将其上面二个模型进行变量的倒数变换,就可以将其转化成线性回归模型,所以称该模型为倒数变换转化成线性回归模型,所以称该模型为倒数变换模型。模型。2双对数模型(幂函数模型)双对数模型(幂函数模型)
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 古典 回归 模型 讲稿
![提示](https://www.taowenge.com/images/bang_tan.gif)
限制150内