多元统计分析---回归分析.ppt
《多元统计分析---回归分析.ppt》由会员分享,可在线阅读,更多相关《多元统计分析---回归分析.ppt(52页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、引例:消费支出与可支配收入的观测值一、一元线性回归模型一、一元线性回归模型 定义:假设有两个变量x 和y,x为自变量,y为因变量。则一元线性回归模型的基本结构形式为 式中:a和b为待定参数;为各组观测数据的下标;为随机变量。(2.1)记 和 分别为参数a与b的拟合值,则一元线性回归模型为 (2.2)式代表x与y之间相关关系的拟合直线,称为回归直线;是y的估计值,亦称回归值。(2.2)一般情况下的总体回归模型假定条件下的总体回归模型真实的总体回归直线与估计的样本回归直线样本回归直线是对总体回归直线的近似反映。回归分析的主要任务就是要采用适当的方法,充分利用样本所提供的信息,使得样本回归函数尽可能
2、地接近于真实的总体回归函数。所估计的样本回归直线都不可能与真实的总体回归直线完全一致。观测值的散点图及其拟合直线 参数a与b的最小二乘拟合原则要求yi与 的误差ei的平方和达到最小,即 根据取极值的必要条件,有(2.4)(一)参数(一)参数a、b的最小二乘估计的最小二乘估计 (2.3)(2.5)解上述正规方程组(2.4)式,得到参数a与b的拟合值一元线性回归模型检验的种类一元线性回归模型检验的种类(二)一元线性回归模型的显著性检验(二)一元线性回归模型的显著性检验u实际意义检验实际意义检验参数估计值的符号和取值范围参数估计值的符号和取值范围消费支出与可支配收入:如果估计出来的 b小于 0 或大
3、于 1,收入支出u统计检验统计检验检验样本回归方程的可靠性检验样本回归方程的可靠性拟合程度检验;拟合程度检验;相关系数检验;相关系数检验;参数显著性检验参数显著性检验(t检验检验);回归方程显著性检验(回归方程显著性检验(F 检验)检验)u计量检验计量检验假定条件是否满足假定条件是否满足序列相关检验序列相关检验异方差性检验异方差性检验1 拟合优度检验拟合优度检验所谓拟合程度,是指样本观测值聚集在样本回归直线周所谓拟合程度,是指样本观测值聚集在样本回归直线周围的紧密程度。判断回归模型拟合程度优劣最常用的数围的紧密程度。判断回归模型拟合程度优劣最常用的数量指标是量指标是判定系数判定系数(Coeff
4、icient of Determination)总的离差平方和:在回归分析中,表示y的n次观测值之间的差异,记为 可以证明(2.9)(2.8)Q 称为误差平方和,或剩余平方和U 回归平方和 显而易见,各个样本观测点与样本回归直线靠得越紧,U 在S中所占的比例就越大。因此,可定义这一比例为判定系数,即有:性质:1、具有非负性,分子分母均是不可能为负值2、判定系数的取值范围为3、判定系数是样本观测值的函数,它也是一个统计量。2 相关系数的显著性检验相关系数的显著性检验 X和和 Y之间真实的线性相关程度用总体相关系数之间真实的线性相关程度用总体相关系数来表示来表示由于总体未知,由于总体未知,无法计算
5、,我们利用相本相关系数无法计算,我们利用相本相关系数(1)计算样本相关系数)计算样本相关系数 r;(2)根据给定的显著性水平)根据给定的显著性水平和样本容量和样本容量 n,查相关系数表得到,查相关系数表得到临界值临界值 r。(3)若)若|r|大于临界值大于临界值,则,则 X与与 Y有显著的线性关系,否则有显著的线性关系,否则 X 与与Y 的线性相关关系不显著。的线性相关关系不显著。3 回归参数的显著性检验(回归参数的显著性检验(t检验检验)根据样本估计的结果对总体回归参数的有关假设进行检验根据样本估计的结果对总体回归参数的有关假设进行检验3、根据给定的显著水平确定临界值,或者计算 t 值所对应
6、的 p 值。4、做出判断。方法:F 检验法。总的离差平方和:在回归分析中,表示y的n次观测值之间的差异,记为 可以证明(2.9)(2.8)4回归方程的显著性检验回归方程的显著性检验 统计量F F越大,模型的效果越佳。统计量FF(1,n-2)。在显著水平下,若FF,则认为回归方程效果在此水平下显著。一般地,当FF0.10(1,n-2)时,则认为方程效果不明显。(2.10)二、多元线性回归模型1 1 多元线性回归模型的结构形式为多元线性回归模型的结构形式为 (2.11)式中:为待定参数;为随机变量。2 多元线性回归模型的基本假定多元线性回归模型的基本假定 如果 分别为的拟和值,则回归方程为 b0为
7、常数,b1,b2,bk称为偏回归系数。偏回归系数的意义是,当其他自变量都固定时,自变量 每变化一个单位而使因变量平均改变的数值。(2.12)3 回归方程的估计:偏回归系数的推导过程:根据最小二乘法原理,的估计值 应该使 由求极值的必要条件得 方程组(3.2.14)式经展开整理后得(.2.13)(.2.14)方程组(2.15)式称为正规方程组。引入矩阵(.2.15)则正规方程组(2.15)式可以进一步写成矩阵形式求解得引入记号 (2.16)正规方程组也可以写成n回归模型的显著性检验回归模型的显著性检验 回归平方和U与剩余平方和Q:回归平方和 剩余平方和为 F统计量为 计算出来F之后,可以查F分布
8、表对模型进行显著性检验。R=0.950,说明,说明 Y 与自变量与自变量 X1、X2 之间的相关程度为之间的相关程度为 95.0%。样本判定系数样本判定系数0.902 说明说明 Y的变动有的变动有 90.2%可以由自变量可以由自变量 X1 和和 X2 解释。解释。三、非线性回归模型 非线性关系线性化的几种情况非线性关系线性化的几种情况对于指数曲线 ,令 ,可以将其转化为直线形式:,其中,;对于对数曲线 ,令 ,可以将其转化为直线形式:;对于幂函数曲线 ,令 ,可以将其转化为直线形式:其中,;对于双曲线 ,令 ,转化为直线形式:;对于S型曲线 ,可 转化为直线形式:;对于幂乘积 ,只要令 ,就可
9、以将其转化为线性形式 其中,;对于对数函数和 只要令 ,就可以将其化为线性形式 例例:表3.2.1给出了某地区林地景观斑块面积(area)与周长(perimeter)的数据。下面我们建立林地景观斑块面积A与周长P之间的非线性回归模型。序号面积A周长P序号面积A周长P110 447.370625.39242232 844.3004 282.043215 974.730612.286434 054.660289.307330 976.770775.7124430 833.840895.98049 442.902530.202451 823.355205.131510 858.9201 906.10
10、34626 270.300968.060621 532.9101 297.9624713 573.9601 045.07276 891.680417.0584865 590.0802 250.43583 695.195243.90749157 270.4002 407.54992 260.180197.239502 086.426266.54110334.33299.729513 109.070261.8181111 749.080558.921522 038.617320.396122 372.105199.667533 432.137253.335138 390.633592.893541
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 多元 统计分析 回归 分析
限制150内