线性回归分析课件.ppt
《线性回归分析课件.ppt》由会员分享,可在线阅读,更多相关《线性回归分析课件.ppt(70页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、线性回归分析线性回归分析第1页,此课件共70页哦主要内容主要内容1 一元线性回归的基本思路和步骤一元线性回归的基本思路和步骤2 多元线性回归多元线性回归3 SPSS的线性回归操作的线性回归操作第2页,此课件共70页哦第一节第一节 一元线性回归一元线性回归第3页,此课件共70页哦第4页,此课件共70页哦什么是回归分析?什么是回归分析?(Regression)n从样本数据出发,确定变量的数学关系式数学关系式;n对关系式的可信程度进行统计检验,找到影响某一特定变量显著因素显著因素;n根据变量的取值来预预测测或或控控制制另一个特定变量的取值,并给出这种预测或控制的精确程度;第5页,此课件共70页哦回归
2、分析的一般步骤回归分析的一般步骤重点内容重点内容第6页,此课件共70页哦第7页,此课件共70页哦一元线性回归一元线性回归n涉及一个自变量的回归;n因变量y与自变量x之间为线性关系;因因变变量量(dependent variable):被预测或被解释的变量,用y表示。自自变变量量(independent variable):预测或解释因变量的一个或多个变量,用x表示。n因变量与自变量之间的关系用一条线性方程来表示;第8页,此课件共70页哦一元回归的例子一元回归的例子n n人均收入人均收入是否会显著影响人均食品消费支人均食品消费支出出;n n贷款余额贷款余额是否会影响到不良贷款不良贷款;n n航班
3、正点率航班正点率是否对顾客投诉次数顾客投诉次数有显著影响;n n广告费用支出广告费用支出是否对销售额销售额有显著影响;第9页,此课件共70页哦第10页,此课件共70页哦一元线性回归模型一元线性回归模型n描述因变量 y 如何依赖于自变量 x 和误差项 的方程称为回归模型回归模型n一元线性回归模型:y=0 0+1 1 x+e ey 是 x 的线性函数(部分)加上误差项线性部分反映了由于 x 的变化引起的 y 的变化误差项 是随机变量l反映了除 x 和 y 之间线性关系之外的随机因素对 y 的影响l是不能由 x 和 y 之间的线性关系所解释的变异性 0 0 和和和和 1 1 称为模型的参数称为模型的
4、参数称为模型的参数称为模型的参数第11页,此课件共70页哦一元线性回归模型一元线性回归模型(基本假定基本假定)n误差项是期望值为0的随机变量,即E()=0。n对于一个给定的 x 值,y 的期望值为 E(y)=0+1 xn对于所有的 x 值,的方差2 都相同n误差项协方差等于零,即i和j相互独立(ij);n误差项是服从正态分布的随机变量。即N(0,2)第12页,此课件共70页哦回归方程回归方程(regression equation)n n描描描描述述 y 的的的的平平平平均均均均值值值值或或或或期期期期望望望望值值值值如何依赖于 x 的方程称为回归方程;回归方程;n一元线性回归方程的形式如下:
5、E(y)=0+1 xn方程表示一条直线,也称为直线回归方程;n n 0 0是回归直线在是回归直线在是回归直线在是回归直线在 y y 轴上的截距轴上的截距轴上的截距轴上的截距,是当 x=0 时 y 的期望值;n n 1 1是是是是直直直直线线线线的的的的斜斜斜斜率率率率,称称称称为为为为回回回回归归归归系系系系数数数数,表表表表示示示示当当当当 x x 每每每每变变变变动动动动一一一一个个个个单单单单位位位位时,时,时,时,y y 的平均变动值的平均变动值的平均变动值的平均变动值;第13页,此课件共70页哦估计的回归方程估计的回归方程(estimated regression equation)
6、n一元线性回归中估计的回归方程为:n用样本统计量 和 代替回归方程中的未知参数 和 ,就得到了估计的回归方程;估计的回归方程;n总体回归参数 和 是未知的,必须利用样本数据去估计;其中:是估计的回归直线在 y 轴上的截距,是直线的斜率,它表示对于一个给定的 x 的值,是 y 的估计值,也表示 x 每变动一个单位时,y 的平均变动值。第14页,此课件共70页哦普通最小二乘法估计普通最小二乘法估计(OLS:Ordinary Least Square)n使因变量的观察值与估计值之间的离差平方和达到最小来求得 和 的方法。即n用最小二乘法拟合的直线来代表x与y之间的关系与实际数据的误差比其他任何直线都
7、小第15页,此课件共70页哦最小二乘估计最小二乘估计(图示图示)xy(x xn n,y yn n)(x x1 1,y y1 1)(x x2 2,y y2 2)(x xi i,y yi i)e ei i=y yi i-y yi i第16页,此课件共70页哦最小二乘法最小二乘法(和和 的计算公式的计算公式)根据最小二乘法的要求,可得求解 和和 的的公公式式如如下下第17页,此课件共70页哦第18页,此课件共70页哦一元回归方程一元回归方程统计检验的主要内容统计检验的主要内容第19页,此课件共70页哦第20页,此课件共70页哦变差变差n因变量 y 取值的波动称为变差n变差来源于两个方面:由于自变量
8、x 的取值不同造成;除 x 以外的其他因素(如测量误差等)的影响;n对一个具体的观测值来说,变差的大小可以通过该实际观测值与其均值之差 来表示。第21页,此课件共70页哦变差的分解变差的分解(图示图示)xyy y 第22页,此课件共70页哦离差平方和的分解离差平方和的分解(三个平方和的意义三个平方和的意义)n总平方和总平方和(SST)反映因变量的 n 个观察值与其均值的总离差总离差总离差总离差;n回归平方和回归平方和(SSR)反映自变量 x 的变化对因变量 y 取值变化的影响,是由于 x 与 y 之间的线性关系引起的 y 的取值变化,也称为可解释的平方和;可解释的平方和;可解释的平方和;可解释
9、的平方和;n残差平方和残差平方和(SSE)反映除 x 以外的其他因素对 y 取值的影响,也称为不可解释的平方和或剩余平方和不可解释的平方和或剩余平方和不可解释的平方和或剩余平方和不可解释的平方和或剩余平方和;第23页,此课件共70页哦离差平方和的分解离差平方和的分解(三个平方和的关系三个平方和的关系)SST=SSR+SSE总平方和总平方和总平方和总平方和(SSTSST)回归平方和回归平方和回归平方和回归平方和(SSRSSR)残差平方和残差平方和残差平方和残差平方和(SSESSE)第24页,此课件共70页哦判定系数判定系数R2 (coefficient of determination)n n回
10、归平方和回归平方和占总离差平方和的比例占总离差平方和的比例n n反映回归方程的拟合程度;反映回归方程的拟合程度;n n取值范围在取值范围在 0,1 之间;n n R2 1,说明回归方程拟合的越好;R R20 0,说明回归方程拟合的越差;n n一元线性回归中,判定系数等于系数等于y y和x相关系数的相关系数的平方,即平方,即R R2 2(r r)2 2;第25页,此课件共70页哦第26页,此课件共70页哦线性关系的检验线性关系的检验n检验所所有有自自变变量量与因变量之间的线性关系是否显著;n将均方回归(MSR)同均方残差(MSE)加以比较,应用F检验来分析二者之间的差别是否显著;均方回归:回归平
11、方和SSR除以相应的自由度(自变量的个数K);均方残差:残差平方和SSE除以相应的自由度(n-k-1)。第27页,此课件共70页哦线性关系的检验线性关系的检验(检验的步骤检验的步骤)n提出假设H0:1=0 所有回归系数与零无显著差异,y与全体x的线性关系不显著n n计算计算检验统计量检验统计量F Fn n确定确定显著性水平,并根据分子自由度,并根据分子自由度1 1和分母自和分母自由度由度n n-2找出临界值临界值F F n n作出决策:若出决策:若F F F,拒绝H H0 0;若F t t,拒绝,拒绝H H0 0;t t F,拒绝H0第43页,此课件共70页哦第44页,此课件共70页哦回归系数
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 线性 回归 分析 课件
限制150内