一元线性回归和多元线性回归.pptx
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_05.gif)
《一元线性回归和多元线性回归.pptx》由会员分享,可在线阅读,更多相关《一元线性回归和多元线性回归.pptx(115页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、一元线性回归和多元线性回归现在学习的是第1页,共115页课程纲要Ch1 导论Ch2 数据的搜集Ch3 数据的图表展示Ch4 数据的概括性度量Ch5 概率与概率分布Ch6 统计量及其抽样分布Ch7 参数估计2现在学习的是第2页,共115页课程纲要(续)Ch8 假设检验Ch9 列联分析Ch10 方差分析Ch11 一元线性回归Ch12 多元线性回归Ch13 时间序列分析及预测Ch14 指数3现在学习的是第3页,共115页Ch11 一元线性回归11.1 变量间关系的度量变量间关系的度量 11.2 一元线性回归一元线性回归现在学习的是第4页,共115页11.1 变量间关系的度量变量间关系的度量11.1.
2、1 变量间的关系变量间的关系11.1.2 相关关系的描述与测度相关关系的描述与测度11.1.3 相关系数的显著性检验相关系数的显著性检验现在学习的是第5页,共115页变量间的关系现在学习的是第6页,共115页函数关系1.是一一对应的确定关系2.设有两个变量 x 和 y,变量 y 随变量 x 一起变化,并完全依赖于 x。当变量 x 取某个数值时,y 依确定的关系取相应的值,则称 y 是 x 的函数,记为 y=f(x),其中 x 称为自变量,y 称为因变量3.各观测点落在一条线上 现在学习的是第7页,共115页函数关系(几个例子)n某种商品的销售额y与销售量x之间的关系可表示为 y=px(p 为单
3、价)n圆的面积S与半径R之间的关系可表示为S=R2 n企业的原材料消耗额y与产量x1、单位产量消耗x2、原材料价格x3之间的关系可表示为 y=x1 x2 x3 现在学习的是第8页,共115页相关关系(correlation)1.变量间关系不能用函数关系精确表达2.一个变量的取值不能由另一个变量唯一确定3.当变量 x 取某个值时,变量 y 的取值可能有几个4.各观测点分布在直线周围 x xy y现在学习的是第9页,共115页相关关系(几个例子)n父亲身高y与子女身高x之间的关系n收入水平y与受教育程度x之间的关系n粮食单位面积产量y与施肥量x1、降雨量x2、温度x3之间的关系n商品的消费量y与居
4、民收入x之间的关系n商品销售额y与广告费支出x之间的关系现在学习的是第10页,共115页相关关系的描述与测度(散点图)现在学习的是第11页,共115页相关分析及其假定1.相关分析要解决的问题变量之间是否存在关系?如果存在关系,它们之间是什么样的关系?变量之间的关系强度如何?样本所反映的变量之间的关系能否代表总体变量之间的关系?2.为解决这些问题,在进行相关分析时,对总体有以下两个主要假定两个变量之间是线性关系两个变量都是随机变量现在学习的是第12页,共115页散点图(scatter diagram)不相关不相关不相关不相关 负线性相关负线性相关负线性相关负线性相关 正线性相关正线性相关正线性相
5、关正线性相关 非线性相关非线性相关非线性相关非线性相关 完全负线性相关完全负线性相关完全负线性相关完全负线性相关完全正线性相关完全正线性相关完全正线性相关完全正线性相关 现在学习的是第13页,共115页散点图(例题分析)【例例】一家大型商业银行在多个地区设有分行,其业务主要是进行基础设施建设、国家重点项目建设、固定资产投资等项目的贷款。近年来,该银行的贷款额平稳增长,但不良贷款额也有较大比例的增长,这给银行业务的发展带来较大压力。为弄清楚不良贷款形成的原因,管理者希望利用银行业务的有关数据做些定量分析,以便找出控制不良贷款的办法。下面是该银行所属的25家分行2002年的有关业务数据 现在学习的
6、是第14页,共115页散点图(例题分析)现在学习的是第15页,共115页散点图(不良贷款对其他变量的散点图)现在学习的是第16页,共115页相关关系的描述与测度(相关系数)现在学习的是第17页,共115页相关系数(correlation coefficient)1.度量变量之间关系强度的一个统计量2.对两个变量之间线性相关强度的度量称为简单相关系数3.若相关系数是根据总体全部数据计算的,称为总体相关系数,记为 4.若是根据样本数据计算的,则称为样本相关系数,简称为相关系数,记为 r也称为线性相关系数(linear correlation coefficient)或 称 为 Pearson相 关
7、 系 数 (Pearsons correlation coefficient)现在学习的是第18页,共115页相关系数(计算公式)样本相关系数的计算公式或化简为或化简为现在学习的是第19页,共115页相关系数的性质性质性质1:r 的取值范围是-1,1|r|=1,为完全相关r=1,为完全正相关r=-1,为完全负正相关 r=0,不存在线性相关关系-1r0,为负相关0r1,为正相关|r|越趋于1表示关系越强;|r|越趋于0表示关系越弱现在学习的是第20页,共115页相关系数的性质性质性质2:r具有对称性。即x与y之间的相关系数和y与x之间 的相关系数相等,即rxy=ryx性质性质3:r数值大小与x和
8、y原点及尺度无关,即改变x和y的 数据原点及计量尺度,并不改变r数值大小性质性质4:仅仅是x与y之间线性关系的一个度量,它不能用 于描述非线性关系。这意为着,r=0只表示两个变 量之间不存在线性相关关系,并不说明变量之间没 有任何关系性质性质5:r虽然是两个变量之间线性关系的一个度量,却不 一定意味着x与y一定有因果关系现在学习的是第21页,共115页相关系数的经验解释1.|r|0.8时,可视为两个变量之间高度相关2.0.5|r|0.8时,可视为中度相关3.0.3|r|0.5时,视为低度相关4.|r|t,拒绝H0l 若tt(25-2)=2.069,拒绝H0,不良贷款与贷款余额之间存在着显著的正
9、线性相关关系 现在学习的是第26页,共115页相关系数的显著性检验(例题分析)各相关系数检验的统计量各相关系数检验的统计量现在学习的是第27页,共115页11.2 一元线性回归一元线性回归11.2.1 一元线性回归模型一元线性回归模型11.2.2 参数的最小二乘估计参数的最小二乘估计11.2.3 回归直线的拟合优度回归直线的拟合优度11.2.4 显著性检验显著性检验现在学习的是第28页,共115页什么是回归分析?(Regression)1.从一组样本数据出发,确定变量之间的数学关系式2.对这些关系式的可信程度进行各种统计检验,并从影响某一特定变量的诸多变量中找出哪些变量的影响显著,哪些不显著3
10、.利用所求的关系式,根据一个或几个变量的取值来预测或控制另一个特定变量的取值,并给出这种预测或控制的精确程度现在学习的是第29页,共115页回归模型的类型现在学习的是第30页,共115页一元线性回归模型现在学习的是第31页,共115页一元线性回归1.涉及一个自变量的回归2.因变量y与自变量x之间为线性关系被 预 测 或 被 解 释 的 变 量 称 为 因 变 量(dependent variable),用y表示用来预测或用来解释因变量的一个或多个变量称为自变量(independent variable),用x表示 3.因变量与自变量之间的关系用一个线性方程来表示现在学习的是第32页,共115页
11、回归模型(regression model)1.回答“变量之间是什么样的关系?”2.方程中运用1 个数值型因变量(响应变量)被预测的变量1 个或多个数值型或分类型自变量(解释变量)用于预测的变量3.主要用于预测和估计现在学习的是第33页,共115页一元线性回归模型1.描述因变量 y 如何依赖于自变量 x 和误差项 的方程称为回归模型2.一元线性回归模型可表示为 y=0 0+1 1 x +y 是 x 的线性函数(部分)加上误差项线性部分反映了由于 x 的变化而引起的 y 的变化误差项 是随机变量反映了除 x 和 y 之间的线性关系之外的随机因素对 y 的影响是不能由 x 和 y 之间的线性关系所
12、解释的变异性0 和 1 称为模型的参数现在学习的是第34页,共115页一元线性回归模型(基本假定)1.1.因变量因变量x与自变量与自变量y之间具有线性关系之间具有线性关系2.2.在重复抽样中,自变量在重复抽样中,自变量x的取值是固定的,即假定的取值是固定的,即假定x是非随机是非随机的的3.3.误差误差项项是一个期望值为是一个期望值为0的随机变量,即的随机变量,即E()=0。对于一个。对于一个给定的给定的 x 值,值,y 的期望值为的期望值为E(y)=0+1 x4.4.对对于所有的于所有的 x 值,值,的方差的方差2 都相同都相同5.5.误误差差项项是是一一个个服服从从正正态态分分布布的的随随机
13、机变变量量,且且相相互互独独立立。即即N(0,2)独独立立性性意意味味着着对对于于一一个个特特定定的的 x 值值,它它所所对对应应的的与与其其他他 x 值值所所对对应的应的不相关不相关对对于于一一个个特特定定的的 x 值值,它它所所对对应应的的 y 值值与与其其他他 x 所所对对应应的的 y 值值也也不不相关相关现在学习的是第35页,共115页一元线性回归模型(基本假定)x=x3时的E(y)x=x2时y的分布x=x1时y的分布x=x2时的E(y)x3x2x1x=x1时的E(y)0 xyx=x3时y的分布0+1x现在学习的是第36页,共115页回归方程(regression equation)1
14、.描述 y 的平均值或期望值如何依赖于 x 的方程称为回归方程2.一元线性回归方程的形式如下 E(y)=0+1 x方程的图示是一条直线,也称为直线回归方程0是回归直线在 y 轴上的截距,是当 x=0 时 y 的期望值1是直线的斜率,称为回归系数,表示当 x 每变动一个单位时,y 的平均变动值现在学习的是第37页,共115页估计的回归方程(estimated regression equation)3.3.一元线性回归中估计的回归方程为一元线性回归中估计的回归方程为2.2.用用样样本本统统计计量量 和和 代代替替回回归归方方程程中中的的未未知知参参数数 和和 ,就得到了估计的回归方程,就得到了估
15、计的回归方程1.1.总总体体回回归归参参数数 和和 是是未未知知的的,必必须须利利用用样样本本数数据去估计据去估计现在学习的是第38页,共115页参数的最小二乘估计现在学习的是第39页,共115页最小二乘估计(method of least squares)1.德国科学家Karl Gauss(1777-1855)提出用最小化图中垂直方向的误差平方和来估计参数 2.使因变量的观察值与估计值之间的误差平方和达到最小来求得 和 的方法。即3.用最小二乘法拟合的直线来代表x与y之间的关系与实际数据的误差比其他任何直线都小现在学习的是第40页,共115页Karl Gauss的最小化图xy(x xn n,
16、y yn n)(x x1 1,y y1 1)(x x2 2,y y2 2)(x xi i,y yi i)e ei i=y yi i-y yi i现在学习的是第41页,共115页最小二乘法(和 的计算公式)根据最小二乘法,可得求解根据最小二乘法,可得求解 和和 的公式如下的公式如下现在学习的是第42页,共115页估计方程的求法(例题分析)【例例】求不良贷款对贷款余额的回归方程回归方程为:回归方程为:y=-0.8295+0.037895 x回归系数 =0.037895 表示,贷款余额每增加1亿元,不良贷款平均增加0.037895亿元 现在学习的是第43页,共115页估计方程的求法(例题分析)不良贷
17、款对贷款余额回归方程的图示现在学习的是第44页,共115页用Excel进行回归分析第第1步:步:选择【工具工具】下拉菜单第第2步:步:选择【数据分析数据分析】选项第第3步:步:在分析工具中选择【回归回归】,选择【确定确定】第第4步:步:当对话框出现时 在【Y值值输输入入区区域域】设置框内键入Y的数据区域 在【X值输入区域值输入区域】设置框内键入X的数据区域 在【置信度置信度】选项中给出所需的数值 在【输出选项输出选项】中选择输出区域 在【残差残差】分析选项中选择所需的选项现在学习的是第45页,共115页回归直线的拟合优度现在学习的是第46页,共115页变差1.因变量 y 的取值是不同的,y 取
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 一元 线性 回归 多元
![提示](https://www.taowenge.com/images/bang_tan.gif)
限制150内