一元线性回归精选PPT.ppt
《一元线性回归精选PPT.ppt》由会员分享,可在线阅读,更多相关《一元线性回归精选PPT.ppt(74页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、一元线性回归一元线性回归第1页,此课件共74页哦第第10章章 一元线性回归一元线性回归10.1 变量间关系的度量变量间关系的度量 10.2 一元线性回归一元线性回归10.3 残差分析残差分析第2页,此课件共74页哦10.1 变量间关系的度量变量间关系的度量10.1.1 变量间的关系变量间的关系10.1.2 相关关系的描述与测度相关关系的描述与测度10.1.3 相关系数的显著性检验相关系数的显著性检验第3页,此课件共74页哦变量间的关系变量间的关系第4页,此课件共74页哦函数关系函数关系1.是一一对应的确定关系对应的确定关系2.2.设设有两个变量 x 和 y,变量 y y 随随变变量量 x 一一
2、起起变变化化,并并完完全全依依赖赖于于 x x,当变量 x x 取取某某个个数数值值时时,y 依依确确定定的的关关系系取取相相应应的的值值,则则称称 y 是是 x 的函数,记为 y=f(x),其中 x 称为自变量,y 称称为因变量为因变量3.3.各各观测点落在一条线上 x xy y第5页,此课件共74页哦相关关系相关关系(correlation)1.变量间关系不能用函数关系精确表达2.一个变量的取值不能由另一个变量唯一确定3.当变量 x 取某个值时,变量 y 的取值可能有几个4.各观测点分布在直线周围 x xy y第6页,此课件共74页哦相关关系相关关系(几个例子几个例子)n n父亲身高y与子
3、女身高x之间的关系n n收入水平y与受教育程度x之间的关系n n粮食单位面积产量y与施肥量x1、降雨量x2、温度x3之间的关系n n商品的消费量y与居民收入x之间的关系n n商品销售额y与广告费支出x之间的关系第7页,此课件共74页哦相关关系相关关系(类型类型)第8页,此课件共74页哦相关关系的描述与测度相关关系的描述与测度(散点图散点图)第9页,此课件共74页哦相关分析及其假定相关分析及其假定1.1.相关分析要解决的问题相关分析要解决的问题n n变量之间是否存在关系?变量之间是否存在关系?n n如果存在关系,它们之间是什么样的关系?如果存在关系,它们之间是什么样的关系?n n变量之间的关系强
4、度如何?变量之间的关系强度如何?n n样样本本所所反反映映的的变变量量之之间间的的关关系系能能否否代代表表总总体体变变量量之之间间的的关关系?系?2.2.为为解解决决这这些些问问题题,在在进进行行相相关关分分析析时时,对对总总体体有有以以下下两个主要假定两个主要假定n n两个变量之间是线性关系两个变量之间是线性关系n n两个变量都是随机变量两个变量都是随机变量第10页,此课件共74页哦散点图散点图(scatter diagram)不相关不相关不相关不相关不相关不相关 负线性相关负线性相关负线性相关负线性相关负线性相关负线性相关 正线性相关正线性相关正线性相关正线性相关正线性相关正线性相关 非线
5、性相关非线性相关非线性相关非线性相关非线性相关非线性相关 完全负线性相关完全负线性相关完全负线性相关完全负线性相关完全负线性相关完全负线性相关完全正线性相关完全正线性相关完全正线性相关完全正线性相关完全正线性相关完全正线性相关 第11页,此课件共74页哦相关关系的描述与测度相关关系的描述与测度(相关系数相关系数)第12页,此课件共74页哦相关系数相关系数(correlation coefficient)1.1.度量变量之间关系强度的一个统计量度量变量之间关系强度的一个统计量2.对两个变量之间线性相关强度的度量称为简单相关系数3.若相关系数是是根根据据总总体体全全部部数数据据计计算算的的,称称为
6、为总总体体相相关系数,记为关系数,记为 4.若相关系数是是根根据据样样本本数数据据计计算算的的,则则称称为为样样本本相相关关系数,简称为相关系数,记为系数,简称为相关系数,记为 rn n也称为线性相关系数也称为线性相关系数(linear correlation coefficient)(linear correlation coefficient)n n或或 称称 为为PearsonPearson相相 关关 系系 数数 (Pearsons(Pearsons correlation correlation coefficient)coefficient)第13页,此课件共74页哦相关系数相关系数
7、 (计算公式计算公式)样本相关系数的计算公式或化简为第14页,此课件共74页哦相关系数的性质相关系数的性质性质性质1:r 的取值范围是-1,1n n|r|=1,为完全相关l lr r=1 1,为完全正相关,为完全正相关l lr r=-1-1,为完全负正相关,为完全负正相关n n r=0,不存在线性线性相关关系n n-1r0,为负相关n n0r1,为正相关n n|r|越趋于1表示关系越强;|r|越趋于0表示关系越弱第15页,此课件共74页哦相关系数的性质相关系数的性质(取值及其意义的图解取值及其意义的图解)-1.0+1.00-0.5+0.5完全负相关完全负相关无线性相关无线性相关完全正相关完全正
8、相关负相关程度增加负相关程度增加r正相关程度增加正相关程度增加第16页,此课件共74页哦相关系数的性质相关系数的性质性质性质性质性质2 2:r r具有对称性。即具有对称性。即x x与与y y之间的相关系数和之间的相关系数和y y与与x x之间之间 的相关系数相等,即的相关系数相等,即r rxyxy=r ryxyx性质性质性质性质3 3:r r数值大小与数值大小与x x和和y y原点及尺度无关,即改变原点及尺度无关,即改变x x和和y y的的 数据原点及计量尺度,并不改变数据原点及计量尺度,并不改变r r数值大小数值大小性质性质性质性质4 4:仅仅是仅仅是x x与与y y之间线性关系的一个度量,
9、它不能用之间线性关系的一个度量,它不能用 于描述非线性关系。这意味着,于描述非线性关系。这意味着,r r=0=0只表示两个变只表示两个变 量之间不存在线性相关关系,并不说明变量之间没量之间不存在线性相关关系,并不说明变量之间没 有任何关系有任何关系性质性质性质性质5 5:r r虽然是两个变量之间线性关系的一个度量,却不虽然是两个变量之间线性关系的一个度量,却不 一定意味着一定意味着x x与与y y一定有因果关系一定有因果关系第17页,此课件共74页哦相关系数的经验解释相关系数的经验解释1.|r|0.8时,可视为两个变量之间高度相关2.0.5|r|0.8时,可视为中度相关3.0.3|r|0.5时
10、,视为低度相关4.|r|t t,拒绝,拒绝H H0 0 若若 t t =7.5344t t(25-2)=2.069(25-2)=2.069,拒拒绝绝H H0 0,不不良良贷贷款款与与贷款余额之间存在着显著的正线性相关关系贷款余额之间存在着显著的正线性相关关系 第22页,此课件共74页哦相关系数的显著性检验相关系数的显著性检验(需要注意的问题需要注意的问题)1.即使统计检验表明相关系数在统计上是显著的,并不一定意味着两个变量之间就存在重要的相关性2.因为在大样本的情况下,几乎总是导致相关系数显著n n比如,r=0.1,在大样本的情况下,也可能使得r通过检验,但实际上,一个变量取值的差异能由另一个
11、变量的取值来解释的比例只有10%,这实际上很难说明两个变量之间就有实际意义上的显著关系第23页,此课件共74页哦10.2 一元线性回归一元线性回归10.2.1 一元线性回归模型一元线性回归模型10.2.2 参数的最小二乘估计参数的最小二乘估计10.2.3 回归直线的拟合优度回归直线的拟合优度10.2.4 显著性检验显著性检验第24页,此课件共74页哦什么是回归分析?什么是回归分析?(regression)1.从一组样本数据出发,确定变量之间的数学关系式2.对这些关系式的可信程度进行各种统计检验,并从影响某一特定变量的诸多变量中找出哪些变量的影响显著,哪些不显著3.利用所求的关系式,根据一个或几
12、个变量的取值来预测或控制另一个特定变量的取值,并给出这种预测或控制的精确程度第25页,此课件共74页哦回归分析与相关分析的区别回归分析与相关分析的区别1.相关分析中,变量 x x 变变量量 y 处处于于平平等等的的地地位位;回回归归分分析析中中,变变量量 y 称称为为因因变变量量,处处在在被被解解释释的的地地位位,x x 称为自变量,用于预测因变量的变化2.相关分析中所涉及的变量 x 和和 y 都是随机变量;回归分析中,因变量 y 是随机变量,自变量 x 是非随机的确定变量3.3.相相关分析主要是描述两个变量之间线性关系的密切程度;回归分析不仅可以揭示变量 x x 对变量 y 的影响大小,还可
13、以由回归方程进行预测和控制 第26页,此课件共74页哦回归模型的类型回归模型的类型第27页,此课件共74页哦一元线性回归模型一元线性回归模型第28页,此课件共74页哦一元线性回归一元线性回归1.涉及一个自变量的回归2.因变量y与自变量x之间为线性关系n n被 预 测 或 被 解 释 的 变 量 称 为 因 变 量(dependent variable),用y表示n n用来预测或用来解释因变量的一个或多个变量称为自变量(independent variable),用x表示 3.因变量与自变量之间的关系用一个线性方程来表示第29页,此课件共74页哦一元线性回归模型一元线性回归模型1.描述因变量 y
14、 如何依赖于自变量 x 和和误误差差项项 的的方方程程称为称为回归模型回归模型回归模型回归模型2.2.一元线性一元线性回归模型可表示为 y y=0 0+1 1 1 1 x +e en ny y 是是 x x 的线性函数的线性函数(部分部分)加上误差项加上误差项n n线性部分反映了由于线性部分反映了由于 x x 的变化而引起的的变化而引起的 y y 的变化的变化n n误差项误差项 是随机变量是随机变量l l反映了除反映了除 x x 和和 y y 之间的线性关系之外的随机因素对之间的线性关系之外的随机因素对 y y 的影响的影响l l是不能由是不能由 x x 和和 y y 之间的线性关系所解释的变
15、异性之间的线性关系所解释的变异性n n 0 0 和和 1 1 称为模型的参数称为模型的参数第30页,此课件共74页哦一元线性回归模型一元线性回归模型(基本假定基本假定)1.1.因变量因变量y y与自变量与自变量x x之间具有线性关系之间具有线性关系2.2.在重复抽样中,自变量在重复抽样中,自变量x x的取值是固定的,即假定的取值是固定的,即假定x x是非随机是非随机的的3.3.误差误差项项 是一个期望值为是一个期望值为0 0的随机变量,即的随机变量,即E E()=0)=0。对于一个。对于一个给定的给定的 x x 值,值,y y 的期望值为的期望值为E E(y y)=)=0 0+1 1 x x4
16、.4.对对于所有的于所有的 x x 值,值,的方差的方差 2 2 都相同都相同5.5.误误差差项项 是是一一个个服服从从正正态态分分布布的的随随机机变变量量,且且相相互互独独立立。即即 N N(0,(0,2 2)n n独独立立性性意意味味着着对对于于一一个个特特定定的的 x x 值值,它它所所对对应应的的 与与其其他他 x x 值值所所对对应的应的 不相关不相关n n对对于于一一个个特特定定的的 x x 值值,它它所所对对应应的的 y y 值值与与其其他他 x x 所所对对应应的的 y y 值值也也不相关不相关第31页,此课件共74页哦一元线性回归模型一元线性回归模型(基本假定基本假定)x x
17、=x x3 3时的时的E E(y y)x x=x x2 2时时y y的分布的分布x x=x x1 1时时y y的分布的分布x x=x x2 2时的时的E E(y y)x x3 3x x2 2x x1 1x x=x x1 1时的时的E E(y y)0 0 xyx x=x x3 3时时y y的分布的分布 0 0+1 1x x第32页,此课件共74页哦回归方程回归方程(regression equation)1.描述 y 的平均值或期望值如何依赖于 x 的方程称为回归方程回归方程2.一元线性回归方程的形式如下3.E(y)=0+1 x方程的图示是一条直线,也称为直线回归方程方程的图示是一条直线,也称为
18、直线回归方程 0 0是回归直线在是回归直线在 y y 轴上的截距,是当轴上的截距,是当 x x=0=0 时时 y y 的期望值的期望值 1 1是是直直线线的的斜斜率率,称称为为回回归归系系数数,表表示示当当 x x 每每变变动动一一个个单位时,单位时,y y 的平均变动值的平均变动值第33页,此课件共74页哦估计的回归方程估计的回归方程(estimated regression equation)3.3.一元线性回归中估计的回归方程为一元线性回归中估计的回归方程为2.用样本统计量 和 代替回归方程中的未知参数 和 ,就得到了估计的回归方程估计的回归方程1.总体回归参数 和 是未知的,必须利用样
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 一元 线性 回归 精选 PPT
限制150内