第10章 回归相关分析.ppt
《第10章 回归相关分析.ppt》由会员分享,可在线阅读,更多相关《第10章 回归相关分析.ppt(84页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、第第10章章一元线性相关与回归分析一元线性相关与回归分析统计学主要内容:一、一、相关与回归概述相关与回归概述二、线性相关分析二、线性相关分析 三、一元线性回归分析三、一元线性回归分析四、四、Excel 的应用10.1 相关分析 变量间的关系变量间的关系 相关关系的种类相关关系的种类 相关分析与回归分析概述相关分析与回归分析概述 相关关系的描述与测度相关关系的描述与测度 相关系数的显著性检验相关系数的显著性检验10.1.1变量间的关系变量间的关系n在生产和经营活动中,人们经常要对变量之间的关系进行分析,以揭示变量之间的关系及其关联程度,探索出内在的数量规律性,进行科学的预测。n比如在企业生产中,
2、我们要对影响生产成本的各种因素进行分析,以达到控制成本的目的;在农业生产中,我们需要研究农作物产量与施肥量之间的关系,以便分析施肥量对产量的影响,进而确定合理的施肥量;在商业活动中,我们需要研究广告费支出与销售量之间的关系,进而通过广告费支出来预测销售量等。n n变量之间的关系可以分为两种类型函数关系相关关系函数关系1.1.是一一是一一对应的确定关系对应的确定关系2.2.设设有有两两个个变变量量 x x 和和 y y,变变量量 y y 随随变变量量 x x 一一起起变变化化,并并完完全全依依赖赖于于 x x,当当变变量量 x x 取取某某个个数数值值时时,y y 依依确确定定的的关关系系取取相
3、相应应的的值值,则则称称 y y 是是 x x 的的函函数数,记记为为 y y=f f(x x),其其中中 x x 称为自变量,称为自变量,y y 称为因变量称为因变量3.3.各各观测点落在一条线上观测点落在一条线上 x xy y函数关系的例子函数关系的例子某某种种商商品品的的销销售售额额(y y)与与销销售售量量(x x)之之间间的的关关系系可表示为可表示为 y y=pxpx (p p 为单价为单价)圆圆 的的 面面 积积(S)S)与与 半半 径径 之之 间间 的的 关关 系系 可可 表表 示示 为为S S=R R2 2 企企业业的的原原材材料料消消耗耗额额(y y)与与产产量量(x x1
4、1)、单单位位产产量量消消耗耗(x x2 2)、原原材材料料价价格格(x x3 3)之之间间的的关关系系可可表表示为示为y y=x x11x x22x x3 3 相关关系1.1.变变量量间间关关系系不不能能用用函函数数关关系精确表达系精确表达2.2.一一个个变变量量的的取取值值不不能能由由另另一个变量唯一确定一个变量唯一确定3.3.当当变变量量 x x 取取某某个个值值时时,变变量量 y y 的取值可能有几个的取值可能有几个4.4.各观测各观测点分布在直线周围点分布在直线周围 x xy y相关关系的例子相关关系的例子v父亲身高父亲身高(y y)与子女身高与子女身高(x x)之间的关系之间的关系
5、v收入水平收入水平(y y)与受教育程度与受教育程度(x x)之间的关系之间的关系v粮粮食食亩亩产产量量(y y)与与施施肥肥量量(x x1 1)、降降雨雨量量(x x2 2)、温度温度(x x3 3)之间的关系之间的关系v商品的消费量商品的消费量(y y)与居民收入与居民收入(x x)之间的关系之间的关系v商品销售额商品销售额(y y)与广告费支出与广告费支出(x x)之间的关系之间的关系1.1.2 1.1.2 相关关系的种类相关关系的种类 1.按相关程度分为:完全相关、不完全相关、不相关。2.按相关性质分为:正相关、负相关。3.按相关形式分为:线性相关、非线性相关。4.按相关关系涉及的变量
6、的多少分为:单相关、复相关。10.1.3 10.1.3 相关分析与回归分析概述相关分析与回归分析概述分析内容相关分析相关分析:1.1.确确定定现现象象间间或或变变量量间间有有无无关关系系以以及及相相关关关关系呈现的形态或类型;系呈现的形态或类型;2.2.确确定定相相关关关关系系的的密密切切程度(程度(r r)。)。回归分析:回归分析:1.1.确确定定变变量量间间的的数数量量依依存关系(回归方程);存关系(回归方程);2.2.根据回归方程进行根据回归方程进行预测和控制。预测和控制。变量间的关系相关分析:相关分析:相关分析:相关分析:1.1.变变量量 x x 变变量量 y y 处处于于平平等的地位
7、;等的地位;2.2.变变量量 x x 和和 y y 都都是是随随机机变量回归分析中。变量回归分析中。回归分析:回归分析:回归分析:回归分析:1.1.变变量量 y y 称称为为因因变变量量,处处在在被被解解释释的的地地位位,x x 称称为为自自变变量量,用用于于预预测测因变量的变化;因变量的变化;2.2.因因变变量量 y y 是是随随机机变变量量,自自变变量量 x x 可可以以是是随随机机变变量量,也也可可以以是是非非随随机机的的确定变量确定变量特别提醒n n运用相关回归等定量分析方法,必须以定性分析为前提。10.1.4 相关关系的描述与测度1)散点图 不相关不相关不相关不相关不相关不相关 负线
8、性相关负线性相关负线性相关负线性相关负线性相关负线性相关 正线性相关正线性相关正线性相关正线性相关正线性相关正线性相关 非线性相关非线性相关非线性相关非线性相关非线性相关非线性相关 完全负线性相关完全负线性相关完全负线性相关完全负线性相关完全负线性相关完全负线性相关完全正线性相关完全正线性相关完全正线性相关完全正线性相关完全正线性相关完全正线性相关 例一家大型商业银行在多个地区设有分行,其业务主要是进行基础设施建设、国家重点项目建设、固定资产投资等项目的贷款。近年来,该银行的贷款额平稳增长,但不良贷款额也有较大比例的提高,这给银行业务的发展带来较大压力。为弄清楚不良贷款形成的原因,希望利用银行
9、业务的有关数据做些定量分析,以便找出控制不良贷款的办法。下面是该银行所属的25家分行2002年的有关业务数据。25家分行2002年的有关业务数据散点图2)相关系数1.1.对变量之间关系密切程度的度量2.2.对两个变量之间线性相关程度的度量称为简单相关系数3.3.若相关系数是根据总体全部数据计算的,称为总体相关系数,记为 4.4.若是根据样本数据计算的,则称为样本相关系数,记为 r或样本相关系数的计算公式相关系数的计算相关系数取值范围及意义1.1.r r 的取值范围的取值范围是是-1,1-1,12.2.|r r|=|=1 1,为完全相关为完全相关uur r=1 1,为完全正相关为完全正相关uur
10、 r=-1-1,为完全负正相关为完全负正相关3.3.r r=0=0,无关,或不存在无关,或不存在线性线性线性线性相关相关关系关系4.4.r r取值为负数取值为负数,为负相关为负相关5.5.r r取值为正数取值为正数,为正相关为正相关6.6.|r r|越越趋趋于于1 1表表示示关关系系越越密密切切;|r r|越越趋趋于于0 0表表示示关关系系越不密切越不密切相关系数取值的意义 相关系数相关系数r r的绝对值的绝对值vv大于或等于0.8,高度相关vv0.50.8 ,中度相关vv0.30.5,低度相关vv0.3以下,可视为不相关n但这种解释必须建立在对相关系数进行显著性检验的基础之上。10.1.5
11、相关系数的显著性检验n n检验:能否根据样本相关系数说明总体的相关程度,即考察样本相关系数的可靠性。n n通常采用 t t 分布检验n n该检验可以用于小样本,也可以用于大样本。相关系数显著性检验的步骤1.1.提出假设:假设样本是从不相关的总体中抽出的提出假设:假设样本是从不相关的总体中抽出的 H H0 0:;H H1 1:0 02.2.计算检验的统计量3.确定显著性水平,查表得临界值t4.统计决策 若tt,拒绝H0 若t=7.5344t t0.050.05(25-2)=2.0687(25-2)=2.0687,拒拒绝绝H H0 0,即即不不良良贷款与各项贷款余额之间存在着显著的正线性相关关系贷
12、款与各项贷款余额之间存在着显著的正线性相关关系 10.2 一元线性回归分析一元线性回归模型一元线性回归模型参数的最小二乘估计参数的最小二乘估计回归直线的拟合优度回归直线的拟合优度显著性检验显著性检验10.2.1 什么是回归分析?1.1.从一组样本数据出发,确定变量之间的数学关系式2.2.对这些关系式的可信程度进行各种统计检验,并从影响某一特定变量的诸多变量中找出哪些变量的影响显著,哪些不显著3.3.利用所求的关系式,根据一个或几个变量的取值来预测或控制另一个特定变量的取值,并给出这种预测或控制的精确程度回归分析与相关分析的区别分析内容相关分析相关分析:1.1.确确定定现现象象间间或或变变量量间
13、间有有无无关关系系以以及及相相关关关关系呈现的形态或类型;系呈现的形态或类型;2.2.确确定定相相关关关关系系的的密密切切程度(程度(r r)。)。回归分析:回归分析:1.1.确确定定变变量量间间的的数数量量依依存关系(回归方程);存关系(回归方程);2.2.根据回归方程进行根据回归方程进行预测和控制。预测和控制。变量间的关系相关分析:相关分析:相关分析:相关分析:1.1.变变量量 x x 变变量量 y y 处处于于平平等的地位;等的地位;2.2.变变量量 x x 和和 y y 都都是是随随机机变量回归分析中。变量回归分析中。回归分析:回归分析:回归分析:回归分析:1.1.变变量量 y y 称
14、称为为因因变变量量,处处在在被被解解释释的的地地位位,x x 称称为为自自变变量量,用用于于预预测测因变量的变化;因变量的变化;2.2.因因变变量量 y y 是是随随机机变变量量,自自变变量量 x x 可可以以是是随随机机变变量量,也也可可以以是是非非随随机机的的确定变量确定变量一元线性回归vv只涉及一个自变量的回归vv因变量y与自变量x之间为线性关系被预测或被解释的变量称为因变量,用y表示用来预测或用来解释因变量的一个或多个变量称为自变量,用x表示 vv因变量与自变量之间的关系用一个线性方程来表示一元线性回归模型vv一元线性一元线性回归模型可表示为回归模型可表示为 y y=0 0 0 0+1
15、 1 1 1 x x+e e e euu 0 0 和和 1 1 称为模型的参数称为模型的参数uuy y 是是 x x 的线性函数的线性函数(部分部分)加上误差项加上误差项uu线性部分反映了由于线性部分反映了由于 x x 的变化而引起的的变化而引起的 y y 的变化的变化uu误差项误差项 是随机变量是随机变量t t反反映映了了除除 x x 和和 y y 之之间间的的线线性性关关系系之之外外的的随随机机因因素素对对 y y 的影响的影响t t是不能由是不能由 x x 和和 y y 之间的线性关系所解释的变异性之间的线性关系所解释的变异性一元线性回归模型的基本假定1.1.误误差差项项 是是一一个个期
16、期望望值值为为0 0的的随随机机变变量量,即即E E()=0)=0。对于一个给定的对于一个给定的 x x 值,值,y y 的期望值为的期望值为E E(y y)=)=0 0+11x x2.2.误误差差项项 是是一一个个服服从从正正态态分分布布的的随随机机变变量量,且且相相互独立。即互独立。即 N N(0,(0,22)uu独独立立性性意意味味着着对对于于一一个个特特定定的的 x x 值值,它它所所对对应的应的 与其他与其他 x x 值所对应的值所对应的 不相关不相关uu对对于于一一个个特特定定的的 x x 值值,它它所所对对应应的的 y y 值值与与其其他他 x x 所对应的所对应的 y y 值也
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 第10章 回归相关分析 10 回归 相关 分析
限制150内