广西大学MBA 统计学 第六讲 相关与回归分析.ppt





《广西大学MBA 统计学 第六讲 相关与回归分析.ppt》由会员分享,可在线阅读,更多相关《广西大学MBA 统计学 第六讲 相关与回归分析.ppt(92页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、第五讲 相关与回归分析 相关和回归分析是研究事物的相互相关和回归分析是研究事物的相互关系、测定它们联系的紧密程度、揭示关系、测定它们联系的紧密程度、揭示其变化的具体形式和规律性的统计方法,其变化的具体形式和规律性的统计方法,是构造各种经济模型、进行结构分析、是构造各种经济模型、进行结构分析、政策评价、预测和控制的重要工具。政策评价、预测和控制的重要工具。1/27/20231商学院 李丽明第一节、相关分析第一节、相关分析n一、相关分析概述一、相关分析概述n二、相关系数及其计算二、相关系数及其计算1/27/20232商学院 李丽明一一.相关分析概述相关分析概述1/27/20233商学院 李丽明比较
2、下面两种现象间的依存关系比较下面两种现象间的依存关系 出租汽车费用与行驶里程:出租汽车费用与行驶里程:总费用总费用=行驶里程行驶里程 每公里单价每公里单价 家庭收入与恩格尔系数:家庭收入与恩格尔系数:家庭收入高,则恩格尔系数低。家庭收入高,则恩格尔系数低。函数关系函数关系(确定性关系)(确定性关系)相关关系相关关系(非确定性关系)(非确定性关系)1/27/20234商学院 李丽明现象间的依存关系大致可以分成两种类型:现象间的依存关系大致可以分成两种类型:函数关系函数关系相关关系相关关系指指现象间所具有的严格的确定性现象间所具有的严格的确定性的依存关系的依存关系指指客观现象间确实存在,但数量客观
3、现象间确实存在,但数量上不是严格对应的依存关系上不是严格对应的依存关系函数关系与相关关系之间并无严格的界限:函数关系与相关关系之间并无严格的界限:函数关系与相关关系之间并无严格的界限:函数关系与相关关系之间并无严格的界限:有函数有函数有函数有函数关系的变量间,由于有测量误差及各种随机因素的关系的变量间,由于有测量误差及各种随机因素的关系的变量间,由于有测量误差及各种随机因素的关系的变量间,由于有测量误差及各种随机因素的干扰,可表现为相关关系;对具有相关关系的变量干扰,可表现为相关关系;对具有相关关系的变量干扰,可表现为相关关系;对具有相关关系的变量干扰,可表现为相关关系;对具有相关关系的变量有
4、深刻了解之后,相关关系有可能转化为或借助函有深刻了解之后,相关关系有可能转化为或借助函有深刻了解之后,相关关系有可能转化为或借助函有深刻了解之后,相关关系有可能转化为或借助函数关系来描述。数关系来描述。数关系来描述。数关系来描述。1/27/20235商学院 李丽明变量间的关系变量间的关系(函数关系(函数关系)n是一一对应的确定关系是一一对应的确定关系n设有两个变量设有两个变量 x 和和 y,变变量量 y 随变量随变量 x 一起变化,一起变化,并完全依赖并完全依赖于于 x,当变量当变量 x 取某个数值时,取某个数值时,y 依确依确定的关系取相应的值,则定的关系取相应的值,则称称 y 是是 x 的
5、函数,记为的函数,记为 y=f(x),其中其中 x 称为自变称为自变量,量,y 称为因变量称为因变量n各观测点落在一条线上各观测点落在一条线上 x xy y1/27/20236商学院 李丽明变量间的关系变量间的关系(函数关系)(函数关系)n n 函数关系的例子函数关系的例子qq某种商品的销售额某种商品的销售额某种商品的销售额某种商品的销售额(y y)与销售量与销售量与销售量与销售量(x x)之间的关系可之间的关系可之间的关系可之间的关系可表示为表示为表示为表示为 y y=p x p x(p p 为单价为单价为单价为单价)qq圆的面积圆的面积圆的面积圆的面积(S)(S)与半径之间的关系可表示为与
6、半径之间的关系可表示为与半径之间的关系可表示为与半径之间的关系可表示为S S=R2 R2 qq企业的原材料消耗额企业的原材料消耗额企业的原材料消耗额企业的原材料消耗额(y y)与产量与产量与产量与产量(x x1)1)、单位产量单位产量单位产量单位产量消耗消耗消耗消耗(x x2)2)、原材料价格原材料价格原材料价格原材料价格(x x3)3)之间的关系可表示为之间的关系可表示为之间的关系可表示为之间的关系可表示为y y=x x1 1 x x2 2 x x3 3 1/27/20237商学院 李丽明变量间的关系变量间的关系(相关关系)(相关关系)n变量间关系不能用函变量间关系不能用函数关系精确表达数关
7、系精确表达n一个变量的取值不能一个变量的取值不能由另一个变量唯一确由另一个变量唯一确定定n当变量当变量 x 取某个值时,取某个值时,变量变量 y 的取值可能有的取值可能有几个几个n各观测点分布在直线各观测点分布在直线周围周围 x xy y1/27/20238商学院 李丽明变量间的关系变量间的关系(相关关系)(相关关系)n n 相关关系的例子相关关系的例子qq商品的消费量商品的消费量商品的消费量商品的消费量(y y)与居民收入与居民收入与居民收入与居民收入(x x)之间的关系之间的关系之间的关系之间的关系qq商品销售额商品销售额商品销售额商品销售额(y y)与广告费支出与广告费支出与广告费支出与
8、广告费支出(x x)之间的关系之间的关系之间的关系之间的关系qq粮食亩产量粮食亩产量粮食亩产量粮食亩产量(y y)与施肥量与施肥量与施肥量与施肥量(x x1)1)、降雨量降雨量降雨量降雨量(x x2)2)、温温温温度度度度(x x3)3)之间的关系之间的关系之间的关系之间的关系qq收入水平收入水平收入水平收入水平(y y)与受教育程度与受教育程度与受教育程度与受教育程度(x x)之间的关系之间的关系之间的关系之间的关系qq父亲身高父亲身高父亲身高父亲身高(y y)与子女身高与子女身高与子女身高与子女身高(x x)之间的关系之间的关系之间的关系之间的关系1/27/20239商学院 李丽明相关关系
9、的类型相关关系的类型1、按相关的程度可分为完全相关、不完全相关和、按相关的程度可分为完全相关、不完全相关和 不相关不相关2、按相关、按相关 的方向可分为正相关和负相关的方向可分为正相关和负相关3、按相关的形式可分为线性相关和非线性相关、按相关的形式可分为线性相关和非线性相关4、按所研究的变量多少可分为单相关、复相关和、按所研究的变量多少可分为单相关、复相关和偏相关偏相关1/27/202310商学院 李丽明相关关系的图示相关关系的图示完全正线性相关完全正线性相关完全正线性相关完全正线性相关完全正线性相关完全正线性相关 完全负线性相关完全负线性相关完全负线性相关完全负线性相关完全负线性相关完全负线
10、性相关 非线性相关非线性相关非线性相关非线性相关非线性相关非线性相关 正线性相关正线性相关正线性相关正线性相关正线性相关正线性相关 负线性相关负线性相关负线性相关负线性相关负线性相关负线性相关 不相关不相关不相关不相关不相关不相关1/27/202311商学院 李丽明二二.相关系数及其计算相关系数及其计算1/27/202312商学院 李丽明相关关系的测定相关关系的测定定性分析定性分析定量分析定量分析是是依据研究者的理论知识和实践经依据研究者的理论知识和实践经验,对客观现象之间是否存在相关验,对客观现象之间是否存在相关关系,以及何种关系作出判断关系,以及何种关系作出判断在在定性分析的基础上,通过编
11、制定性分析的基础上,通过编制相相关表关表、绘制绘制相关图相关图、计算计算相关系数相关系数与与判定系数判定系数等方法,来判断现象之等方法,来判断现象之间相关的方向、形态及密切程度间相关的方向、形态及密切程度1/27/202313商学院 李丽明相关关系的测度相关关系的测度(相关系数(相关系数)n对变量之间关系密切程度的度量对变量之间关系密切程度的度量n对两个变量之间线性相关程度的度量称为简对两个变量之间线性相关程度的度量称为简单相关系数单相关系数n若相关系数是根据总体全部数据计算的,称若相关系数是根据总体全部数据计算的,称为总体相关系数,记为为总体相关系数,记为 n若是根据样本数据计算的,则称为样
12、本相关若是根据样本数据计算的,则称为样本相关系数,记为系数,记为 r1/27/202314商学院 李丽明相关关系的测度相关关系的测度(相关系数)(相关系数)n一一.简单相关系数简单相关系数n简单相关分析是对两个变量之间的相关程度进行分析。简单相关分析是对两个变量之间的相关程度进行分析。n简单相关系数是在线性相关的条件下用来说明两个变量简单相关系数是在线性相关的条件下用来说明两个变量之间相关关系和相关密切程度的统计分析指标。之间相关关系和相关密切程度的统计分析指标。n 样本相关系数的计算公式样本相关系数的计算公式或或化简为化简为1/27/202315商学院 李丽明相关系数相关系数r r的取值的取
13、值范围:范围:-1r1-1r1r0 为为正相关正相关,r 0 为为负相关负相关;|r|=0 表示不存在表示不存在线性线性关系;关系;|r|1 表示表示完全完全线性线性相关相关;0|r|1表示存在表示存在不同程度线性相关不同程度线性相关:|r|0.4 为低度线性相关;为低度线性相关;0.4|r|0.7为显著性线性相关;为显著性线性相关;0.7|r|1.0为为高度高度显著性线性相关。显著性线性相关。1/27/202316商学院 李丽明相关系数的经验解释n|r|0.8时,可视为两个变量之间高度相关n0.5|r|0.8时,可视为中度相关n0.3|r|0.5时,视为低度相关n|r|t t,拒绝拒绝H H
14、0 0 若若 t t t t,不拒绝不拒绝H H0 01/27/202319商学院 李丽明相关关系的测度相关关系的测度(相关系数计算例子)(相关系数计算例子)【例例例例1 1】在在研研究究我我国国人人均均消消费费水水平平的的问问题题中中,把把全全国国人人均均消消费费额额记记为为y y,把把人人均均国国民民收收入入记记为为x x。我我们们收收集集到到1981198119931993年年的的样样本本数据数据(x xi i ,y yi i),i i=1,2,=1,2,,1313,数据见表数据见表5-15-1,计算相关系数。,计算相关系数。表表5-1 我国人均国民收入与人均消费金额数据我国人均国民收入
15、与人均消费金额数据 单位单位:元元年份年份人均人均国民收入国民收入人均人均消费金额消费金额年份年份人均人均国民收入国民收入人均人均消费金额消费金额1981198219831984198519861987393.8419.14460.86544.11668.29737.73859.972492672893294064515131988198919901991199219931068.81169.21250.71429.51725.92099.564369071380394711481/27/202320商学院 李丽明相关关系的测度相关关系的测度(计算结果(计算结果)n解:根据样本相关系数的计算公
16、式有解:根据样本相关系数的计算公式有n 人均国民收入与人均消费金额之间的相人均国民收入与人均消费金额之间的相关系数为关系数为 0.99871/27/202321商学院 李丽明相关关系的测度相关关系的测度(相关系数)(相关系数)n二二.有序数据的相关系数(等级相关系数)有序数据的相关系数(等级相关系数)n 对于许多难以用数字准确计量的现象之间的关系难以用单对于许多难以用数字准确计量的现象之间的关系难以用单相关系数去衡量,可以用等级相关系数。相关系数去衡量,可以用等级相关系数。n 有序数据是由数据在一个有序名单中的位置值组成。有序数据是由数据在一个有序名单中的位置值组成。n 定义定义Sperman
17、 秩相关系数为:秩相关系数为:n n等级相关系数的取值区间在等级相关系数的取值区间在-1和和1之间。之间。当当当当 的值愈接近于的值愈接近于的值愈接近于的值愈接近于1 1时,时,时,时,x x与与与与y y的相关程度愈强,当的相关程度愈强,当的相关程度愈强,当的相关程度愈强,当 值愈接近于值愈接近于值愈接近于值愈接近于0 0时,时,时,时,x x与与与与y y的相关程度愈弱。的相关程度愈弱。的相关程度愈弱。的相关程度愈弱。1/27/202322商学院 李丽明n例2:某次歌手大奖赛中两名评委对10名歌手的评分等级如下表,试分析两位评委评分的相关程度。参赛歌手编号12345678910甲评委评定的
18、等级x12594637108乙评委评定的等级y53968421710 求得两者等级相关系数为求得两者等级相关系数为求得两者等级相关系数为求得两者等级相关系数为0.3210.321,即两个评委的,即两个评委的,即两个评委的,即两个评委的评定等级的相关程度不高,说明两者结论一致。评定等级的相关程度不高,说明两者结论一致。评定等级的相关程度不高,说明两者结论一致。评定等级的相关程度不高,说明两者结论一致。1/27/202323商学院 李丽明相关关系的测度相关关系的测度(相关系数)(相关系数)n三、偏相关三、偏相关 所谓偏相关,是反指其它变量被固定后,计所谓偏相关,是反指其它变量被固定后,计算任意两个
19、变量之间的相关系数,这种相关系算任意两个变量之间的相关系数,这种相关系数称为数称为偏相关系数偏相关系数。关于相关关系的计算公式,只要求了解,不关于相关关系的计算公式,只要求了解,不要求记忆。要求记忆。1/27/202324商学院 李丽明相关分析的相关分析的SPSS操作操作Analyze Correlate Bivariate(计算变量间的相关系数)Partial(计算偏相关系数)1/27/202325商学院 李丽明作散点图对作散点图对作散点图对作散点图对话框话框话框话框例:人均国民收入与人均消费的相关分析例:人均国民收入与人均消费的相关分析例:人均国民收入与人均消费的相关分析例:人均国民收入与
20、人均消费的相关分析1/27/202326商学院 李丽明从图上可看出变量从图上可看出变量从图上可看出变量从图上可看出变量x x与与与与y y之间存在线性相关关系。之间存在线性相关关系。之间存在线性相关关系。之间存在线性相关关系。1/27/202327商学院 李丽明相关系数相关系数相关系数相关系数r=0.999r=0.999,双侧检验,双侧检验,双侧检验,双侧检验p=0.000.05p=0.000.7。1/27/202344商学院 李丽明n(2)显著性检验)显著性检验n 回归分析中的显著性检验包括两方面的内容:一是对各回归回归分析中的显著性检验包括两方面的内容:一是对各回归系数的显著性检验,通常采
21、用系数的显著性检验,通常采用t检验;检验;(在在SPSS中中,若若P值值 ,则则t检验通过)二是对整个回归方程的显著性检验,通常是在方检验通过)二是对整个回归方程的显著性检验,通常是在方差分析的基础上采用差分析的基础上采用F检验。检验。n在应用上最有意义的是检验回归系数在应用上最有意义的是检验回归系数 是否为零的问题。是否为零的问题。nH0:=0,H1:0n如果如果 =0,则回归直线变为,则回归直线变为y=,即,即y的取值与的取值与X的值无关,的值无关,即即x、y之间没有线性关系;如果之间没有线性关系;如果 0,则表明,则表明x与与y之间有一之间有一定的线性关系。定的线性关系。1/27/202
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 广西大学MBA 统计学 第六讲 相关与回归分析 广西大学 MBA 第六 相关 回归 分析

限制150内