第十二章相关和回归分析课件.ppt
《第十二章相关和回归分析课件.ppt》由会员分享,可在线阅读,更多相关《第十二章相关和回归分析课件.ppt(50页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、 第十二章相关和回归分析第十二章相关和回归分析第十二章相关和回归分析第一节相关分析概述第一节相关分析概述一、一、 相关分析的概念相关分析的概念 客观世界中的许多现象都存在着一定的联系客观世界中的许多现象都存在着一定的联系,它它们互相依赖、互相制约、互相作用。们互相依赖、互相制约、互相作用。 离开周围的现象而孤立存在的现象几乎是没有离开周围的现象而孤立存在的现象几乎是没有的。的。 现象之间的这种数量联系现象之间的这种数量联系,归纳起来归纳起来,可以分为两可以分为两种类型种类型:一种是确定性关系一种是确定性关系,也称函数关系也称函数关系,另一种另一种是非确定性关系是非确定性关系,则称为相关关系则称
2、为相关关系。 函数关系是现象间存在的确定的依存关系函数关系是现象间存在的确定的依存关系,即对自变量的即对自变量的任何一个值任何一个值,因变量都有唯一确定的值与之相对应。函数因变量都有唯一确定的值与之相对应。函数关系通常可以用数学公式确切地表示出来。如圆的面积:关系通常可以用数学公式确切地表示出来。如圆的面积: S=R2, 相关关系一般是不确定的相关关系一般是不确定的,当一个现象发生变化时当一个现象发生变化时,另另一个现象也相应地发生变化一个现象也相应地发生变化,但其变化的数值是不固定的但其变化的数值是不固定的,往往会出现几个不同的数值与其对应往往会出现几个不同的数值与其对应,这些数值分布在它这
3、些数值分布在它们的平均数周围。例如们的平均数周围。例如,当取身高为当取身高为1.70米进行调查时米进行调查时,凡凡是身高为是身高为1.70米的人的体重却不完全相等。米的人的体重却不完全相等。 在统计上在统计上,把现象之间存在的这种不确定的关系称为相把现象之间存在的这种不确定的关系称为相关关系关关系,从数量上研究现象之间相关关系的理论和方法称从数量上研究现象之间相关关系的理论和方法称为相关分析。为相关分析。 二、相关关系的种类二、相关关系的种类相关关系按分类依据不同相关关系按分类依据不同,可作不同的分类。可作不同的分类。(一一)按相关的程度不同可分为:按相关的程度不同可分为: 不相关不相关 不完
4、全相关不完全相关 完全相关完全相关 如果如果两个现象互不影响两个现象互不影响,彼此的数量变化互相独立彼此的数量变化互相独立,这种这种关系称为不相关。关系称为不相关。 如果如果一个现象的数量变化由另一个现象的数量变化所唯一个现象的数量变化由另一个现象的数量变化所唯一确定一确定,这时两个现象间的关系称为完全相关。这种情况这时两个现象间的关系称为完全相关。这种情况下下,相关关系实际是函数关系相关关系实际是函数关系.所以所以,函数关系是相关关系的函数关系是相关关系的一种特殊情况。一种特殊情况。 如果如果两个现象之间的关系介于不相关和完全相关之间两个现象之间的关系介于不相关和完全相关之间,就称为不完全相
5、关。大多数相关现象都是不完全相关现象。就称为不完全相关。大多数相关现象都是不完全相关现象。(二二)按相关的方向不同可分为:按相关的方向不同可分为: 正相关正相关 负相关负相关 两个相关现象之间两个相关现象之间,呈现出同方向变化趋势时呈现出同方向变化趋势时,这种相关关系称为正相关。如这种相关关系称为正相关。如消费支出与工资收入之间就是正相关消费支出与工资收入之间就是正相关; 两个现象之间呈现出反方向变化趋势时两个现象之间呈现出反方向变化趋势时,这种相关关系称为负相关。如劳动这种相关关系称为负相关。如劳动生产率与单位产品成本之间的关系生产率与单位产品成本之间的关系,就是负相关。就是负相关。(三三)
6、按相关的形式不同可分为:按相关的形式不同可分为: 直线相关直线相关 曲线相关曲线相关 当相关的一个变量的数值增加时当相关的一个变量的数值增加时,另一个变量的数值相应地发生大致均等的另一个变量的数值相应地发生大致均等的增加增加,如果将各对观测值画成散点图如果将各对观测值画成散点图,则各个观测点的分布近似地表现为直线则各个观测点的分布近似地表现为直线形式形式.这种相关关系称为直线相关这种相关关系称为直线相关; 当相关的一个变量变动时当相关的一个变量变动时,另一个变量也相应的发生变动另一个变量也相应的发生变动,但这种变动是不均但这种变动是不均等的等的,从散点图上看从散点图上看,各个观测点的分布近似地
7、表现为各种不同的曲线各个观测点的分布近似地表现为各种不同的曲线,这种相这种相关关系就称为曲线相关。关关系就称为曲线相关。 (四四)按相关因素的多少不同可分为:按相关因素的多少不同可分为: 单相关单相关 复相关复相关 单相关是指两个变量之间的相关关系。单相关是指两个变量之间的相关关系。 一个变量和两个或两个以上变量之间的相一个变量和两个或两个以上变量之间的相关关系关关系,称为复相关。称为复相关。 三、相关分析的步骤三、相关分析的步骤(一一)根据对客观现象的根据对客观现象的定性认识定性认识来进行判断现来进行判断现象之间的相关性象之间的相关性(二二)绘制相关图绘制相关图(三三)计算相关系数计算相关系
8、数(四四)进行回归分析进行回归分析确定回归直线确定回归直线(五五)计算估计标准误差计算估计标准误差(六六)进行回归估计或回归预测进行回归估计或回归预测第二节相关图和相关系数第二节相关图和相关系数一、一、 相关图相关图 相关图又叫散点图、散布图。它是利用直角坐相关图又叫散点图、散布图。它是利用直角坐标系标系,将其中一个变量的值放在横轴上将其中一个变量的值放在横轴上,另一变量另一变量的值放在纵轴上的值放在纵轴上,将两变量的对应值用坐标点画出将两变量的对应值用坐标点画出来来,通过观察相关点的分布情况通过观察相关点的分布情况,大致可以看出两大致可以看出两个变量之间有无相关关系及相关的类型和密切程个变量
9、之间有无相关关系及相关的类型和密切程度。度。 两个变量之间相关关系的各种类型两个变量之间相关关系的各种类型,都可以用相都可以用相关图表示出来关图表示出来,如图如图12-1、图、图12-2、图、图12-3所示。所示。 图图12-1相关图相关图图图12-2正、负相关图正、负相关图图图123直线、非直线直线、非直线相关图相关图二、相关系数二、相关系数(一一)相关系数的概念相关系数的概念 从相关图可以判断两个现象之间是否相从相关图可以判断两个现象之间是否相关以及相关的类型关以及相关的类型,但但不能准确不能准确判断相关的判断相关的密切程度。要判断现象之间相关关系的密密切程度。要判断现象之间相关关系的密切
10、程度切程度,需要计算相关系数。需要计算相关系数。 相关系数是在直线相关条件下说明两个相关系数是在直线相关条件下说明两个变量之间相关关系密切程度的统计指标。变量之间相关关系密切程度的统计指标。严格地讲严格地讲,应称为应称为直线直线相关系数相关系数,一般简称相一般简称相关系数。关系数。 (二二)相关系数的计算相关系数的计算 积差式积差式 简捷式简捷式22)()()(yyxxyyxxr2222)()()(yynxxnyxxynr(三三)相关系数密切程度的判断相关系数密切程度的判断 一般情况下一般情况下,通过相关系数判断相关关系密切程度的通过相关系数判断相关关系密切程度的标准如下标准如下:当当r=0时
11、时,X和和Y不相关。或者不存在直线相关不相关。或者不存在直线相关,但可能存但可能存在其他类型的关系。在其他类型的关系。当当 0 r 0.3时时,X和和Y为微弱相关。为微弱相关。当当0.3 r 0.5时时,X和和Y为低度相关。为低度相关。当当0.5 r 0.8时时,X和和Y为中度相关。为中度相关。当当0.8 r 0.765,故认为故认为X和和Y之间的直线相关系数在之间的直线相关系数在=0.01水平上是显著的。水平上是显著的。这个结果与一般教材上采用这个结果与一般教材上采用t检验法是相一致的。检验法是相一致的。 四、等级相关系数及其检验四、等级相关系数及其检验 (一一)等级相关系数等级相关系数 前
12、述采用前述采用积差法积差法计算的相关系数计算的相关系数r,它只适用于变量它只适用于变量X、Y的观测值的观测值(即即数量标志值数量标志值)都是基数的情况下都是基数的情况下,而且是属于而且是属于线性关系。如果两个变量线性关系。如果两个变量X和和Y是以是以品质标志品质标志出现的出现的,要研要研究它们之间是否具有相关关系究它们之间是否具有相关关系,则要用则要用等级等级相关系数进行相关系数进行计算。计算。 等级相关系数侧重于观测的现象的等级等级相关系数侧重于观测的现象的等级,就是把有关联就是把有关联的品质标志按其表现排列成等级次序的品质标志按其表现排列成等级次序(当然数量标志值更当然数量标志值更容易排成
13、等级次序容易排成等级次序),形成形成X、Y的两个序数数列的两个序数数列,再测定这再测定这两个序数数列之间的相关程度两个序数数列之间的相关程度,用这种方法计算的相关指用这种方法计算的相关指标标,就叫等级相关系数。这里主要介绍统计学家斯皮尔曼就叫等级相关系数。这里主要介绍统计学家斯皮尔曼相关系数,用相关系数,用rs表示。表示。 斯皮尔曼相关系数公式:斯皮尔曼相关系数公式: 式中式中:n为样本容量为样本容量;D为序列等级之差。利用为序列等级之差。利用斯皮尔曼等级相关系数还可以判断多元线性斯皮尔曼等级相关系数还可以判断多元线性回归模型中是否存在异方差性回归模型中是否存在异方差性,) 1(6122nnD
14、rs(二二)等级相关系数的显著性检验等级相关系数的显著性检验 等级相关系数的显著性检验在样本容等级相关系数的显著性检验在样本容量不大时量不大时,同样可以查询斯皮尔曼等级相关同样可以查询斯皮尔曼等级相关系数临界值表系数临界值表(见附表见附表5),若若|rs|的值超过了表的值超过了表中的监界值中的监界值,则认为总体等级相关系数不等则认为总体等级相关系数不等于零于零,变量变量X和和Y的等级之间具有一定的相关的等级之间具有一定的相关关系。关系。 五、计算相关系数应注意的问题五、计算相关系数应注意的问题(1) 变量变量Y与变量与变量X的相关系数的相关系数等于等于变量变量X与变量与变量Y的的相关系数。相关
15、系数。(2) 简单相关系数只适用于两个变量之间的相关关系。简单相关系数只适用于两个变量之间的相关关系。若变量为三个或三个以上时若变量为三个或三个以上时,就要用复相关系数就要用复相关系数(或偏相关系系数或偏相关系系数)计算。计算。(3) 相关系数相关系数r只适用于简单直线相关只适用于简单直线相关,如果是非直线如果是非直线相关相关,就要用相关就要用相关指数指数。(4) 相关分析要以定性分析为前提相关分析要以定性分析为前提,不然就会出现不然就会出现“虚拟相关虚拟相关”。因为相关系数仅从统计上表明现。因为相关系数仅从统计上表明现象之间的数量关系象之间的数量关系,即使相关系数接近即使相关系数接近1也并不
16、意也并不意味着数据之间存在着因果关系。味着数据之间存在着因果关系。 第三节回归分析第三节回归分析一、一、 回归分析的概念回归分析的概念 研究现象之间的一般关系求出关系方程式研究现象之间的一般关系求出关系方程式,由此对某变由此对某变量的一个值推断出另一变量的可能值量的一个值推断出另一变量的可能值,就称为就称为回归分析回归分析。 它实际上是将相关现象间不确定、不规则的数量关系它实际上是将相关现象间不确定、不规则的数量关系一般化、规则化。一般化、规则化。 采用的方法是配合直线或曲线,用这条直线或曲线来代采用的方法是配合直线或曲线,用这条直线或曲线来代表现象之间的一般数量关系。这条直线或曲线叫表现象之
17、间的一般数量关系。这条直线或曲线叫回归直线回归直线或回归曲线或回归曲线,它们的方程式叫它们的方程式叫直线回归方程直线回归方程或曲线回归方或曲线回归方程。程。 二、回归分析与相关分析的联系与区别二、回归分析与相关分析的联系与区别 回归分析与相关分析有着密切的联系。回归分析与相关分析有着密切的联系。 一方面相关分析是回归分析的基础和前提一方面相关分析是回归分析的基础和前提,如果缺少相关如果缺少相关分析分析,没有从定性上说明现象间是否具有相关关系没有从定性上说明现象间是否具有相关关系,没有对没有对相关关系的密切程度作出判断相关关系的密切程度作出判断,就不能进行回归分析就不能进行回归分析,即使即使勉强
18、进行了回归分析勉强进行了回归分析,也是没有意义的也是没有意义的; 另一方面另一方面,回归分析是相关分析的深入和继续回归分析是相关分析的深入和继续,仅仅说明仅仅说明现象间具有密切的相关关系是不够的现象间具有密切的相关关系是不够的,只有进行了回归分只有进行了回归分析析,拟合了回归方程拟合了回归方程,才可能进行有关的分析和预测才可能进行有关的分析和预测,相关分相关分析才有实际的意义。析才有实际的意义。 因此因此,如果仅有回归分析而缺少相关分析如果仅有回归分析而缺少相关分析,将会因为缺将会因为缺乏必要的基础和前提而影响回归分析的可靠性乏必要的基础和前提而影响回归分析的可靠性,如果仅有如果仅有相关分析而
19、缺少回归分析相关分析而缺少回归分析,就犹如有头无尾就犹如有头无尾,没有实际结果没有实际结果而降低相关分析的意义。只有把两者结合起来而降低相关分析的意义。只有把两者结合起来,才能达到才能达到统计分析的目的。统计分析的目的。 回归分析与相关分析有如下区别回归分析与相关分析有如下区别:(1) 相关分析所研究的两个变量是对等关系相关分析所研究的两个变量是对等关系,不反映不反映任何自变量和因变量的关系任何自变量和因变量的关系;回归分析所研究的两回归分析所研究的两个变量不是对等关系个变量不是对等关系,必须根据研究目的必须根据研究目的,先确定先确定一个为自变量一个为自变量,另一个为因变量。另一个为因变量。(
20、2) 对两个变量对两个变量X和和Y来说来说,相关分析只能计算出一个相关分析只能计算出一个反映两变量间相关密切程度的相关系数反映两变量间相关密切程度的相关系数;回归分析回归分析可分别建立两个不同的回归方程。以可分别建立两个不同的回归方程。以X为自变为自变量量,Y为因变量为因变量,可以得出可以得出Y关于关于X的回归方程。以的回归方程。以Y为自变量为自变量,以以X为因变量为因变量,可得出可得出X关于关于Y的回归方程。的回归方程。(3) 相关分析对资料的要求是相关分析对资料的要求是,两个变量都必须是随两个变量都必须是随机的机的;而回归分析对资料的要求是而回归分析对资料的要求是,自变量是给定自变量是给定
21、的的,因变量是随机的。因变量是随机的。三、简单回归直线的确定三、简单回归直线的确定 (一一)简单直线回归的概念简单直线回归的概念 通过计算相关系数通过计算相关系数,可以判断两个变量之间直线相关的密切程度可以判断两个变量之间直线相关的密切程度,但但不能说明它们之间因果关系的数量表现。简单直线回归就是对具有不能说明它们之间因果关系的数量表现。简单直线回归就是对具有显著直线相关的两个变量间数量变化的一般关系进行测定显著直线相关的两个变量间数量变化的一般关系进行测定,配合一个配合一个直线回归方程直线回归方程,以便于估计或预测的统计方法。以便于估计或预测的统计方法。 进行简单直线回归之前进行简单直线回归
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 第十二 相关 回归 分析 课件
限制150内