第八章-相关分析与回归分析课件.ppt
《第八章-相关分析与回归分析课件.ppt》由会员分享,可在线阅读,更多相关《第八章-相关分析与回归分析课件.ppt(54页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、第八章第八章 相关分析与回归分析相关分析与回归分析第一节第一节 相关分析相关分析第二节第二节 回归分析回归分析第三节第三节 用用ExcelExcel计算相关系数和回归分析计算相关系数和回归分析第一节第一节 相关分析相关分析 【学习目标学习目标】了解相关分析的基本概念了解相关分析的基本概念;掌握相关分析的主要方法掌握相关分析的主要方法;了解回归分了解回归分析的基本概念析的基本概念;了解相关分析及回归分析之间的关系了解相关分析及回归分析之间的关系;掌握相关分析的掌握相关分析的主要方法主要方法;掌握最小平方原理在回归分析中的简单应用。掌握最小平方原理在回归分析中的简单应用。【章前导读章前导读】通过本
2、章学习,要对客观现象之间相互依存、相互制约的关系加通过本章学习,要对客观现象之间相互依存、相互制约的关系加以分析,分析它们之间存在什么样的关系,相关关系的密切程度,并以分析,分析它们之间存在什么样的关系,相关关系的密切程度,并且用一定的数量表现出来。要掌握这种分析方法并能应用于实际。要且用一定的数量表现出来。要掌握这种分析方法并能应用于实际。要掌握回归分析的概念及一元线性回归的分析方法。掌握回归分析的概念及一元线性回归的分析方法。【本章重点本章重点】:相关关系的概念及相关系数的计算:相关关系的概念及相关系数的计算;回归分析的概念及回归分析的概念及一元线性回归分析的方法一元线性回归分析的方法;相
3、关分析与回归分析的区别与联系。相关分析与回归分析的区别与联系。下一页下一页返回返回第一节第一节 相关分析相关分析引子引子:俗语中的相关,你知道吗俗语中的相关,你知道吗?人们在长期的实践生活中,总结出了很多俗语来形象地说明事物之间人们在长期的实践生活中,总结出了很多俗语来形象地说明事物之间的相关关系,比如的相关关系,比如“名师出高徒名师出高徒”,“强将手下无弱兵强将手下无弱兵”,“虎父无犬子虎父无犬子”,“龙生龙,凤生凤龙生龙,凤生凤”等。而现代统计学上的等。而现代统计学上的“相关相关”和和“回归回归”的概的概念是高尔顿第一次使用的。念是高尔顿第一次使用的。18861886年,高尔顿在研究人类身
4、高的遗传时,搜集了年,高尔顿在研究人类身高的遗传时,搜集了10781078对父亲及其儿对父亲及其儿子的身高数据。他发现这些数据的散点图大致呈直线状态,也就是说,总子的身高数据。他发现这些数据的散点图大致呈直线状态,也就是说,总的趋势是父亲的身高增加时,儿子的身高也倾向于增加。但是,高尔顿对的趋势是父亲的身高增加时,儿子的身高也倾向于增加。但是,高尔顿对试验数据进行了深入的分析,发现了一个很有趣的现象试验数据进行了深入的分析,发现了一个很有趣的现象回归效应。因为回归效应。因为当父亲高于平均身高时,他们的儿子身高比他更高的概率要小于比他更接当父亲高于平均身高时,他们的儿子身高比他更高的概率要小于比
5、他更接的概率的概率;下一页下一页返回返回上一页上一页第一节第一节 相关分析相关分析 父亲矮于平均身高时,他们的儿子身高比他更矮的概率要小于比他更高的父亲矮于平均身高时,他们的儿子身高比他更矮的概率要小于比他更高的概率。它反映了一个规律,即后代的身高,有向他们父辈的平均身高回归概率。它反映了一个规律,即后代的身高,有向他们父辈的平均身高回归的趋势,这就是统计学上最初出现的趋势,这就是统计学上最初出现“回归回归”时的含义。高尔顿还引进了回时的含义。高尔顿还引进了回归直线、相关系数的概念,创始了回归分析。归直线、相关系数的概念,创始了回归分析。那么相关分析、回归分析到底是什么意思,它们对我们的生活又
6、有哪那么相关分析、回归分析到底是什么意思,它们对我们的生活又有哪些帮助呢些帮助呢?一切客观事物都是相互联系和相互制约的。客观现象之间的相互联系,一切客观事物都是相互联系和相互制约的。客观现象之间的相互联系,可以通过一定的数量关系反映出来。相关分析的含义可分为函数关系和相可以通过一定的数量关系反映出来。相关分析的含义可分为函数关系和相关关系。关关系。函数关系是指现象之间存在的严格依存的、确定的数量关系。例如,函数关系是指现象之间存在的严格依存的、确定的数量关系。例如,圆的面积与半径之间的关系,圆的面积与半径之间的关系,S=S=下一页下一页返回返回上一页上一页第一节第一节 相关分析相关分析 一、相
7、关关系的概念和特点一、相关关系的概念和特点1.1.相关关系的概念。相关关系,即现象之间存在着不完全确定的依存关系。相关关系的概念。相关关系,即现象之间存在着不完全确定的依存关系。也就是说,当一个现象发生数量变化时,另一个也发生数量变化,但是这种也就是说,当一个现象发生数量变化时,另一个也发生数量变化,但是这种数量关系是不确定的,不是唯一的。例如,人们对消费品的需求量与人们的数量关系是不确定的,不是唯一的。例如,人们对消费品的需求量与人们的收入水平存在一定关系,收入越高,人们的消费量越大收入水平存在一定关系,收入越高,人们的消费量越大;收入越低,人们的消收入越低,人们的消费量越低,但同时消费量还
8、受其他因素的影响,如消费习惯、消费预期等。费量越低,但同时消费量还受其他因素的影响,如消费习惯、消费预期等。2.2.相关关系的特点相关关系的特点 (1)(1)现象之间确实存在数量上的相互依存关系。现象之间数量上的相互依存现象之间确实存在数量上的相互依存关系。现象之间数量上的相互依存关系表现在一个现象发生数量上的变化,另一个与之相联系的现象也会相应关系表现在一个现象发生数量上的变化,另一个与之相联系的现象也会相应地发生数量上的变化。例如,播种面积与收获量之间,播种面积越大,收获地发生数量上的变化。例如,播种面积与收获量之间,播种面积越大,收获量越大量越大;相反收获量越大,种植面积相应也较大。相反
9、收获量越大,种植面积相应也较大。下一页下一页返回返回上一页上一页第一节第一节 相关分析相关分析 在相互依存的两个变量中,可以根据研究的目的,把其中一个确定为自在相互依存的两个变量中,可以根据研究的目的,把其中一个确定为自变量,一般用变量,一般用x x表示表示;把另外一个对应变化的变量确定为因变量,一般用把另外一个对应变化的变量确定为因变量,一般用y y来表来表示。比如,播种面积量作为自变量,则收获量就是因变量示。比如,播种面积量作为自变量,则收获量就是因变量;把收获量作为自变把收获量作为自变量,则播种面积就是因变量。量,则播种面积就是因变量。(2)(2)现象之间数量上的关系是不确定的。即一个变
10、量虽受另一个现象之间数量上的关系是不确定的。即一个变量虽受另一个(或一组或一组)变量变量的影响,却并不由这一个的影响,却并不由这一个(或一组或一组)变量完全确定。如,体重与身高之间存在变量完全确定。如,体重与身高之间存在一定的依存关系,但身高为一定的依存关系,但身高为1.701.70米的人,其体重有许多个值米的人,其体重有许多个值;体重为体重为6060千克的千克的人,其身高也有许多个值。身高与体重之间没有完全确定的数量关系存在。人,其身高也有许多个值。身高与体重之间没有完全确定的数量关系存在。相关关系和函数关系虽是两种不同类型的变量关系,但它们之间并无严格的相关关系和函数关系虽是两种不同类型的
11、变量关系,但它们之间并无严格的界限。因测量误差的存在,确定的函数关系往往通过相关关系表现出来界限。因测量误差的存在,确定的函数关系往往通过相关关系表现出来;相反相反当人们对事物内部关系了解的越深刻,相关关系就有可能转化为确定关系。当人们对事物内部关系了解的越深刻,相关关系就有可能转化为确定关系。下一页下一页返回返回上一页上一页第一节第一节 相关分析相关分析 二、相关关系的种类二、相关关系的种类 现象之间的相关关系从不同的角度可以区分为不同类型。现象之间的相关关系从不同的角度可以区分为不同类型。1.1.按相关关系的方向划分按相关关系的方向划分 (1)(1)正相关。正相关是指两个变量之间的变化方向
12、一致,即当一个变量的正相关。正相关是指两个变量之间的变化方向一致,即当一个变量的值增加,另一个变量值也相应地增加值增加,另一个变量值也相应地增加;当一个变量的值减少,另一个变量当一个变量的值减少,另一个变量值也随之减少。例如,工人劳动生产率提高,产品产量也随之增加值也随之减少。例如,工人劳动生产率提高,产品产量也随之增加;居民居民的消费水平随个人所支配收入的增加而增加。正相关如的消费水平随个人所支配收入的增加而增加。正相关如图图8-18-1所示。所示。(2)(2)负相关。负相关是指两个变量的变化趋势相反,即当一个变量的值增负相关。负相关是指两个变量的变化趋势相反,即当一个变量的值增加或减少时,
13、另一个变量的值反而减少或增加加或减少时,另一个变量的值反而减少或增加(图图8-28-2)。例如,商品流转。例如,商品流转额越大,商品流通费用越低额越大,商品流通费用越低;利润随单位成本的降低而增加。利润随单位成本的降低而增加。下一页下一页返回返回上一页上一页第一节第一节 相关分析相关分析2.2.按相关形式的不同划分按相关形式的不同划分 (1)(1)线性相关。又称直线相关,是指当一个变量变动时,另一变量随之发生线性相关。又称直线相关,是指当一个变量变动时,另一变量随之发生大致均等的变动。如大致均等的变动。如图图8-38-3所示,观察点的分布近似地表现为一条直线。所示,观察点的分布近似地表现为一条
14、直线。(2)(2)非线性相关非线性相关(曲线相关曲线相关)。当一个变量变动时,另一变量也随之发生变动,。当一个变量变动时,另一变量也随之发生变动,但这种变动是不均等的。例如,工人加班时间在一定数量界限内,产量增加,但这种变动是不均等的。例如,工人加班时间在一定数量界限内,产量增加,但一旦超过一定限度,产量反而可能下降,这就是一种非线性关系。如但一旦超过一定限度,产量反而可能下降,这就是一种非线性关系。如图图8-8-4 4所示,观察点的分布近似地表现为一条曲线。所示,观察点的分布近似地表现为一条曲线。3.3.按相关程度划分按相关程度划分 (1)(1)完全相关。当一个变量的数量变化完全由另一个变量
15、的数量变化所唯一完全相关。当一个变量的数量变化完全由另一个变量的数量变化所唯一确定时,这两个变量之间的关系为完全相关。在这种情况下,相关关系实际确定时,这两个变量之间的关系为完全相关。在这种情况下,相关关系实际就是函数关系,所以函数关系是相关关系的一种特殊情况。就是函数关系,所以函数关系是相关关系的一种特殊情况。下一页下一页返回返回上一页上一页第一节第一节 相关分析相关分析 在价格不变的条件下,销售额与销售量之间的函数关系即为完全相关,此时在价格不变的条件下,销售额与销售量之间的函数关系即为完全相关,此时相关关系便成为函数关系,如相关关系便成为函数关系,如图图8-58-5所示。所示。(2)(2
16、)不相关。如果两个变量彼此的数量变化相互独立,没有关系,这种关系不相关。如果两个变量彼此的数量变化相互独立,没有关系,这种关系称为不相关。例如,股票价格的高低与气温的高低一般情况下是不相关的,称为不相关。例如,股票价格的高低与气温的高低一般情况下是不相关的,不相关关系如不相关关系如图图8-68-6所示。所示。(3)(3)不完全相关。它指的是两个变量之间的关系介于完全相关和不相关之间。不完全相关。它指的是两个变量之间的关系介于完全相关和不相关之间。大多数相关关系属于不完全相关,如大多数相关关系属于不完全相关,如图图8-78-7所示,就属于不完全相关关系。所示,就属于不完全相关关系。4.4.按自变
17、量的多少划分按自变量的多少划分 (1)(1)单相关。只反映一个自变量和一个因变量之间的相关关系。单相关。只反映一个自变量和一个因变量之间的相关关系。(2)(2)复相关。反映两个或者两个以上的自变量同一个因变量的相关关系。例复相关。反映两个或者两个以上的自变量同一个因变量的相关关系。例如,商品销售额与居民收入、商品价格之间的相关关系。如,商品销售额与居民收入、商品价格之间的相关关系。下一页下一页返回返回上一页上一页第一节第一节 相关分析相关分析 三、相关关系的判定三、相关关系的判定 (一一)表格法表格法 表格法是一种反映变量之间相关关系的统计表。将某一变量按其取值表格法是一种反映变量之间相关关系
18、的统计表。将某一变量按其取值的大小排列,然后再将与其相关的另一变量的对应值平行排列,便可得到的大小排列,然后再将与其相关的另一变量的对应值平行排列,便可得到简单的相关表。简单的相关表。例例8-1 8-1 某地区某企业近某地区某企业近8 8年产品产量与生产费用的相关情况见年产品产量与生产费用的相关情况见表表8-l8-l。从表从表8-18-1可以看出,产品产量与生产费用之间存在一定的正相关关系。可以看出,产品产量与生产费用之间存在一定的正相关关系。(二二)相关图。相关图又称散点图,它是将相关表中的观测值在平面直角坐相关图。相关图又称散点图,它是将相关表中的观测值在平面直角坐标系中用坐标点描绘出来,
19、以表明相关点的分布状况。通过相关图,可以标系中用坐标点描绘出来,以表明相关点的分布状况。通过相关图,可以大致看出两个变量之间有无相关关系以及相关的形态、方向和密切程度。大致看出两个变量之间有无相关关系以及相关的形态、方向和密切程度。下一页下一页返回返回上一页上一页第一节第一节 相关分析相关分析 例例8-2 8-2 以表以表8-18-1为例,用为例,用ExcelExcel绘制相关图,其产品产量与生产费用的相关情绘制相关图,其产品产量与生产费用的相关情况如况如图图8-88-8所示。所示。通过相关散点图的形状,大概可以判断变量之间是否具有相关关系,以通过相关散点图的形状,大概可以判断变量之间是否具有
20、相关关系,以及相关方向、相关程度的强弱,但并不能得知其相关的确切程度。为精确了及相关方向、相关程度的强弱,但并不能得知其相关的确切程度。为精确了解变量间的相关程度,还需作进一步统计分析。在统计上,一般通过计算相解变量间的相关程度,还需作进一步统计分析。在统计上,一般通过计算相关系数来测定两种现象的相关程度。关系数来测定两种现象的相关程度。(三三)相关系数相关系数1.1.相关系数的意义相关系数的意义 相关系数是在直线相关的条件下,说明两个现象之间相关密切程度的统相关系数是在直线相关的条件下,说明两个现象之间相关密切程度的统计分析指标,通常用计分析指标,通常用r r来表示。相关系数来表示。相关系数
21、r r的取值范围在的取值范围在-1-1和和+1+1之间,即之间,即-1 1r r1 1。正负号表明两变量间变化的方向。正负号表明两变量间变化的方向;|r|;|r|表明两变量间相关的程度,表明两变量间相关的程度,下一页下一页返回返回上一页上一页第一节第一节 相关分析相关分析 即即r0r0表示正相关,表示正相关,-r0-r0表示负相关,表示负相关,r=0r=0表示无直线相关。表示无直线相关。|r|r|越接近于越接近于1 1,表明两变量相关程度越高,它们之间的关系越密切。表明两变量相关程度越高,它们之间的关系越密切。r=r=1 1,表示两个变量完,表示两个变量完全直线相关。如果全直线相关。如果r=0
22、r=0,则表示两个变量之间不是直线相关。这里要特别注意,则表示两个变量之间不是直线相关。这里要特别注意的是,的是,r r仅表示两个变量的直线相关密切程度,当仅表示两个变量的直线相关密切程度,当r r很小甚至等于零时,并不很小甚至等于零时,并不一定表不两个变量之间就不存在其他非直线类型的相关关系。为了在判断时一定表不两个变量之间就不存在其他非直线类型的相关关系。为了在判断时有个标准,现在介绍一种相关关系密切程度的划分方法,见有个标准,现在介绍一种相关关系密切程度的划分方法,见表表8-28-2。2.2.相关系数的计算相关系数的定义公式为相关系数的计算相关系数的定义公式为下一页下一页返回返回上一页上
23、一页第一节第一节 相关分析相关分析 式中式中:n:n为资料项数为资料项数;表示表示x x变量的标准差变量的标准差;表示表示y y变量的标准差变量的标准差;表示表示x x,y y变量数列的协方差。变量数列的协方差。在实际应用中,如果依据原始资料计算相关系数,数据计算过于复杂,在实际应用中,如果依据原始资料计算相关系数,数据计算过于复杂,因此经常用下面的简化公式进行计算的。因此经常用下面的简化公式进行计算的。下一页下一页返回返回上一页上一页第一节第一节 相关分析相关分析 例例8-3 8-3 计算计算1010个企业生产性固定资产价值与其工业增加值之间的相关系数。个企业生产性固定资产价值与其工业增加值
24、之间的相关系数。资料见资料见表表8-38-3。将表将表8-38-3中的数据代人相关系数计算公式得中的数据代人相关系数计算公式得 上述计算结果表明,生产性固定资产价值和工业增加值之间存在高度的正上述计算结果表明,生产性固定资产价值和工业增加值之间存在高度的正相关关系。相关关系。返回返回上一页上一页第二节第二节 回归分析回归分析 一、回归分析的概念和种类一、回归分析的概念和种类 回归分析是在相关分析的基础上,考察变量之间的数量变化规律,回归分析是在相关分析的基础上,考察变量之间的数量变化规律,并通过一定的数学表达式描述它们之间的关系,进而确定一个或几个变并通过一定的数学表达式描述它们之间的关系,进
25、而确定一个或几个变量的变化对另一个特定变量的影响程度。相关分析旨在测度变量之间的量的变化对另一个特定变量的影响程度。相关分析旨在测度变量之间的密切程度,它所使用的测度工具就是相关系数密切程度,它所使用的测度工具就是相关系数;而回归分析则侧重于考察而回归分析则侧重于考察变量之间的数量变化规律,其所使用的数学工具就是配合回归模型。变量之间的数量变化规律,其所使用的数学工具就是配合回归模型。回归分析有线性回归分析与非线性回归分析之分,其中线性回归分回归分析有线性回归分析与非线性回归分析之分,其中线性回归分析是我们研究的重点。在线性回归分析中,又有一元线性回归分析与多析是我们研究的重点。在线性回归分析
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 第八 相关 分析 回归 课件
限制150内