统计学 第七章 相关分析.ppt
《统计学 第七章 相关分析.ppt》由会员分享,可在线阅读,更多相关《统计学 第七章 相关分析.ppt(100页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、第七章第七章 相关关系分析法相关关系分析法 x xy y西安石油大学经管院西安石油大学经管院第七章第七章 相关分析相关分析相关关系分析概述相关关系分析概述简单直线相关分析简单直线相关分析简单直线回归分析简单直线回归分析曲线回归及多元线性回归分析曲线回归及多元线性回归分析其他相关系数的介绍其他相关系数的介绍研究内容:研究内容:本章学习目的本章学习目的通过本章的学习要求理解相关分析和回归通过本章的学习要求理解相关分析和回归通过本章的学习要求理解相关分析和回归通过本章的学习要求理解相关分析和回归分析的有关概念,研究内容,掌握计算相分析的有关概念,研究内容,掌握计算相分析的有关概念,研究内容,掌握计算
2、相分析的有关概念,研究内容,掌握计算相关系数和配合回归方程的方法,并能结合关系数和配合回归方程的方法,并能结合关系数和配合回归方程的方法,并能结合关系数和配合回归方程的方法,并能结合实际资料对变量进行相关与回归分析。实际资料对变量进行相关与回归分析。实际资料对变量进行相关与回归分析。实际资料对变量进行相关与回归分析。本章重点难点本章重点难点v 重点重点重点重点:相关关系的概念和种类、相:相关关系的概念和种类、相:相关关系的概念和种类、相:相关关系的概念和种类、相关系数的计算及应用;回归分析的概念、关系数的计算及应用;回归分析的概念、关系数的计算及应用;回归分析的概念、关系数的计算及应用;回归分
3、析的概念、配合直线回归方程的方法、参数配合直线回归方程的方法、参数配合直线回归方程的方法、参数配合直线回归方程的方法、参数a a a a和和和和b b b b的的的的经济含义。经济含义。经济含义。经济含义。vv 难点难点难点难点:相关系数的计算、配合直线:相关系数的计算、配合直线:相关系数的计算、配合直线:相关系数的计算、配合直线回归方程的方法、相关分析与回归分析回归方程的方法、相关分析与回归分析回归方程的方法、相关分析与回归分析回归方程的方法、相关分析与回归分析的区别与联系、估计标准误的计算。的区别与联系、估计标准误的计算。的区别与联系、估计标准误的计算。的区别与联系、估计标准误的计算。(一
4、一)函数关系函数关系第一节第一节 相关关系分析概述相关关系分析概述一、相关关系的的概念一、相关关系的的概念函数关系:函数关系:是指变量之间存在着严格的依存关系是指变量之间存在着严格的依存关系在这种关系中,当自变量取定一个数值时,因变在这种关系中,当自变量取定一个数值时,因变量会有一个完全确定的值和它对应。量会有一个完全确定的值和它对应。或对于某一变量的每一个数值,另一变量都会有或对于某一变量的每一个数值,另一变量都会有唯一确定的值与之相对应,并且这种关系可用一唯一确定的值与之相对应,并且这种关系可用一个数学表达式反映出来。如图个数学表达式反映出来。如图1-11-1所示。所示。如圆的面积如圆的面
5、积=圆周率圆周率半径半径2 2销售额销售额=销售量销售量销售价格(价格一定时)销售价格(价格一定时)相关关系分析概述相关关系分析概述 x x x xy y y y距离距离=速度速度时间(在匀速条件下)时间(在匀速条件下)图图1-11-1相关关系分析概述相关关系分析概述(二二)相关关系相关关系相关关系:相关关系:它是指现象之间确实存在的、但关系它是指现象之间确实存在的、但关系值不固定的相互依存关系。或现象之间客观存在值不固定的相互依存关系。或现象之间客观存在的不严格、不确定的数量依存关系。如图的不严格、不确定的数量依存关系。如图1-21-2所示。所示。例如粮食亩产量与施肥量之间例如粮食亩产量与施
6、肥量之间、某种日用品的销某种日用品的销售量与当地居民的人口数、身高与体重之间等。售量与当地居民的人口数、身高与体重之间等。x x x xy y y y图图1-21-2相关关系分析概述相关关系分析概述不相关:若两种现象之间彼此互不影响,其数不相关:若两种现象之间彼此互不影响,其数量变化各自独立,则为不相关。量变化各自独立,则为不相关。(一)按相关的程度分为:完全相关、不完全相(一)按相关的程度分为:完全相关、不完全相关和不相关关和不相关完全相关:两种现象之间,其中一个现象的数完全相关:两种现象之间,其中一个现象的数量变化完全由另一个现象的数量变化所确定,则量变化完全由另一个现象的数量变化所确定,
7、则这两种现象之间的关系为完全相关。这两种现象之间的关系为完全相关。不完全相关:若两种现象之间的关系介于完全不完全相关:若两种现象之间的关系介于完全相关和不相关之间,则称其为不完全相关相关和不相关之间,则称其为不完全相关 。二、相关关系的种类二、相关关系的种类相关关系分析概述相关关系分析概述(二)按变量之间相关关系的(二)按变量之间相关关系的方向分(按相关的方向分(按相关的 性性质质分):分):正相关正相关 和负相关和负相关 正相关:正相关:当一个变量当一个变量x x的值增加(或减少),另一个的值增加(或减少),另一个变量变量y y的值也随之增加(或减少)(同方向变动)。的值也随之增加(或减少)
8、(同方向变动)。例如:例如:家庭的消费支出随着收入的增加而增加;随家庭的消费支出随着收入的增加而增加;随着技术水平的提高,产品合格率也不断提高等。着技术水平的提高,产品合格率也不断提高等。负相关:负相关:当一个变量当一个变量x x的值增加(减少)时,另一个的值增加(减少)时,另一个变量变量y y的值随之减少(增加)(反方向变动)。的值随之减少(增加)(反方向变动)。例如:例如:商品流转的规模越大,单位流通费用越低;劳商品流转的规模越大,单位流通费用越低;劳动生产率水平提高,单位产品成本随之下降。动生产率水平提高,单位产品成本随之下降。相关关系分析概述相关关系分析概述正相关、负相关若用散点图表示
9、如图正相关、负相关若用散点图表示如图1-31-3中中(1 1)、()、(2 2)所示。)所示。相关关系分析概述相关关系分析概述图图1-31-3(三)按相关的形式分:直线相关和曲线相关(三)按相关的形式分:直线相关和曲线相关 直线相关:直线相关:当一个变量发生增减变动时,另一变当一个变量发生增减变动时,另一变量随之发生大体均等的增减变动。量随之发生大体均等的增减变动。或或一种现象的一种现象的一个数值和另一种现象相应的数值,在平面坐标一个数值和另一种现象相应的数值,在平面坐标系中确定为一个点,称为散点(相关点),若相系中确定为一个点,称为散点(相关点),若相关点大致分布在一条直线的周围,则为线性相
10、关。关点大致分布在一条直线的周围,则为线性相关。曲线相关:曲线相关:当一个变量发生变动时,另一变量的当一个变量发生变动时,另一变量的值也随之发生变动,但这种变动是不均等的,在值也随之发生变动,但这种变动是不均等的,在图形上,其观察点分布在各种不同的曲线周围。图形上,其观察点分布在各种不同的曲线周围。相关关系分析概述相关关系分析概述(3 3)图图1-41-4为直线相关图(为直线相关图(1 1)()(2 2),图),图1-51-5为曲线相为曲线相关图(关图(3 3)()(4 4):):相关关系分析概述相关关系分析概述图图1-41-4图图1-51-5(四)按研究变量(四)按研究变量的多少分的多少分
11、:单相关:单相关 和复相关和复相关 单相关:单相关:研究两个变量之间的相关关系为单相关,研究两个变量之间的相关关系为单相关,即一个因变量和一个自变量之间的相关关系。即一个因变量和一个自变量之间的相关关系。例如:例如:劳动生产率与单位产品成本之间的关系、收劳动生产率与单位产品成本之间的关系、收入水平入水平(y y)与受教育程度与受教育程度(x x)之间的关系;之间的关系;复相关:复相关:研究三个或三个以上变量之间的相关关系。研究三个或三个以上变量之间的相关关系。例如:例如:同时研究商品的销售额、广告费支出、居民同时研究商品的销售额、广告费支出、居民收入水平之间的关系;研究某种商品的需求量与价收入
12、水平之间的关系;研究某种商品的需求量与价格水平及人们的收入水平之间的关系。格水平及人们的收入水平之间的关系。相关关系分析概述相关关系分析概述相关关系的图示相关关系的图示 不相关不相关不相关不相关不相关不相关 负线性相关负线性相关负线性相关负线性相关负线性相关负线性相关 正线性相关正线性相关正线性相关正线性相关正线性相关正线性相关 非线性相关非线性相关非线性相关非线性相关非线性相关非线性相关 完全负线性相关完全负线性相关完全负线性相关完全负线性相关完全负线性相关完全负线性相关完全正线性相关完全正线性相关完全正线性相关完全正线性相关完全正线性相关完全正线性相关 相关关系分析概述相关关系分析概述 确
13、定经济现象之间是否存在相关关系及相关确定经济现象之间是否存在相关关系及相关 关系的种类。关系的种类。确定经济现象之间相关关系的密切程度确定经济现象之间相关关系的密切程度 ;建立经济现象之间数量变动关系的数学方程式建立经济现象之间数量变动关系的数学方程式 ;确定因变量估计值误差的程度确定因变量估计值误差的程度 三、相关关系分析的主要三、相关关系分析的主要内容内容(任务)(任务)相关关系分析概述相关关系分析概述研究内容研究内容现象之间是否存在相关关系现象之间是否存在相关关系相关关系的种类相关关系的种类相关关系的密切程度相关关系的密切程度第二节第二节 简单直线相关分析简单直线相关分析简单直线相关分析
14、简单直线相关分析(一)相关表(一)相关表概念:概念:将相关两个变量的对应数值按照一定的顺将相关两个变量的对应数值按照一定的顺序或规格排列在一张表格上所形成的统计表。序或规格排列在一张表格上所形成的统计表。种类:种类:按照资料是否按照资料是否分分组组相关表分相关表分为为 :简单相关:简单相关表和分组相关表表和分组相关表 简单相关表:简单相关表:是指资料未经分组,只将一个变量的是指资料未经分组,只将一个变量的数值按照从小到大(或时间)顺序、并配合相应的数值按照从小到大(或时间)顺序、并配合相应的另一个变量的变量值一一对应而平行排列起来形成另一个变量的变量值一一对应而平行排列起来形成的表。的表。一、
15、相关表和相关图一、相关表和相关图简单直线相关分析简单直线相关分析序序 号号机床使用年限(年)机床使用年限(年)年维修费用(元)年维修费用(元)1 12 24004002 22 25405403 33 35205204 44 46406405 54 47407406 65 56006007 75 58008008 86 67007009 96 676076010106 690090011118 884084012129 910801080简单直线相关分析简单直线相关分析分组相关表:分组相关表:是根据分组资料编制的相关表。是根据分组资料编制的相关表。单变量分组表单变量分组表 使用年限使用年限机床数
16、机床数(台台)年平均维修费用(元)年平均维修费用(元)2 22 24704703 31 15205204 42 26906905 52 27007006 63 37877878 81 18408409 91 110801080合计合计1212简单直线相关分析简单直线相关分析双变量分组表双变量分组表 年维修费用年维修费用(元)(元)机床使用年限机床使用年限(年年)合计合计2 23 34 45 56 68 89 910001000110011001 11 1900900100010001 11 18008009009001 11 12 27007008008001 12 23 3600600700
17、7001 11 12 25005006006001 11 12 24004005005001 11 1合合 计计2 21 12 22 23 31 11 11212简单直线相关分析简单直线相关分析(二)相关图(二)相关图使用年限使用年限简单直线相关分析简单直线相关分析(一)相关系数的含义(一)相关系数的含义相关系数:相关系数:是说明两种现象之间直线相关关系密是说明两种现象之间直线相关关系密切程度的统计分析指标。切程度的统计分析指标。(二)相关系数的一般公式(二)相关系数的一般公式 二、相关系数二、相关系数简单直线相关分析简单直线相关分析协方差的作用:协方差的作用:显示显示x x与与y y之间相关
18、的性质,即是正相关还是负之间相关的性质,即是正相关还是负相关;相关;显示显示x x与与y y相关程度的大小。相关程度的大小。标标准差作用准差作用 :消除离差积乘中两个变量原有计量单位的影响;消除离差积乘中两个变量原有计量单位的影响;将名数局限在将名数局限在-1-1到到+1+1之间。之间。简单直线相关分析简单直线相关分析证明:证明:同理:同理:简单直线相关分析简单直线相关分析根据根据 可得可得 -2r+20-2r+20则则 -1r+1-1r+1 2r+202r+20r-1r-1r1 r1 简单直线相关分析简单直线相关分析【例例】某市工资性现金收入与城镇储蓄存款余额某市工资性现金收入与城镇储蓄存款
19、余额资料资料 及其相关系数的计算过程如下表:及其相关系数的计算过程如下表:序序号号年年份份x x(万元万元)y y(万元万元)1 119981998 500500120120-310-310-155-155 9610096100 240252402548050480502 219991999 540540140140-270-270-135-135 7290072900 182251822536450364503 320002000 620620150150-190-190-125-125 3610036100 156251562523750237504 420012001 730730200
20、200 -80-80 -75-75 64006400 56255625 600060005 520022002 900900280280 9090 5 5 81008100 2525 4504506 620032003 970970350350 160 160 7575 2560025600 5625562512000120007 72004200410501050450450 240 240175175 5760057600 306253062542000420008 82005200511701170510510 360 360235235129600129600 552255522584
21、60084600合计合计64806480 2200 2200432400432400155000155000253300253300简单直线相关分析简单直线相关分析经过计算,表明该市工资性现金收入与城镇储蓄经过计算,表明该市工资性现金收入与城镇储蓄存款余额之间存在着高度正相关。存款余额之间存在着高度正相关。简单直线相关分析简单直线相关分析判断相关关系密切程度的判断相关关系密切程度的标准标准为:为:微弱相关微弱相关 低度相关低度相关 显著相关显著相关 高度相关高度相关 完全相关完全相关 不相关不相关r r0.30.30.30.3r r0.50.50.50.5r r0.80.80.80.8r r1
22、 1r r=1=1简单直线相关分析简单直线相关分析(三)相关系数的简化式(三)相关系数的简化式通过变量代换,可将相关系数的计算公式简化为通过变量代换,可将相关系数的计算公式简化为如下公式。它可以直接利用原始变量值的和计算。如下公式。它可以直接利用原始变量值的和计算。简单直线相关分析简单直线相关分析证明:证明:同理同理 简单直线相关分析简单直线相关分析由单变量分组表计算相关系数由单变量分组表计算相关系数:或或 简单直线相关分析简单直线相关分析式中:式中:简单直线相关分析简单直线相关分析令令则则简单直线相关分析简单直线相关分析序号序号机床使用年限(年)机床使用年限(年)x x年维修费(元)年维修费
23、(元)y yX X2 2Y Y2 2xyxy1 12 24004004 41600001600008008002 22 25405404 4291600291600108010803 33 35205209 9270400270400156015604 44 46406401616409600409600256025605 54 47407401616547600547600296029606 65 56006002525360000360000300030007 75 58008002525640000640000400040008 86 67007003636690000690000420
24、042009 96 676076036365776005776004560456010106 690090036368100008100005400540011118 884084064647056007056006720672012129 910801080818111664011664097209720合计合计60608520852035.235.2642880064288004656046560如前面未分组资料,其相关系数的计算过程为:如前面未分组资料,其相关系数的计算过程为:简单直线相关分析简单直线相关分析计算结果表明,机床使用年限与维修费用之间为高计算结果表明,机床使用年限与维修费用
25、之间为高度正相关。度正相关。简单直线相关分析简单直线相关分析三、简单直线相关分析的特点三、简单直线相关分析的特点 1.1.用于相关分析的两个变量是对等的关系,不用于相关分析的两个变量是对等的关系,不分自变量和因变量;分自变量和因变量;4 4.用于相关分析的两个变量均为随机变量。用于相关分析的两个变量均为随机变量。2 2.只能计算出一个相关系数;只能计算出一个相关系数;3 3.相关系数相关系数r的有正负号。分别表示正相关,负的有正负号。分别表示正相关,负相关;相关;.简单直线相关分析简单直线相关分析第三节第三节 简单直线回归分析简单直线回归分析回归分析法:回归分析法:就是对具有相关关系的两个或两
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 统计学 第七章 相关分析 第七 相关 分析
限制150内