第七章相关分析梁精选文档.ppt
《第七章相关分析梁精选文档.ppt》由会员分享,可在线阅读,更多相关《第七章相关分析梁精选文档.ppt(67页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、第七章相关分析梁本讲稿第一页,共六十七页第一节第一节 相关分析的意义和任务相关分析的意义和任务 一、相关关系的概念一、相关关系的概念(注意相关关系与函数关系的区别注意相关关系与函数关系的区别)(一一)函数关系函数关系 它它反映着现象之间存在着严格的依存关系,也就是具反映着现象之间存在着严格的依存关系,也就是具有确定性的对应关系,这种关系可用一个数学表达式反映有确定性的对应关系,这种关系可用一个数学表达式反映出来。出来。例例如某种商品的销售额和销售量之间,由于价格如某种商品的销售额和销售量之间,由于价格因素,所以两者可表现为严格的依存关系。因素,所以两者可表现为严格的依存关系。本讲稿第二页,共六
2、十七页(二二)相关关系相关关系 它它反映着现象之间的数量上不严格的依存关系,也就是说反映着现象之间的数量上不严格的依存关系,也就是说两者之间不具有确定性的对应关系,这种关系有二个明显特点:两者之间不具有确定性的对应关系,这种关系有二个明显特点:1.1.现现象之间确实存在数量上的依存关系,即某一社会象之间确实存在数量上的依存关系,即某一社会经济现象变化要引起另一社会经济现象的变化;经济现象变化要引起另一社会经济现象的变化;2.2.现现象之间的这种依存关系是不严格的,即无法用象之间的这种依存关系是不严格的,即无法用数学公式表示。数学公式表示。本讲稿第三页,共六十七页商品价格和商品销售量之间,存在着
3、一定的依商品价格和商品销售量之间,存在着一定的依存关系,即商品价格发生变动,商品的销售量也会存关系,即商品价格发生变动,商品的销售量也会随之发生变动。随之发生变动。在在具有相互依存关系的两个变量中,作为根据具有相互依存关系的两个变量中,作为根据的变量称自变量,一般用的变量称自变量,一般用X X表示;发生对应变化表示;发生对应变化的变量称因变量,一般用的变量称因变量,一般用y y表示。表示。例例本讲稿第四页,共六十七页二、相关关系的种类二、相关关系的种类 本讲稿第五页,共六十七页1.1.按按相关关系涉及的因素多少来分,可分为:相关关系涉及的因素多少来分,可分为:单相关和复相关。单相关和复相关。在
4、实际工作中,如存在多个自变量,可抓住其中在实际工作中,如存在多个自变量,可抓住其中主要的自变量,研究其相关关系,而保持另一些因素主要的自变量,研究其相关关系,而保持另一些因素不变,这时复相关可转化为不变,这时复相关可转化为偏相关偏相关。二因素之间的相关关系称二因素之间的相关关系称单相关单相关,即只涉及一,即只涉及一个自变量和一个因变量。个自变量和一个因变量。三个或三个以上因素的相关关系称三个或三个以上因素的相关关系称复相关复相关,或多元,或多元相关,即涉及二个或二个以上的自变量和因变量。相关,即涉及二个或二个以上的自变量和因变量。本讲稿第六页,共六十七页2.2.按按相关关系的形式来分,可分为:
5、相关关系的形式来分,可分为:直线相关和曲线相关直线相关和曲线相关 直线相关直线相关是指两个相关现象之间,当自变量是指两个相关现象之间,当自变量X X的数的数值发生变动时,因变量值发生变动时,因变量y y随之发生近似于固定比例的变动,随之发生近似于固定比例的变动,在相关图上的散点近似地表现为直线形式,因此称其为在相关图上的散点近似地表现为直线形式,因此称其为直线相关关系。直线相关关系。曲线相关曲线相关是指两个相关现象之间,当自变量是指两个相关现象之间,当自变量X X的数值的数值发生变动时,因变量发生变动时,因变量y y也随之发生变动,但这种变动在数值也随之发生变动,但这种变动在数值上不成固定比例
6、,在相关图上的散点可表现为抛物线、指数上不成固定比例,在相关图上的散点可表现为抛物线、指数曲线、双曲线等形式,因此称其为曲线相关关系。曲线、双曲线等形式,因此称其为曲线相关关系。本讲稿第七页,共六十七页3.3.按按相关关系的性质来分,可分为相关关系的性质来分,可分为:正相关和负相关正相关和负相关正相关正相关是指两相关现象变化的方向是一致的。是指两相关现象变化的方向是一致的。负相关负相关是指两相关现象变化的方向是相反的。是指两相关现象变化的方向是相反的。本讲稿第八页,共六十七页4.4.按按相关程度分,可分为:相关程度分,可分为:完全相关、不完全相关和不相关完全相关、不完全相关和不相关 完全相关完
7、全相关就是相关现象之间的关系是完全确定的关就是相关现象之间的关系是完全确定的关系,因而完全相关关系就是系,因而完全相关关系就是函数关系函数关系。不相关不相关是指两现象之间在数量上的变化上各自独立,是指两现象之间在数量上的变化上各自独立,互不影响。互不影响。不完全相关不完全相关就是介于完全相关和不相关之间的一种相就是介于完全相关和不相关之间的一种相关关系。相关分析的对象主要是不完全相关关系。关关系。相关分析的对象主要是不完全相关关系。本讲稿第九页,共六十七页三、相关分析的任务和内容三、相关分析的任务和内容 相关分析的主要任务,概括起来是两个方面:相关分析的主要任务,概括起来是两个方面:一方面一方
8、面,研究现象之间关系的密切程度,即相关分析;,研究现象之间关系的密切程度,即相关分析;另一方面另一方面,研究自变量与因变量之间的变动关系,研究自变量与因变量之间的变动关系,即回归分析。即回归分析。本讲稿第十页,共六十七页相关分析的主要内容包括以下五个方面:相关分析的主要内容包括以下五个方面:1.1.判判断社会经济现象之间是否存在相互依存的断社会经济现象之间是否存在相互依存的关系,是直线相关,还是曲线相关,这是相关系,是直线相关,还是曲线相关,这是相关分析的出发点;关分析的出发点;2.2.确确定相关关系的密切程度;定相关关系的密切程度;3.3.测测定两个变量之间的一般关系值;定两个变量之间的一般
9、关系值;4.4.测测定因变量估计值和实际值之间的差异,用以定因变量估计值和实际值之间的差异,用以反映因变量估计值的可靠程度;反映因变量估计值的可靠程度;5.5.相相关系数的显著性检验。关系数的显著性检验。本讲稿第十一页,共六十七页第二节第二节 简单线性相关分析简单线性相关分析 一、相关表和相关图一、相关表和相关图相关图,也称散布图相关图,也称散布图(或散点图或散点图)。本讲稿第十二页,共六十七页 某市某市19961996年年 2003 2003年的工资性现金支出与城镇储蓄存款余额的资料,说明简单相年的工资性现金支出与城镇储蓄存款余额的资料,说明简单相关表和相关图的编制方法。关表和相关图的编制方
10、法。从表可看出,随着工资性现金支出的增加,城镇储蓄存款余额有明显的增长从表可看出,随着工资性现金支出的增加,城镇储蓄存款余额有明显的增长趋势。所以,资料表明趋势。所以,资料表明(如图如图)有明显的直线相关趋势。有明显的直线相关趋势。序号序号年份年份工资性工资性现金支出现金支出(万元万元)x城镇储蓄城镇储蓄存款余额存款余额(万元万元)y11996 50012021997 54014031998 62015041999 73020052000 90028062001 97035072002 105045082003 1170510例例1 1本讲稿第十三页,共六十七页企业按销售额分组企业按销售额分组
11、(万元万元)流通费用率流通费用率(%)4以下以下9.65 4 87.68 8 127.2512 167.0016 206.8620 246.7324 286.6428 326.6032 366.58例例2 2本讲稿第十四页,共六十七页二、相关系数的测定与应用二、相关系数的测定与应用 相相关系数是在直线相关条件下,表明两个现关系数是在直线相关条件下,表明两个现象之间相关关系的方向和密切程度的综合性指标。象之间相关关系的方向和密切程度的综合性指标。一般用符号一般用符号r r表示。表示。本讲稿第十五页,共六十七页r r的测定方法:的测定方法:本讲稿第十六页,共六十七页仍以上例仍以上例1 1资料计算:
12、资料计算:序序号号年年份份x(万元万元)y(万元万元)11996 500120-310-155 96100 240254805021997 540140-270-135 72900 182253645031998 620150-190-125 36100 156252375041999 730200 -80 -75 6400 5625 600052000 900280 90 5 8100 25 45062001 970350 160 75 25600 562512000720021050450 240175 57600 3062542000820031170510 360235129600 5
13、522584600合计合计6480 2200-432400155000 253300本讲稿第十七页,共六十七页经过计算,表明该市工资性现金支出与城镇储蓄存款余额之间存在着经过计算,表明该市工资性现金支出与城镇储蓄存款余额之间存在着高度正相关。高度正相关。本讲稿第十八页,共六十七页积差法公式进一步化简如下:积差法公式进一步化简如下:本讲稿第十九页,共六十七页2.2.简捷法简捷法 本讲稿第二十页,共六十七页资料计算如下:资料计算如下:序号序号年份年份x(万元万元)y(万元万元)x2y2xy11996 500120 250000 14400 6000021997 540140 291600 1960
14、0 7500031998 620150 384400 22500 9300041999 730200 532900 4000014600052000 900280 810000 7840025200062001 970350 94090012250033950072002105045011025002025004725008200311705101368900260100596700合计合计6480 22005681200760000 2035300本讲稿第二十一页,共六十七页3.3.从单变量分组表计算相关系数从单变量分组表计算相关系数 本讲稿第二十二页,共六十七页对对r r的解释如下:的解释
15、如下:(即即r r的特点的特点)(1)(1)r r取正值或负值决定于分子协方差;取正值或负值决定于分子协方差;(2)(2)r r的绝对值,在的绝对值,在0 0与与1 1之间;之间;(3)(3)r r的绝对值大小,可说明现象之间相关关系的紧密程度。的绝对值大小,可说明现象之间相关关系的紧密程度。三、相关系数的密切程度三、相关系数的密切程度本讲稿第二十三页,共六十七页四、简单线性相关分析的特点四、简单线性相关分析的特点 通过对通过对r r的计算方法的讨论,可看出二个明显特点:的计算方法的讨论,可看出二个明显特点:2.2.相相关关系中只能计算出一个相关系数关关系中只能计算出一个相关系数r r。1.1
16、.相相关关系中,两个变量不必定出哪个是自变量,哪关关系中,两个变量不必定出哪个是自变量,哪个是因变量,因此,相关的两个变量都是随机变量;个是因变量,因此,相关的两个变量都是随机变量;本讲稿第二十四页,共六十七页第三节第三节 回归分析回归分析 在在回归分析中,两个变量之间的回归称为简回归分析中,两个变量之间的回归称为简单回归,两个以上变量之间的回归称为复回归。单回归,两个以上变量之间的回归称为复回归。无论是简单回归还是复回归,数学模型均有线性无论是简单回归还是复回归,数学模型均有线性(直线直线)回归和非线性回归和非线性(曲线曲线)回归之分。回归之分。本讲稿第二十五页,共六十七页一、回归分析的概念
17、一、回归分析的概念回归分析就是对具有相关关系的变量之间数量变化的一般回归分析就是对具有相关关系的变量之间数量变化的一般关系进行测定,确定一个相关的数学表达式,以便于进行关系进行测定,确定一个相关的数学表达式,以便于进行估计或预测的统计方法。估计或预测的统计方法。回归这个统计术语,最早采用者是英国遗传学家高尔登。学回归这个统计术语,最早采用者是英国遗传学家高尔登。学生皮尔逊继续研究。生皮尔逊继续研究。本讲稿第二十六页,共六十七页二、直线回归二、直线回归(一一)简单直线回归分析简单直线回归分析简简单直线回归方程的一般形式为:单直线回归方程的一般形式为:y yc c=a+bx=a+bx y yc c
18、 因变量的估计值;因变量的估计值;x x 自变量;自变量;a a 回归直线在回归直线在y y轴上的截距;轴上的截距;b b 回归直线的斜率,称回归系数回归直线的斜率,称回归系数,表明表明x x每增加每增加 一个单位,因变量一个单位,因变量y yc c的平均变化值的平均变化值 b0b0,x x与与y y为正相关为正相关 b0b0,x x与与y y为负相关为负相关本讲稿第二十七页,共六十七页 a a、b b的确定:的确定:在在简单直线回归方程中,简单直线回归方程中,a a、b b为待定系数,常用最小平为待定系数,常用最小平方法来确定,即方法来确定,即(y-y(y-yc c)2=最小值。最小值。本讲
19、稿第二十八页,共六十七页简单直线回归方程建立的步骤为:简单直线回归方程建立的步骤为:确确定自变量定自变量x x和因变量和因变量y y;计计算算x x2、xyxy、xx、yy、xx2、xyxy;代代入公式,先求入公式,先求b b,再求,再求a a。本讲稿第二十九页,共六十七页仍用上例仍用上例1 1资料得到:资料得到:y yc c=-199.5+0.5858x=-199.5+0.5858x表明该市工资性现金支出每增加表明该市工资性现金支出每增加1 1万元,储蓄存款万元,储蓄存款余额就增加余额就增加0.58580.5858万元。万元。本讲稿第三十页,共六十七页举例说明举例说明b(b(回归系数回归系数
20、)在经济管理中的作用:在经济管理中的作用:某企业的某种产品月产量与单位成本的关系呈直某企业的某种产品月产量与单位成本的关系呈直线关系,用直线回归方程表示是:线关系,用直线回归方程表示是:y yc c=77.36-1.818x=77.36-1.818x,其中,其中,x x表示月产量表示月产量(千件千件)y y表示单位成本表示单位成本(元元););a=77.36(a=77.36(元元),表示生产这种产品在单位成本,表示生产这种产品在单位成本方面的条件;方面的条件;b=-1.818b=-1.818,表示月产品每增加,表示月产品每增加10001000件,单位件,单位成本平均降低成本平均降低1.8181
21、.818元。元。本讲稿第三十一页,共六十七页从单变量分组表配合回归直线:从单变量分组表配合回归直线:本讲稿第三十二页,共六十七页简单直线回归分析的主要特点:简单直线回归分析的主要特点:1.1.直直线回归分析时,要根据研究目的,在两个线回归分析时,要根据研究目的,在两个变量之间确定哪个是自变量,哪个是因变量。变量之间确定哪个是自变量,哪个是因变量。2.2.在在两个现象互为根据的情况下,可以有两两个现象互为根据的情况下,可以有两个回归方程:个回归方程:y yc c=a+bx =a+bx 称称y y倚倚x x回归直线回归直线 x xc c=c+dy =c+dy 称称x x倚倚y y回归直线回归直线本
22、讲稿第三十三页,共六十七页(二二)多元线性回归分析多元线性回归分析 多多元线性回归分析可以看作是一元线性回归元线性回归分析可以看作是一元线性回归分析的扩展。现以二元线性回归模型进行回归分析,分析的扩展。现以二元线性回归模型进行回归分析,其方程式为:其方程式为:本讲稿第三十四页,共六十七页本讲稿第三十五页,共六十七页 以我国以我国1973197319831983年年1111年手表价格和手表销售量的实年手表价格和手表销售量的实际资料为例,拟合一元线性回归方程为:际资料为例,拟合一元线性回归方程为:y yc c=9643-65=9643-65x x此时,回归系数此时,回归系数b b表明,手表平均价格
23、每降低表明,手表平均价格每降低1 1元元/只,销售只,销售量约平均增长量约平均增长6565万只。一元线性回归模型只列入了手表平均万只。一元线性回归模型只列入了手表平均价格对销售量的影响,而忽略了居民收入这一很重要的因素,价格对销售量的影响,而忽略了居民收入这一很重要的因素,因此,现对此资料补入同期居民人均货币收入资料,将原来的因此,现对此资料补入同期居民人均货币收入资料,将原来的一元线性回归模型扩展为二元线性回归模型进行回归分析。一元线性回归模型扩展为二元线性回归模型进行回归分析。例例本讲稿第三十六页,共六十七页列成计算表如下:列成计算表如下:年份年份(n=11)手表销售量手表销售量y(万只万
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 第七 相关 分析 精选 文档
限制150内