《第八九章相关回归分析优秀课件.ppt》由会员分享,可在线阅读,更多相关《第八九章相关回归分析优秀课件.ppt(39页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、第八九章相关回归分析第1页,本讲稿共39页第八、九章第八、九章 相关与回归分析相关与回归分析相关分析概述相关分析概述直线相关关系的测定直线相关关系的测定 线性回归分析线性回归分析第2页,本讲稿共39页第一节第一节 相关分析概述相关分析概述一、一、相关关系的概念相关关系的概念现象相互之间的数量关系可以从形式上分为两种类型:一类是现象相互之间的数量关系可以从形式上分为两种类型:一类是严格的确定性的严格的确定性的函数关系函数关系,另一类是不严格的不确定性的,另一类是不严格的不确定性的相相关关系关关系。相关关系是现象之间确实存在有相关关系是现象之间确实存在有数量上的依存关系数量上的依存关系,但这,但这
2、种数量上的关系是不确定的。种数量上的关系是不确定的。x xy y x xy y第3页,本讲稿共39页相关关系的种类相关关系的种类1.1.按现象之间相关的程度分,有按现象之间相关的程度分,有完全相关完全相关、不完全相关不完全相关和和不相关不相关2.2.按相关变量的多少划分,有按相关变量的多少划分,有单相关单相关和和复复相关相关3.3.按直线相关关系变动的方向分,有按直线相关关系变动的方向分,有正相正相关关和和负相关负相关4.4.按变量间相关的表现形式不同,可以分按变量间相关的表现形式不同,可以分为为线性相关线性相关和和非线性相关非线性相关第4页,本讲稿共39页 不相关不相关不相关不相关不相关不相
3、关 负线性相关负线性相关负线性相关负线性相关负线性相关负线性相关 正线性相关正线性相关正线性相关正线性相关正线性相关正线性相关 非线性相关非线性相关非线性相关非线性相关非线性相关非线性相关 完全负线性相关完全负线性相关完全负线性相关完全负线性相关完全负线性相关完全负线性相关完全正线性相关完全正线性相关完全正线性相关完全正线性相关完全正线性相关完全正线性相关 相关关系的种类图示相关关系的种类图示第5页,本讲稿共39页相关分析的内容相关分析的内容1.1.确定现象之间是否存在相关关系确定现象之间是否存在相关关系2.2.确定相关关系的表现形式确定相关关系的表现形式3.3.测定相关关系的密切程度和方向测
4、定相关关系的密切程度和方向第6页,本讲稿共39页相关关系方法的选择相关关系方法的选择确定现象之间是否相关及相关的类型,一般要对现象之确定现象之间是否相关及相关的类型,一般要对现象之间的联系开展定性分析,然后做定量分析。大体分三类:间的联系开展定性分析,然后做定量分析。大体分三类:相关表、相关图和相关系数。相关表、相关图和相关系数。一、一、相关表相关表相关表是指按照相关现象的数量对应关系以及一定的相关表是指按照相关现象的数量对应关系以及一定的逻辑顺序编制成的一种统计表。逻辑顺序编制成的一种统计表。通过相关表可以初步看出各变量之间的相关关系。通过相关表可以初步看出各变量之间的相关关系。第7页,本讲
5、稿共39页例:某企业例:某企业20082008年某种产品产量与总成本资年某种产品产量与总成本资料如表料如表1 1:表表1 1 某企业某企业20082008年某种产品产量与总成本相关表年某种产品产量与总成本相关表月份月份1 12 23 34 45 56 62.42.43.13.14.34.35.25.24.44.46.16.1323243435151616153537878产量(万吨)产量(万吨)总成本(万元)总成本(万元)第8页,本讲稿共39页相关图相关图相关图是指把相关表中原始的对应数值在相关图是指把相关表中原始的对应数值在平面直角坐标图中用点描绘出来,用以反平面直角坐标图中用点描绘出来,用
6、以反映其分布状况的统计图,也称散点图、散映其分布状况的统计图,也称散点图、散布图。布图。从相关点的分布情况,就可以直观地、近从相关点的分布情况,就可以直观地、近似地观察出两个变量之间有无相关关系、似地观察出两个变量之间有无相关关系、相关关系的形式和相关关系的密切程度。相关关系的形式和相关关系的密切程度。第9页,本讲稿共39页图图1 1 某企业某企业20082008年产量与总成本相关图年产量与总成本相关图第10页,本讲稿共39页相关系数相关系数1.1.相关系数的概念及其公式相关系数的概念及其公式相关系数是在直线相关条件下用以说明现象之间相关关系密相关系数是在直线相关条件下用以说明现象之间相关关系
7、密切程度的统计分析指标,通常用字母切程度的统计分析指标,通常用字母 表示表示,最常用最常用PersonPerson相关系数。相关系数。积差法公式:积差法公式:第11页,本讲稿共39页简化公式简化公式 :(简单式)(简单式)(加权式)(加权式)第12页,本讲稿共39页例:现在仍用上表例:现在仍用上表1 1资料,利用相关系数简捷法公资料,利用相关系数简捷法公式计算相关系数式计算相关系数 相关系数简捷法计算表相关系数简捷法计算表月份月份1 12 23 34 45 56 62.42.43.13.14.34.35.25.24.44.46.16.13232434351516161535378785.765
8、.769.619.6118.4918.4927.0427.0419.3619.3637.2137.2110241024184918492601260137213721280928096084608476.876.8133.3133.3219.3219.3317.2317.2233.2233.2475.8475.8合计合计25.525.5318318117.47117.4718088180881455.61455.6产量产量总成本总成本=0.9826=0.9826 第13页,本讲稿共39页相关关系的密切程度的判断标准相关关系的密切程度的判断标准相关系数的取值范围一定是在相关系数的取值范围一定是在
9、1 +11 +1,或,或0 0 11这一闭区间。这一闭区间。当当 =1=1时,表示与变量为完全相关,即确定性的函时,表示与变量为完全相关,即确定性的函数关系。数关系。当当 =0=0时,表明所有的相关点的分布都是杂乱无章的,说时,表明所有的相关点的分布都是杂乱无章的,说明变量与变量无关明变量与变量无关 。如果如果0 0 1 1,表示,表示 为正相关;为正相关;当当-1-1 0 0时,表示时,表示 为负相关。为负相关。第14页,本讲稿共39页00.3,为微弱相关;,为微弱相关;0.30.5,为低度相关;,为低度相关;0.50.8,为显著相关;,为显著相关;0.81,为高度相关。,为高度相关。第15
10、页,本讲稿共39页直线相关分析的特点直线相关分析的特点1 1)参与相关分析的两个变量是对等关系,)参与相关分析的两个变量是对等关系,不分自变量和因变量,因此,相关系数只不分自变量和因变量,因此,相关系数只有一个。有一个。2 2)相关系数有正负号,它们反映相关关系)相关系数有正负号,它们反映相关关系的方向,正号反映正相关,负号反映负相的方向,正号反映正相关,负号反映负相关。关。3 3)相关的两个变量必须是随机的,这也是)相关的两个变量必须是随机的,这也是对等关系的反映。对等关系的反映。第16页,本讲稿共39页相关系数的显著性检验相关系数的显著性检验相关系数是根据相关系数是根据样本数据样本数据计算
11、的,具有一定随计算的,具有一定随机性,能否真实地表现变量总体的相关情况机性,能否真实地表现变量总体的相关情况受到随机因素和样本容量大小的影响。故需受到随机因素和样本容量大小的影响。故需要对其进行检验。要对其进行检验。样本相关系数的检验包括两类检验:样本相关系数的检验包括两类检验:(1 1)对总体相关系数是否等于)对总体相关系数是否等于0 0进行检验;进行检验;(2 2)对总体相关系数是否等于某一给定的不为)对总体相关系数是否等于某一给定的不为0 0的数值进行检验。的数值进行检验。第17页,本讲稿共39页总体相关系数的检验统计上用总体相关系数的检验统计上用t t检验。其步骤如下:检验。其步骤如下
12、:第一步,提出原假设和备择假设。假设样本相关系数第一步,提出原假设和备择假设。假设样本相关系数r r是抽自是抽自具有零相关的总体,即具有零相关的总体,即第二步,规定显著性水平,并依据自由度(第二步,规定显著性水平,并依据自由度(n-2n-2)确定临界值)确定临界值 ;第三步,计算检验的统计量:第三步,计算检验的统计量:对总体相关系数是否等于对总体相关系数是否等于0 0的检验的检验 第18页,本讲稿共39页第四步,做出判断。将计算的统计量与第四步,做出判断。将计算的统计量与临界值对比,若统计量大于或等于临界临界值对比,若统计量大于或等于临界值,表明变量间线性相关在统计上是显值,表明变量间线性相关
13、在统计上是显著的,若统计量小于临界值,则说明相著的,若统计量小于临界值,则说明相关关系在统计上并不显著。关关系在统计上并不显著。第19页,本讲稿共39页例:例:对上例中产品产量与生产费用之间的相关系数对上例中产品产量与生产费用之间的相关系数检验检验 提出原假设和备择假设。提出原假设和备择假设。取显著性水平取显著性水平 ,根据自由度,根据自由度 查查 分布表得分布表得 =2.4469=2.4469计算检验的统计量:计算检验的统计量:=9.7236 =9.7236第20页,本讲稿共39页由于由于 ,则拒绝,则拒绝 ,表明变量,表明变量间线性相关在统计上是显著的。即产品产间线性相关在统计上是显著的。
14、即产品产量与生产费用之间的相关系数是显著的。量与生产费用之间的相关系数是显著的。第21页,本讲稿共39页线性回归分析线性回归分析一、回归分析概念及与相关分析的关系一、回归分析概念及与相关分析的关系1.1.回归分析的含义回归分析的含义回归分析是指对具有相关关系的现象,回归分析是指对具有相关关系的现象,根根据其相关关系的形态据其相关关系的形态,选择一个合适的数,选择一个合适的数学模型,用来近似的表示变量间的平均变学模型,用来近似的表示变量间的平均变化关系的一种统计分析方法。化关系的一种统计分析方法。第22页,本讲稿共39页回归分析与相关分析的关系回归分析与相关分析的关系联系联系 :二者都是对客观事
15、物数量:二者都是对客观事物数量依存关系的分析依存关系的分析。一方面,。一方面,相关分析是回归分析的相关分析是回归分析的基础和前提基础和前提。另一方面,回归分析。另一方面,回归分析是相关分析的是相关分析的深入和继续深入和继续。区别区别 :1 1)回归分析中变量之间的关系是不对等的)回归分析中变量之间的关系是不对等的 2 2)在两个变量互为因果的情况下,可以配合两个回归)在两个变量互为因果的情况下,可以配合两个回归方程方程 3 3)在回归分析中,确定回归方程时只要求因变量是随机变量,)在回归分析中,确定回归方程时只要求因变量是随机变量,而自变量为给定的值;而自变量为给定的值;第23页,本讲稿共39
16、页回归分析的类型回归分析的类型回归分析回归分析按回归变量按回归变量个数分个数分按回归形式分按回归形式分一元回归一元回归多元回归多元回归线形回归线形回归非线性回归非线性回归第24页,本讲稿共39页简单直线回归方程的配合方法简单直线回归方程的配合方法回归方程式,其一般形式为:应用最小平方法原理有:第25页,本讲稿共39页估计标准误差估计标准误差估计标准误差是就是观察值 对估计值 的平均离差,也叫回归误差,是衡量因变量的估计值与观测值之间的平均误差大小的指标。简捷公式:第26页,本讲稿共39页估计标准误差和相关系数的关系第27页,本讲稿共39页可决系数(判定系数)可决系数(判定系数)为回归平方和与总
17、误差平方和之比为回归平方和与总误差平方和之比可决定系数范围在可决定系数范围在0,1。越接近。越接近1代表回代表回归方程代表性越强。在一元方程式其值等归方程代表性越强。在一元方程式其值等于两个变量相关系数的平均,在一元线性于两个变量相关系数的平均,在一元线性回归中可决系数等于相关系数的平方。回归中可决系数等于相关系数的平方。第28页,本讲稿共39页回归方程的显著性检验回归方程的显著性检验 对于回归方程进行显著性检验基于以下两点:对于回归方程进行显著性检验基于以下两点:第一,在根据样本数据拟合回归方程时,第一,在根据样本数据拟合回归方程时,我们首先假设变量我们首先假设变量 与与 之间存在着线性关系
18、,之间存在着线性关系,但这种假设是否成立?就必须通过检验才能证但这种假设是否成立?就必须通过检验才能证实;实;第二,样本回归方程第二,样本回归方程 中的中的 、是对总体是对总体回归方程中参数回归方程中参数 的最小二乘估计值,样本回的最小二乘估计值,样本回归系数归系数 能否作为总体回归系数能否作为总体回归系数 的估计值,还的估计值,还需要对总体回归系数需要对总体回归系数 的显著性进行检验。的显著性进行检验。第29页,本讲稿共39页回归方程的检验一般包括两个方面的内回归方程的检验一般包括两个方面的内容:容:一是线性关系的检验;一是线性关系的检验;二是回归系数的检验。二是回归系数的检验。在一元线性回
19、归中两种检验是等价的在一元线性回归中两种检验是等价的第30页,本讲稿共39页(1 1)线性关系的检验)线性关系的检验具体方法是将回归离差平方和(具体方法是将回归离差平方和(SSRSSR)同剩余)同剩余离差平方和(离差平方和(SSESSE)加以比较,应用)加以比较,应用F F检验来检验来分析二者之间的差别是否显著。检验的具体分析二者之间的差别是否显著。检验的具体步骤如下:步骤如下:第一步,提出假设,所的回归系数均等于第一步,提出假设,所的回归系数均等于0 0。H H0 0:=0=0,H H1 1:00:第31页,本讲稿共39页第二步,计算检验统计量第二步,计算检验统计量F F。可以证明,在原假设
20、成立的情况下,可以证明,在原假设成立的情况下,F F统统计量服从计量服从F F分布,第一自由度为分布,第一自由度为1 1,第二自,第二自由度为由度为n-2n-2,即,即FFFF(1 1,n-2n-2)。)。第32页,本讲稿共39页第三步,确定显著性水平以及临界值第三步,确定显著性水平以及临界值F。确定显著性水平确定显著性水平(通常(通常=0.05)。)。依据依据 和两个自由度和两个自由度、查查F分布表可得相应的临界值分布表可得相应的临界值。第四步,做出判断。第四步,做出判断。如果如果 ,拒绝原假设,拒绝原假设,表明回归效果显著;反之,则接受,表明回归效果显著;反之,则接受原假设,表明线性回归方
21、程的回归效果不显著。原假设,表明线性回归方程的回归效果不显著。第33页,本讲稿共39页例:例:以下表的资料为例,对其回归模型作以下表的资料为例,对其回归模型作F F检验检验 第34页,本讲稿共39页F F检验的步骤:检验的步骤:第35页,本讲稿共39页回归系数的检验回归系数的检验第36页,本讲稿共39页回归系数的检验(续)回归系数的检验(续)计算公式如下:第37页,本讲稿共39页例:以上表数据为例,对回归模型做回归系数检验例:以上表数据为例,对回归模型做回归系数检验 第38页,本讲稿共39页于是,于是,=128.9599/13.26277=9.72345=128.9599/13.26277=9.72345取显著性水平取显著性水平=0.05=0.05,并根据自由度,并根据自由度=6=6,查分布表得相应的临界值为查分布表得相应的临界值为2.4472.447。由于由于T=9.72345T=9.72345临界值,拒绝临界值,拒绝H H0 0,表明样,表明样本回归系数是显著的,生产费用与产品产量本回归系数是显著的,生产费用与产品产量之间确实存在着线性关系,产品产量是影响之间确实存在着线性关系,产品产量是影响生产费用的显著因素。生产费用的显著因素。第39页,本讲稿共39页
限制150内