《第八九章相关回归分析精选文档.ppt》由会员分享,可在线阅读,更多相关《第八九章相关回归分析精选文档.ppt(39页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、第八九章相关回归分析本讲稿第一页,共三十九页第八、九章第八、九章 相关与回归分析相关与回归分析相关分析概述相关分析概述直线相关关系的测定直线相关关系的测定 线性回归分析线性回归分析本讲稿第二页,共三十九页第一节第一节 相关分析概述相关分析概述一、一、相关关系的概念相关关系的概念现象相互之间的数量关系可以从形式上分为两种类型:一现象相互之间的数量关系可以从形式上分为两种类型:一类是严格的确定性的类是严格的确定性的函数关系函数关系,另一类是不严格的不确定,另一类是不严格的不确定性的性的相关关系相关关系。相关关系是现象之间确实存在有相关关系是现象之间确实存在有数量上的依存关系数量上的依存关系,但这种
2、,但这种数量上的关系是不确定的。数量上的关系是不确定的。x xy y x xy y本讲稿第三页,共三十九页相关关系的种类相关关系的种类1.1.按现象之间相关的程度分,有按现象之间相关的程度分,有完全相关完全相关、不完全相关不完全相关和和不相关不相关2.2.按相关变量的多少划分,有按相关变量的多少划分,有单相关单相关和和复相关复相关3.3.按直线相关关系变动的方向分,有按直线相关关系变动的方向分,有正相关正相关和和负负相关相关4.4.按变量间相关的表现形式不同,可以分为按变量间相关的表现形式不同,可以分为线线性相关性相关和和非线性相关非线性相关本讲稿第四页,共三十九页 不相关不相关不相关不相关不
3、相关不相关 负线性相关负线性相关负线性相关负线性相关负线性相关负线性相关 正线性相关正线性相关正线性相关正线性相关正线性相关正线性相关 非线性相关非线性相关非线性相关非线性相关非线性相关非线性相关 完全负线性相关完全负线性相关完全负线性相关完全负线性相关完全负线性相关完全负线性相关完全正线性相关完全正线性相关完全正线性相关完全正线性相关完全正线性相关完全正线性相关 相关关系的种类图示相关关系的种类图示本讲稿第五页,共三十九页相关分析的内容相关分析的内容1.1.确定现象之间是否存在相关关系确定现象之间是否存在相关关系2.2.确定相关关系的表现形式确定相关关系的表现形式3.3.测定相关关系的密切程
4、度和方向测定相关关系的密切程度和方向本讲稿第六页,共三十九页相关关系方法的选择相关关系方法的选择确定现象之间是否相关及相关的类型,一般要对现象之确定现象之间是否相关及相关的类型,一般要对现象之间的联系开展定性分析,然后做定量分析。大体分三类:间的联系开展定性分析,然后做定量分析。大体分三类:相关表、相关图和相关系数。相关表、相关图和相关系数。一、一、相关表相关表相关表是指按照相关现象的数量对应关系以及一定相关表是指按照相关现象的数量对应关系以及一定的逻辑顺序编制成的一种统计表。的逻辑顺序编制成的一种统计表。通过相关表可以初步看出各变量之间的相关关系。通过相关表可以初步看出各变量之间的相关关系。
5、本讲稿第七页,共三十九页例:某企业例:某企业20082008年某种产品产量与总成本资料年某种产品产量与总成本资料如表如表1 1:表表1 1 某企业某企业20082008年某种产品产量与总成本相关表年某种产品产量与总成本相关表月份月份1 12 23 34 45 56 62.42.43.13.14.34.35.25.24.44.46.16.1323243435151616153537878产量(万吨)产量(万吨)总成本(万元)总成本(万元)本讲稿第八页,共三十九页相关图相关图相关图是指把相关表中原始的对应数值在平面相关图是指把相关表中原始的对应数值在平面直角坐标图中用点描绘出来,用以反映其分布直角
6、坐标图中用点描绘出来,用以反映其分布状况的统计图,也称散点图、散布图。状况的统计图,也称散点图、散布图。从相关点的分布情况,就可以直观地、近似地从相关点的分布情况,就可以直观地、近似地观察出两个变量之间有无相关关系、相关关系观察出两个变量之间有无相关关系、相关关系的形式和相关关系的密切程度。的形式和相关关系的密切程度。本讲稿第九页,共三十九页图图1 1 某企业某企业20082008年产量与总成本相关图年产量与总成本相关图本讲稿第十页,共三十九页相关系数相关系数1.1.相关系数的概念及其公式相关系数的概念及其公式相关系数是在直线相关条件下用以说明现象之间相关关系密相关系数是在直线相关条件下用以说
7、明现象之间相关关系密切程度的统计分析指标,通常用字母切程度的统计分析指标,通常用字母 表示表示,最常用最常用PersonPerson相关系数。相关系数。积差法公式:积差法公式:本讲稿第十一页,共三十九页简化公式简化公式 :(简单式)(简单式)(加权式)(加权式)本讲稿第十二页,共三十九页例:现在仍用上表例:现在仍用上表1 1资料,利用相关系数简捷法资料,利用相关系数简捷法公式计算相关系数公式计算相关系数 相关系数简捷法计算表相关系数简捷法计算表月份月份1 12 23 34 45 56 62.42.43.13.14.34.35.25.24.44.46.16.1323243435151616153
8、5378785.765.769.619.6118.4918.4927.0427.0419.3619.3637.2137.2110241024184918492601260137213721280928096084608476.876.8133.3133.3219.3219.3317.2317.2233.2233.2475.8475.8合计合计25.525.5318318117.47117.4718088180881455.61455.6产量产量总成本总成本=0.9826=0.9826 本讲稿第十三页,共三十九页相关关系的密切程度的判断标准相关关系的密切程度的判断标准相关系数的取值范围一定是在相
9、关系数的取值范围一定是在1 +11 +1,或,或0 0 11这一闭区间。这一闭区间。当当 =1=1时,表示与变量为完全相关,即确定性的函数时,表示与变量为完全相关,即确定性的函数关系。关系。当当 =0=0时,表明所有的相关点的分布都是杂乱无章的,时,表明所有的相关点的分布都是杂乱无章的,说明变量与变量无关说明变量与变量无关 。如果如果0 0 1 1,表示,表示 为正相关;为正相关;当当-1-1 0 0时,表示时,表示 为负相关。为负相关。本讲稿第十四页,共三十九页00.3,为微弱相关;,为微弱相关;0.30.5,为低度相关;,为低度相关;0.50.8,为显著相关;,为显著相关;0.81,为高度
10、相关。,为高度相关。本讲稿第十五页,共三十九页直线相关分析的特点直线相关分析的特点1 1)参与相关分析的两个变量是对等关系,不分)参与相关分析的两个变量是对等关系,不分自变量和因变量,因此,相关系数只有一个。自变量和因变量,因此,相关系数只有一个。2 2)相关系数有正负号,它们反映相关关系的)相关系数有正负号,它们反映相关关系的方向,正号反映正相关,负号反映负相关。方向,正号反映正相关,负号反映负相关。3 3)相关的两个变量必须是随机的,这也是对等)相关的两个变量必须是随机的,这也是对等关系的反映。关系的反映。本讲稿第十六页,共三十九页相关系数的显著性检验相关系数的显著性检验相关系数是根据相关
11、系数是根据样本数据样本数据计算的,具有一定随机性计算的,具有一定随机性,能否真实地表现变量总体的相关情况受到随机,能否真实地表现变量总体的相关情况受到随机因素和样本容量大小的影响。故需要对其进行检因素和样本容量大小的影响。故需要对其进行检验。验。样本相关系数的检验包括两类检验:样本相关系数的检验包括两类检验:(1 1)对总体相关系数是否等于)对总体相关系数是否等于0 0进行检验;进行检验;(2 2)对总体相关系数是否等于某一给定的不为)对总体相关系数是否等于某一给定的不为0 0的数值进行检验。的数值进行检验。本讲稿第十七页,共三十九页总体相关系数的检验统计上用总体相关系数的检验统计上用t t检
12、验。其步骤如下:检验。其步骤如下:第一步,提出原假设和备择假设。假设样本相关系数第一步,提出原假设和备择假设。假设样本相关系数r r是是抽自具有零相关的总体,即抽自具有零相关的总体,即第二步,规定显著性水平,并依据自由度(第二步,规定显著性水平,并依据自由度(n-2n-2)确定临界值)确定临界值 ;第三步,计算检验的统计量:第三步,计算检验的统计量:对总体相关系数是否等于对总体相关系数是否等于0 0的检验的检验 本讲稿第十八页,共三十九页第四步,做出判断。将计算的统计量与临第四步,做出判断。将计算的统计量与临界值对比,若统计量大于或等于临界值,界值对比,若统计量大于或等于临界值,表明变量间线性
13、相关在统计上是显著的,表明变量间线性相关在统计上是显著的,若统计量小于临界值,则说明相关关系在若统计量小于临界值,则说明相关关系在统计上并不显著。统计上并不显著。本讲稿第十九页,共三十九页例:例:对上例中产品产量与生产费用之间的相关系对上例中产品产量与生产费用之间的相关系数检验数检验 提出原假设和备择假设。提出原假设和备择假设。取显著性水平取显著性水平 ,根据自由度,根据自由度 查查 分布表得分布表得 =2.4469=2.4469计算检验的统计量:计算检验的统计量:=9.7236 =9.7236本讲稿第二十页,共三十九页由于由于 ,则拒绝,则拒绝 ,表明变,表明变量间线性相关在统计上是显著的。
14、即产量间线性相关在统计上是显著的。即产品产量与生产费用之间的相关系数是显品产量与生产费用之间的相关系数是显著的。著的。本讲稿第二十一页,共三十九页线性回归分析线性回归分析一、回归分析概念及与相关分析的关系一、回归分析概念及与相关分析的关系1.1.回归分析的含义回归分析的含义回归分析是指对具有相关关系的现象,回归分析是指对具有相关关系的现象,根据其根据其相关关系的形态相关关系的形态,选择一个合适的数学模型,选择一个合适的数学模型,用来近似的表示变量间的平均变化关系的一用来近似的表示变量间的平均变化关系的一种统计分析方法。种统计分析方法。本讲稿第二十二页,共三十九页回归分析与相关分析的关系回归分析
15、与相关分析的关系联系联系 :二者都是对客观事物数量:二者都是对客观事物数量依存关系的分析依存关系的分析。一方面,。一方面,相关分析是回归分析的相关分析是回归分析的基础和前提基础和前提。另一方面,回归分析是。另一方面,回归分析是相关分析的相关分析的深入和继续深入和继续。区别区别 :1 1)回归分析中变量之间的关系是不对等的)回归分析中变量之间的关系是不对等的 2 2)在两个变量互为因果的情况下,可以配合两个回归方程)在两个变量互为因果的情况下,可以配合两个回归方程 3 3)在回归分析中,确定回归方程时只要求因变量是随机)在回归分析中,确定回归方程时只要求因变量是随机变量,而自变量为给定的值;变量
16、,而自变量为给定的值;本讲稿第二十三页,共三十九页回归分析的类型回归分析的类型回归分析回归分析按回归变量按回归变量个数分个数分按回归形式分按回归形式分一元回归一元回归多元回归多元回归线形回归线形回归非线性回归非线性回归本讲稿第二十四页,共三十九页简单直线回归方程的配合方法简单直线回归方程的配合方法回归方程式,其一般形式为:应用最小平方法原理有:本讲稿第二十五页,共三十九页估计标准误差估计标准误差估计标准误差是就是观察值 对估计值 的平均离差,也叫回归误差,是衡量因变量的估计值与观测值之间的平均误差大小的指标。简捷公式:本讲稿第二十六页,共三十九页估计标准误差和相关系数的关系本讲稿第二十七页,共
17、三十九页可决系数(判定系数)可决系数(判定系数)为回归平方和与总误差平方和之比为回归平方和与总误差平方和之比可决定系数范围在可决定系数范围在0,1。越接近。越接近1代表回归代表回归方程代表性越强。在一元方程式其值等于两方程代表性越强。在一元方程式其值等于两个变量相关系数的平均,在一元线性回归中个变量相关系数的平均,在一元线性回归中可决系数等于相关系数的平方。可决系数等于相关系数的平方。本讲稿第二十八页,共三十九页回归方程的显著性检验回归方程的显著性检验 对于回归方程进行显著性检验基于以下两点:对于回归方程进行显著性检验基于以下两点:第一,在根据样本数据拟合回归方程时,第一,在根据样本数据拟合回
18、归方程时,我们首先假设变量我们首先假设变量 与与 之间存在着线性关系,之间存在着线性关系,但这种假设是否成立?就必须通过检验才能证但这种假设是否成立?就必须通过检验才能证实;实;第二,样本回归方程第二,样本回归方程 中的中的 、是对总体回归是对总体回归方程中参数方程中参数 的最小二乘估计值,样本回归系数的最小二乘估计值,样本回归系数 能能否作为总体回归系数否作为总体回归系数 的估计值,还需要对总体回的估计值,还需要对总体回归系数归系数 的显著性进行检验。的显著性进行检验。本讲稿第二十九页,共三十九页回归方程的检验一般包括两个方面的内回归方程的检验一般包括两个方面的内容:容:一是线性关系的检验;
19、一是线性关系的检验;二是回归系数的检验。二是回归系数的检验。在一元线性回归中两种检验是等价的在一元线性回归中两种检验是等价的本讲稿第三十页,共三十九页(1 1)线性关系的检验)线性关系的检验具体方法是将回归离差平方和(具体方法是将回归离差平方和(SSRSSR)同剩余离)同剩余离差平方和(差平方和(SSESSE)加以比较,应用)加以比较,应用F F检验来分析二检验来分析二者之间的差别是否显著。检验的具体步骤如下:者之间的差别是否显著。检验的具体步骤如下:第一步,提出假设,所的回归系数均等于第一步,提出假设,所的回归系数均等于0 0。H H0 0:=0=0,H H1 1:00:本讲稿第三十一页,共
20、三十九页第二步,计算检验统计量第二步,计算检验统计量F F。可以证明,在原假设成立的情况下,可以证明,在原假设成立的情况下,F F统计量服统计量服从从F F分布,第一自由度为分布,第一自由度为1 1,第二自由度为,第二自由度为n-2n-2,即即FFFF(1 1,n-2n-2)。)。本讲稿第三十二页,共三十九页第三步,确定显著性水平以及临界值第三步,确定显著性水平以及临界值F。确定显著性水平确定显著性水平(通常(通常=0.05)。)。依据依据 和两个自由度和两个自由度、查查F分布表可得相应的临界值分布表可得相应的临界值。第四步,做出判断。第四步,做出判断。如果如果 ,拒绝原假设,拒绝原假设,表明
21、回归效果显著;反之,则接受原,表明回归效果显著;反之,则接受原假设,表明线性回归方程的回归效果不显著。假设,表明线性回归方程的回归效果不显著。本讲稿第三十三页,共三十九页例:例:以下表的资料为例,对其回归模型以下表的资料为例,对其回归模型作作F F检验检验 本讲稿第三十四页,共三十九页F F检验的步骤:检验的步骤:本讲稿第三十五页,共三十九页回归系数的检验回归系数的检验本讲稿第三十六页,共三十九页回归系数的检验(续)回归系数的检验(续)计算公式如下:本讲稿第三十七页,共三十九页例:以上表数据为例,对回归模型做回归系数检验例:以上表数据为例,对回归模型做回归系数检验 本讲稿第三十八页,共三十九页于是,于是,=128.9599/13.26277=9.72345=128.9599/13.26277=9.72345取显著性水平取显著性水平=0.05=0.05,并根据自由度,并根据自由度=6=6,查分,查分布表得相应的临界值为布表得相应的临界值为2.4472.447。由于由于T=9.72345T=9.72345临界值,拒绝临界值,拒绝H H0 0,表明样本,表明样本回归系数是显著的,生产费用与产品产量之间回归系数是显著的,生产费用与产品产量之间确实存在着线性关系,产品产量是影响生产费确实存在着线性关系,产品产量是影响生产费用的显著因素。用的显著因素。本讲稿第三十九页,共三十九页
限制150内