相关与回归分析 精.ppt
相关与回归分析 第8章 回归分析1第1页,本讲稿共33页第8章 回归分析2一、相关分析的概念现实世界中现象之间存在着两种关系现实世界中现象之间存在着两种关系函数关系函数关系 它反映现象之间存在着严格的依存关系,在这种关系中,对于某一变量的每一个数值,都有另一个变量的确定值与之相对应,并且这种关系可以用一个数学表达式反映出来。例:圆的面积与半径的关系例:圆的面积与半径的关系 S=RS=R2 2上一页下一页返回本节首页第2页,本讲稿共33页第8章 回归分析3相关关系相关关系它反映现象之间确实存在的,但关系数值不固定的相互依存关系。这一概念表明:(1)相关关系是指现象之间确实存在数量上的相互依存关系。(2)现象之间数量依存关系的具体关系值不是固定的。上一页下一页返回本节首页第3页,本讲稿共33页第8章 回归分析4相关关系与函数关系的联系和区别相关关系与函数关系的联系和区别由由于于有有观观察察或或测测量量误误差差等等原原因因,函函数数关关系系在在实实际际中中往往往往通通过过相相关关关关系系表表现现出出来来。在在研研究究相相关关关关系系时时,又又常常常常要要使使用用函函数数关关系系的的形形式式来来表表现现,以以便便找到相关关系的一般数量表现形式。找到相关关系的一般数量表现形式。2 2、相关关系是统计学的研究范围;、相关关系是统计学的研究范围;函数关系是数学的研究范围。函数关系是数学的研究范围。第4页,本讲稿共33页第8章 回归分析5二、相关分析的种类根据相关因素的多少划分根据相关因素的多少划分 单相关:只涉及两个变量。单相关:只涉及两个变量。复相关:涉及三个或三个以上的变量。复相关:涉及三个或三个以上的变量。3.偏偏相相关关:在在涉涉及及到到三三个个或或三三个个以以上上的的变变量量时时,假假定定其其它它变变量量维维持持不不变变,只只研研究究其其中中两两个个变量的相关关系,这种相关关系叫偏相关变量的相关关系,这种相关关系叫偏相关上一页下一页返回本节首页第5页,本讲稿共33页第8章 回归分析6根据相关的形式不同划分根据相关的形式不同划分 线线性性相相关关(直直线线相相关关):当当一一个个变变量量变变动动时时,另另一一个个变变量量也也相相应应地地成成比比例例地变动。地变动。非非线线性性相相关关(曲曲线线相相关关):当当一一个个变变量量变变动动时时,另另一一个个变变量量也也相相应应发发生生变变动,但这种变动不是成比例的。动,但这种变动不是成比例的。第6页,本讲稿共33页第8章 回归分析7根据相关关系的方向划分根据相关关系的方向划分 正正相相关关:两两个个变变量量之之间间的的变变化化方方向一致,都是增长趋势或下降趋势。向一致,都是增长趋势或下降趋势。负负相相关关:两两个个变变量量变变化化趋趋势势相相反反,一一个个下下降降而而另另一一个个上上升升,或或一一个个上上升而另一个下降。升而另一个下降。上一页下一页返回本节首页第7页,本讲稿共33页第8章 回归分析8各类相关关系的表现形态图各类相关关系的表现形态图 第8页,本讲稿共33页第8章 回归分析9二、相关系数第9页,本讲稿共33页第8章 回归分析10上一页下一页返回本节首页相关系数的涵义:相关系数是用来说明变量之间在直线相关条件下相关关系密切程度和方向的统计分析指标。第10页,本讲稿共33页第8章 回归分析11相关系数公式的涵义理解相关系数公式的涵义理解(1)两个变量之间的相关程度和方向,取决于两个变量离差乘积之和 ,当它为0时,为0;当它为正时,为正;当它为负时,为负。(2)相关程度的大小与计量单位无关。为了消除积差中两个变量原有计量单位的影响,将各变量的离差除以该变量数列的标准差,使之成为相对积差,即 ,所以相关系数是无量纲的数量。第11页,本讲稿共33页第8章 回归分析12第12页,本讲稿共33页第8章 回归分析13相关系数的意义相关系数的意义相关系数一般可以从正负符号和绝对数值的大小两个层面理解。正负说明现象之间是正相关还是负相关。绝对数值的大小说明两现象之间线性相关的密切程度。(1)r的取值在-1到+1之间。(2)r=+1,为完全正相关;r=-1为完全负相关。表明变量之间为完全线性相关,即函数关系。(3)r=0,表明两变量无线性相关关系。(4)r0,表明变量之间为正相关;r0,表明变量之间为负相关。(5)r的绝对值越接近于1,表明线性相关关系越密切;r越接近于0,表明线性相关关系越不密切。第13页,本讲稿共33页第8章 回归分析14相关程度可分为以下几种情况:相关程度可分为以下几种情况:,为无线性相关;0.3 0.5,为低度线性相关;0.5 0.8,为显著线性相关;0.8,一般称为高度线性相关。以上说明必须建立在相关系数通过显著性检验的基础之上。第14页,本讲稿共33页第8章 回归分析15相关系数的计算:用计算器计算例 上一页下一页返回本节首页第15页,本讲稿共33页第8章 回归分析16一、回归分析的概念 回归分析:回归分析就是对具有相关关系的变量之间数量变化的一般关系进行测定,确定一个相关的数学表达式,以便于进行估计或预测的统计方法。回归分析的种类:按自变量x的多少,可以分为一元回归和多元回归;按y与x曲线的形式,可以分为直线回归和曲线回归。上一页下一页返回本节首页第16页,本讲稿共33页第8章 回归分析17二、直线回归简单直线回归方程的确定简单直线回归分析的特点在两个变量之间,必须确定哪个是自变量,哪个是因变量回归方程的主要作用是用自变量来推算因变量。上一页下一页返回本节首页第17页,本讲稿共33页第8章 回归分析18简单直线回归方程的确定设(x,y)为实际值,yc为估计值,采用普通最小二乘法,设拟合的直线为:根据最小二乘原理:上一页下一页返回本节首页第18页,本讲稿共33页第8章 回归分析19上一页下一页返回本节首页第19页,本讲稿共33页第8章 回归分析20多元线性回归回归方程为要估计参数a、b1、b2手工计算较繁,可以用EXCEL数据分析功能完成。上一页下一页返回本节首页第20页,本讲稿共33页第8章 回归分析213、总体平方和、残差平方和、回归平方和总体平方和、残差平方和、回归平方和第21页,本讲稿共33页第8章 回归分析22第22页,本讲稿共33页第8章 回归分析23第23页,本讲稿共33页第8章 回归分析24Excel的回归分析工具计算简便,但内容丰富,计算结果共分为三个模块:回归统计表 方差分析表回归参数 回归分析工具的输出解释上一页下一页返回本节首页第24页,本讲稿共33页第8章 回归分析25回归统计表包括以下几部分内容:Multiple R(复相关系数R):R2的平方根,又称为相关系数,它用来衡量变量x和y之间相关程度的大小。上节例中:R为0.9468,表示解释变量与被解释变量之间的关系是:高度正相关。.回归统计表上一页下一页返回本节首页第25页,本讲稿共33页第8章 回归分析26R Square(决定系数R2):用来说明用自变量解释因变量变差的程度,以衡量对观测值的拟合效果。上例中:决定系数为0.9731,表明用自变量可解释因变量变差的97.31%。第26页,本讲稿共33页第8章 回归分析27Adjusted R Square(调整的决定系数R2):仅用于多元回归才有意义,它用于衡量加入独立变量后模型的拟合程度。当有新的独立变量加入后,即使这一变量同因变量之间不相关,未经修正的R2也要增大,修正的R2仅用于比较含有同一个因变量的各种模型。上一页下一页返回本节首页第27页,本讲稿共33页第8章 回归分析28标准误差:又称为标准回归误差或叫估计标准误差,它用来衡量拟合程度的大小,也用于计算与回归有关的其他统计量,此值越小,说明拟合程度越好。第28页,本讲稿共33页第8章 回归分析29观测值:是指用于估计回归方程的数据的观测值个数。方差分析表方差分析表的主要作用是通过F检验来判断回归模型的回归效果。上一页下一页返回本节首页第29页,本讲稿共33页第8章 回归分析30椐样本计算查表第30页,本讲稿共33页第8章 回归分析31(3)回归参数表Intercept:截距0第二、三行:0(截距)和1(斜率)的各项指标。第二列:回归系数0(截距)和1(斜率)的值。第三列:回归系数的标准误差第四列:根据原假设Ho:0=1=0计算的样本统计量t的值。第五列:各个回归系数的p值(双侧)第六列:0和195%的置信区间的上下限。上一页下一页返回本节首页第31页,本讲稿共33页第8章 回归分析32t统计量第32页,本讲稿共33页第8章 回归分析33椐样本计算查表第33页,本讲稿共33页