第六章相关与回归分析.ppt
《第六章相关与回归分析.ppt》由会员分享,可在线阅读,更多相关《第六章相关与回归分析.ppt(85页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、6-1统计学统计学STATISTICSSTATISTICS第六章第六章 相关与回归分析相关与回归分析6-2统计学统计学STATISTICSSTATISTICS内容提要内容提要1、相关关系的概念与种类、相关关系的概念与种类 2、相关分析相关分析3、一元线性回归分析一元线性回归分析4、多元线性回归分析多元线性回归分析5、曲线回归分析曲线回归分析6-3统计学统计学STATISTICSSTATISTICS学习目标学习目标1、理解相关关系的概念、理解相关关系的概念2、掌握一元线性回归的基本原理和参数估、掌握一元线性回归的基本原理和参数估计及模型检验的基本方法计及模型检验的基本方法3、了解多元线性与曲线回
2、归的分析方法、了解多元线性与曲线回归的分析方法4、利用回归方程进行估计和预测、利用回归方程进行估计和预测5、用、用 Excel 进行回归分析进行回归分析6-4统计学统计学STATISTICSSTATISTICS第一节相关关系概述第一节相关关系概述6-5统计学统计学STATISTICSSTATISTICS一、变量间的关系一、变量间的关系6-6统计学统计学STATISTICSSTATISTICS(一)函数关系(一)函数关系1 1、反反映映变变量量之之间间一一一一对对应应的的确确定关系。定关系。2 2、设设有有两两个个变变量量 x x 和和 y y,变变量量 y y 随随变变量量 x x 一一起起变
3、变化化,并并完完全全依依赖赖于于 x x ,当当变变量量 x x 取取某某个个数数值值时时,y y 依依确确定定的的关关系系取取相相应应的的值值,则则称称 y y 是是 x x 的的函函数数,记记为为 y y =f f(x x),其其中中 x x 称为自变量,称为自变量,y y 称为因变量称为因变量3 3、各、各观测点落在一条线上观测点落在一条线上 x xy y6-7统计学统计学STATISTICSSTATISTICS函数关系函数关系(几个例子几个例子)函数关系的例子函数关系的例子某某种种商商品品的的销销售售额额y y与与销销售售量量x x之之间间的的关关系系可可表表示为示为 y y=px p
4、x(p p 为单价为单价)圆的面积圆的面积S S与半径之间的关系可表示为与半径之间的关系可表示为S S=R R2 2 企企业业的的原原材材料料消消耗耗额额y y与与产产量量x x1 1 、单单位位产产量量消消耗耗x x2 2 、原材料价格、原材料价格x x3 3之间的关系可表示为之间的关系可表示为 y y=x x1 1 x x2 2 x x3 3 6-8统计学统计学STATISTICSSTATISTICS(二)相关关系(二)相关关系(correlation)1.变变量量间间之之间间不不严严格格的的数数量量依存关系。依存关系。2.一一个个变变量量的的取取值值不不能能由由另另一个变量唯一确定。一个
5、变量唯一确定。3.当当变变量量 x x 取取某某个个值值时时,变变量量 y y 的取值可能有几个。的取值可能有几个。4.各观测各观测点不在一条线上。点不在一条线上。x xy y6-9统计学统计学STATISTICSSTATISTICS相关关系相关关系(几个例子几个例子)相关关系的例子相关关系的例子父亲身高父亲身高y y与子女身高与子女身高x x之间的关系之间的关系收入水平收入水平y y与受教育程度与受教育程度x x之间的关系之间的关系居民消费支出居民消费支出y y与收入与收入x x之间的关系之间的关系商品销售额商品销售额y y与广告费支出与广告费支出x x之间的关系之间的关系居民储蓄余额居民储
6、蓄余额y y与收入与收入x x之间的关系之间的关系6-10统计学统计学STATISTICSSTATISTICS 二、相关关系的种类二、相关关系的种类单相关1、按相关的形式分为:线性相关非线性相关2、按所研究的变量多少分为:复相关3、按相关的方向分为:正相关负相关4、按相关的程度分为:完全相关不完全相关不相关6-11统计学统计学STATISTICSSTATISTICS不同相关形式散点图不同相关形式散点图(scatter diagram)不相关不相关不相关不相关不相关不相关 负线性相关负线性相关负线性相关负线性相关负线性相关负线性相关 正线性相关正线性相关正线性相关正线性相关正线性相关正线性相关
7、非线性相关非线性相关非线性相关非线性相关非线性相关非线性相关 完全负线性相关完全负线性相关完全负线性相关完全负线性相关完全负线性相关完全负线性相关完全正线性相关完全正线性相关完全正线性相关完全正线性相关完全正线性相关完全正线性相关 6-12统计学统计学STATISTICSSTATISTICS三、相关关系分析的方法三、相关关系分析的方法6-13统计学统计学STATISTICSSTATISTICS(一)相关分析(一)相关分析1.相关分析主要用于测定具有相关关系的变量之间相互关系的密切程度。2.是回归分析的基础。3.分析方法主要有:绘制散点图、编制相关表、计算相关系数或相关指数等。6-14统计学统计
8、学STATISTICSSTATISTICS(二)回归分析(二)回归分析(Regression)1.研究具有相关关系的变量值之间一般的数量变动关系,即自变量发生变化时,因变量平均会发生多大的变化。2.通过建立回归方程进行分析。3.回归方程除可用于研究相关变量之间的一般数量变动关系外,还常用于进行预测。6-15统计学统计学STATISTICSSTATISTICS回归模型的类型回归模型的类型6-16统计学统计学STATISTICSSTATISTICS第二节相关分析第二节相关分析6-17统计学统计学STATISTICSSTATISTICS一、相关表和相关图一、相关表和相关图6-18统计学统计学STAT
9、ISTICSSTATISTICS相关表与相关图相关表与相关图(概念要点)(概念要点)1、相关表和相关图是研究相关关系的直观工相关表和相关图是研究相关关系的直观工具。具。一般在进行详细的定量分析之前,可一般在进行详细的定量分析之前,可以利用它们对现象之间存在的相关关系的以利用它们对现象之间存在的相关关系的方向、形式和密切程度做大致的判断。方向、形式和密切程度做大致的判断。2、相关表相关表是一种反映变量之间相关关系的统是一种反映变量之间相关关系的统计表。计表。3、相关图又称散点图相关图又称散点图:用来反映变量之间相用来反映变量之间相关关系的图形关关系的图形。6-19统计学统计学STATISTICS
10、STATISTICS相关表相关表(例(例6.1)家庭编号家庭编号1 12 23 34 45 56 67 78 89 91010可支配收入可支配收入 2525 1818 6060 45456262 8888 9292 999975759898可支配收入可支配收入 1818 2525 4545 60606262 7575 8888 929298989999 10各家庭收入和消费的原始资料 计量单位:百元 消费和收入相关表 计量单位:百元消费支出消费支出2020 1515 4040 30304242 6060 6565 707053537878消费支出消费支出1515 2020 3030 40404
11、242 5353 6060 6565787870706-20统计学统计学STATISTICSSTATISTICS 散点图散点图 (例例6.2)6-21统计学统计学STATISTICSSTATISTICS二、相关系数及其检验二、相关系数及其检验6-22统计学统计学STATISTICSSTATISTICS(一)相关系数及其计算(一)相关系数及其计算6-23统计学统计学STATISTICSSTATISTICS 相关系数相关系数(correlation coefficient)1.用于测度变量之间线性相关关系密切程度的度量值(指标)。2.对两两个个变变量量之间线性相关程度的度量称为单单相相关系数关系数
12、。3.若相关系数是根据总体全部数据计算的,称为总体相关系数,记为 ,若是根据样本数据计算的,则称为样本相关系数,记为 r 6-24统计学统计学STATISTICSSTATISTICS相关系数相关系数(计算公式计算公式)样本相关系数的计算公式或化简为6-25统计学统计学STATISTICSSTATISTICS相关系数相关系数(取值及其意义取值及其意义)1.r r 的取值范围的取值范围是是 -1,1-1,12.|r r|=|=1 1,为完全相关为完全相关n nr r=1 1,为完全正相关,为完全正相关n nr r=-1-1,为完全负正相关,为完全负正相关3.r r=0=0,不存在不存在线性线性线性
13、线性相关相关关系关系4.-1-1 r r 0 0,为负相关为负相关5.0 0 t t,拒绝,拒绝H H0 0 若若 t t =4.921t t(10-2)=2.306(10-2)=2.306,拒拒绝绝H H0 0,智智商商值值与与劳动生产率之间存在着显著的正线性相关关系劳动生产率之间存在着显著的正线性相关关系 6-37统计学统计学STATISTICSSTATISTICS第三节第三节 一元线性回归一元线性回归6-38统计学统计学STATISTICSSTATISTICS一、一元线性回归函数与模型一、一元线性回归函数与模型6-39统计学统计学STATISTICSSTATISTICS一元线性回归函数一
14、元线性回归模型总体样本(一)一元线性回归函数与(一)一元线性回归函数与模型的数学表达式模型的数学表达式 式中:式中:0是回归直线在是回归直线在 y 轴上的截距,是当轴上的截距,是当 x=0 时时 y 的期的期望值。望值。1是直线的斜率,称为回归系数,表示当是直线的斜率,称为回归系数,表示当 x 每变动一个每变动一个单位时,单位时,y 的平均变动值。的平均变动值。6-40统计学统计学STATISTICSSTATISTICSXYX1X2X3X4(二)一元线性回归函数与(二)一元线性回归函数与模型意义的图形解释模型意义的图形解释6-41统计学统计学STATISTICSSTATISTICS(三)一元线
15、性回归模型的(三)一元线性回归模型的(三)一元线性回归模型的(三)一元线性回归模型的基本假定基本假定基本假定基本假定 1.1.误误差差项项u u是是一一个个期期望望值值为为0 0的的正正态态分分布布随随机机变变量量,即即2.2.对对于所有的于所有的 x x 值,值,u u的方差的方差 2 2 都相同,即都相同,即3.3.对对于于一一个个特特定定的的 x x 值值,它它所所对对应应的的u u与与其其他他 x x 值值所所对应的对应的u u不相关。即不相关。即4.4.对对于于一一个个特特定定的的 x x 值值,它它所所对对应应的的 y y 值值与与其其他他 x x 所所对应的对应的 y y 值也不
16、相关值也不相关6-42统计学统计学STATISTICSSTATISTICSXYX1X2X3X4回归模型基本假定的图形解释回归模型基本假定的图形解释6-43统计学统计学STATISTICSSTATISTICS(四)样本回归方程与总体回归方(四)样本回归方程与总体回归方程的联系与区别程的联系与区别联联系系:样样本本回回归归方方程程与与总总体体回回归归方方程程具具有有相相同同的的形形式式,且且样样本回归模型是作为总体回归模型的估计而存在的。本回归模型是作为总体回归模型的估计而存在的。区别:区别:1 1、总总体体回回归归线线是是未未知知的的,且且只只有有一一条条。而而样样本本回回归归线线则则是是根根据
17、据样样本本数数据据拟拟合合的的,每每抽抽取取一一个个样样本本,便便可可以以拟拟合合一一条条回回归线。归线。2 2、总总体体回回归归方方程程中中的的参参数数是是未未知知的的,但但它它是是确确定定的的。而而样样本回归方程中的参数是随机变量,随样本的不同而不同。本回归方程中的参数是随机变量,随样本的不同而不同。3 3、总总体体回回归归模模型型中中的的ui是是(因因变变量量实实际际观观测测值值)Yi与与总总体体回回归归线线之之间间的的纵纵向向距距离离,它它是是不不可可直直接接观观测测的的。而而样样本本回回归归模模型型中中ei是是Yi与与样样本本回回归归线线之之间间的的纵纵向向距距离离,当当根根据据样样
18、本本数数据据拟合出样本回归线之后,可以计算出拟合出样本回归线之后,可以计算出ei的具体数值。的具体数值。6-44统计学统计学STATISTICSSTATISTICS二、模型参数的估计二、模型参数的估计6-45统计学统计学STATISTICSSTATISTICS(一)回归系数的估计(一)回归系数的估计 最小二乘估计最小二乘估计1.使因变量的观察值与估计值之间的离差平方和达到最小来求得 和 的方法。即2.用最小二乘法拟合的直线来代表x与y之间的关系与实际数据的误差比其他任何直线都小6-46统计学统计学STATISTICSSTATISTICS最小二乘估计最小二乘估计(图示图示)x xy y(x xn
19、 n,y yn n)(x x1 1,y y1 1)(x x2 2,y y2 2)(x xi i,y yi i)e ei i=y yi i-y yi i6-47统计学统计学STATISTICSSTATISTICS最小二乘法最小二乘法(和和 的计算公式的计算公式)根据最小二乘法的要求,可得求解 和 的公式如下6-48统计学统计学STATISTICSSTATISTICS最小二乘法最小二乘法(例题分析例题分析)【例例例例6.46.4】一一一一项项项项调调调调查查查查得得得得到到到到9 9个个个个家家家家庭庭庭庭的的的的月月月月收收收收入入入入和和和和存存存存款款款款数数数数据如据如据如据如表表表表7-
20、47-4,用最小而乘法建立回归方程如下:,用最小而乘法建立回归方程如下:,用最小而乘法建立回归方程如下:,用最小而乘法建立回归方程如下:回归方程为:回归方程为:回回归归系系数数为为0.1017,0.1017,表表示示收收入入每每增增加加1 1千千元元,家庭存款额平均增加家庭存款额平均增加0.10170.1017千元千元 6-49统计学统计学STATISTICSSTATISTICS6-50统计学统计学STATISTICSSTATISTICS用用Excel绘制绘制回归直线回归直线6-51统计学统计学STATISTICSSTATISTICS(二)总体方差的估计(二)总体方差的估计 此外,此外,S S
21、2 2 的正平方根也叫做回归的正平方根也叫做回归估计的标准差估计的标准差。S S越小,回归线的代表性越强,否则相反。越小,回归线的代表性越强,否则相反。总总体体方方差差(2)是是检检验验模模型型时时,必必须须利利用用的的一一个个重重要要参参数数,可可以以反反映映理理论论模模型型误误差差的的大大小小。由由于于2 2本本身身不不能能直直接观测,因而需要用接观测,因而需要用e et t2 2(最小二乘残差)来估计(最小二乘残差)来估计2 2。可以证明可以证明2 2的无偏估计为:的无偏估计为:6-52统计学统计学STATISTICSSTATISTICS三、回归模型的检验三、回归模型的检验6-53统计学
22、统计学STATISTICSSTATISTICS1 1、经济理论检验、经济理论检验经济理论检验主要涉及估计值的符号和取值区间。经济理论检验主要涉及估计值的符号和取值区间。2 2、统计检验(一级检验)、统计检验(一级检验)统统计计检检验验是是利利用用统统计计学学中中的的抽抽样样理理论论检检验验样样本本回回归归方程的可靠性,包括拟合优度检验和显著性检验。方程的可靠性,包括拟合优度检验和显著性检验。3 3、计量经济学检验(二级检验)、计量经济学检验(二级检验)计量经济学检验是对标准回归方程的假定条件能否得到满足进行检验。(一)模型检验的内容(一)模型检验的内容6-54统计学统计学STATISTICSS
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 第六 相关 回归 分析
限制150内