统计学——相关与回归.PPTx
1第七章 相关与回归分析STAT 第一节 相关分析的概念与种类一、相关分析的概念(一)函数关系 函数关系是指现象之间存在的确定性的、严格的对应关系。当一个变量发生变化时,另一个变量会有一个精确的值和它对应。(二)相关关系、定义:相关关系是指现象之间确实存在的数量上的相互依存关系,在数量上表现为非确定性的依存关系。例1、粮食产量与施肥量(降雨量、田间管理水平等);例2、消费支出与可支配收入(消费习惯、心理因素、相关 商品价格等)。第1页/共54页2第七章 相关与回归分析STAT2、相关关系的特点 第一:相关关系是指现象之间确实存在着数量上的相互依存关系。它表明,当一个现象发生数量上的变化,另一个现象也会相应地发生数量上的变化。第二:现象之间数量依存关系的具体关系值不是固定不变的,有多个。它们围绕平均数依照一定的规律变动。(三)相关关系与函数关系的区别与联系 区别:函数关系是变量之间的一种确定性对应关系,变量之间的具体关系值是固定的;相关关系则是一种非确定性依存关系,变量之间的具体关系值不是固定不变的。联系:对具有相关关系的现象进行分析时,必须利用相应的函数关系表达式来表明现象之间的数量关系。由于观察和测量误差等原因,函数关系在实际中往往通过相关关系表现出来。第2页/共54页3第七章 相关与回归分析STAT (四)相关分析与回归分析的区别与联系 区别:相关分析是研究变量之间相关程度大小的统计方法,回归分析是通过函数关系来表达变量之间数量关系的统计方法。联系:相关分析与回归分析是互相补充、密切联系的。相关分析需要依靠回归分析来表明现象数量变化的一般关系,而回归分析则建立在相关分析的基础上,只有在现象之间存在高度相关时,进行回归分析求其现象数量变化的一般关系才有意义。第3页/共54页4第七章 相关与回归分析STAT二、相关关系的种类(一)按相关的程度分1、完全相关:一个变量的数量变化由另一个变量的数量变化所唯一确定(函数关系);2、不相关:两个变量彼此的数量变化互相独立(没有关系);3、不完全相关:两个变量之间的关系介于完全相关和不相关之间(相关关系有关系,但不确定)。(二)按相关的方向分 1、正相关:当一个变量的数值增加或减少时,另一个变量的数值也相应增加或减少。(二者变动方向一致,即同增同减)2、负相关:当一个变量的数值增加或减少时,另一个变量的数值则减少或增加。(二者变动方向相反,即一增一减)第4页/共54页5第七章 相关与回归分析STAT(三)按相关的形式可分为1、*线性相关(直线相关):一个变量对另一个变量的影响表现为直线的形式。进一步可区分为正相关与负相关。2、非线性相关(曲线相关):一个变量对另一个变量的影响表现为曲线的形式。非线性相关一般不区分方向。(四)按影响因素的多少可区分为1、*单(简单)相关:两个变量之间的相关关系;2、复(多元)相关:三个或三个以上的变量之间的相关关系。例:体重与身高、食欲、睡眠时间之间的关系3、偏相关:在三个或三个以上的变量中,假定其他变量不变只测定其中两个变量的相关关系。第5页/共54页6第七章 相关与回归分析STAT三、相关分析的特点 1、相关分析的两个变量是对等的,不必区分自变量和因变量;2、只能算出一个相关系数;3、相关分析的两个变量都是随机变量。第6页/共54页7第二节第二节 相关关系的测定相关关系的测定一、相关图表(一)相关表 相关表是把具有相关关系的两种变量的数值,相对应地有顺序地排列在一张表上。1、简单相关表:原始资料未经分组线性正相关2、单变量分组相关表:只对一个变量分组第7页/共54页8第七章 相关与回归分析STAT3、双变量分组相关表:同时对两个变量都进行分组而制成的相关表。(二)相关图:以横轴代表X,纵轴代表Y,绘制散点图。不足之处:难以量化,反映相关程度不精确。第8页/共54页9二、(线性)相关系数(一)定义:反映变量x和变量y之间线性相关方向与密切程度的统计指标。注:线性相关 相关系数r;曲线相关 相关指数R。(二)积差法计算公式:第9页/共54页10第10页/共54页11相关系数的取值范围:当r=0时,表明两个变量之间完全不相关,即不存在线性相关关系;当r=1时,相关关系转为函数关系,称为完全相关;当-1r1时,表明两个变量之间不完全相关;当-1r0时,表明两个变量之间是负相关;当0r1时,表明两个变量之间是正相关.r 越接近于1(+1或-1),表明相关关系越强,r 越接近于0,表明相关关系越弱。相关关系的绝对值 在:0.3以下,为微弱线性相关;0.30.5,为低度线性相关;0.50.8,为显著(中度)线性相关,0.8以上为高度线性相关。第11页/共54页12例:某企业某商品在过去八年的价格与相应的销售资料见下表,试分析该商品销售量与价格的相关关系。第12页/共54页13(三)相关系数r的计算公式中,协方差与变量标准差的作用1、协方差(积差平均数)的意义(略)(1)显示x与y是正相关还是负相关第13页/共54页14第七章 相关与回归分析STAT 直线相关条件下:x与y分布在第一、三象限时,协方差为正值,r为正值(正相关);x与y分布在第二、四象限时,协方差为负数时,r为负数(负相关)。第14页/共54页15第15页/共54页16第七章第七章 相关与回归分析相关与回归分析STAT2、显示x与y之间的相关程度。第16页/共54页17第七章第七章 相关与回归分析相关与回归分析STAT负相关第17页/共54页18第七章第七章 相关与回归分析相关与回归分析STAT不相关第18页/共54页192、标准差 的作用(1)经过离差标准化后,协方差由平均数化为相对数,可以比较不同现象相关程度的高低。(2)x、y协方差数值可无限增多或减少,经过离差标准化后,可以使相关系数在-1和+1之间变动。即:第19页/共54页20第七章 相关与回归分析STAT第20页/共54页21(四)相关系数的检验 一般是根据样本的数据计算出来的样本相关系数,要说明两个总体变量是否具有相关关系,需作假设检验。第21页/共54页22第七章 相关与回归分析STAT第三节第三节 回归分析回归分析一、回归分析的概念与种类(一)概念 上述相关分析:计算相关系数 r 确定两变量之间的相关方向与密切程度。但无法表明两变量之间的数量关系 无法从一个变量(x)的变化来推测另一个变量(y)的变化情况。回归分析是对具有相关关系的诸变量之间的数量变化的一般关系进行测定,确定一个数学表达式,用于估计或预测的方法。(二)种类1、按自变量的多少分类A、简单(一元)回归:自变量只有一个。例 y=a+bx+B、复(多元)回归:自变量为2个或2个以上。例 y=0+1x1+2x2+nxn+第22页/共54页23第七章 相关与回归分析STAT2、按回归方程式的特征区分A、线性回归:因变量为自变量的线性函数。例 y=a+bx+B、非线性回归:因变量为自变量的非线性函数。本章研究简单线性回归(三)简单线性回归的特点 1、两个变量之间不是对等关系,一个是自变量,一个是因变量;2、回归分析中,自变量是给定的数值,因变量是随机变量,因变量不是一个确定性的数值,而且许多可能数值的平均数;第23页/共54页24第七章 相关与回归分析STAT3、在因果关系不明显的资料中,对于x与y存在两个回归方程;4、回归系数可用来判断两现象之间是正相关还是负相关。回归系数为正数,表示上升直线,现象为正相关;回归系数为负数,表示下降直线,现象为负相关。第24页/共54页25第七章 相关与回归分析STAT(四)回归分析的步骤 1、根据有关理论和分析判断,确定自变量和因变量;2、确定合适的数学方程式(回归模型)描述变量间的关系;3、对样本回归模型进行统计检验;4、利用回归模型,对客观现象总体进行预测或控制。二、简单线性回归方程的拟合 以y倚x方程为例 为使拟合的直线有代表性,是最佳的回归估计,可采用最小平方法。回归直线必须满足两条件:第25页/共54页26第七章 相关与回归分析STAT第26页/共54页27第七章 相关与回归分析STAT例为研究收入与食品支出的关系,随机抽取了10户家庭的样本。第27页/共54页28第七章 相关与回归分析STAT解:通过散点图可近似看出收入与食品支出之间呈线性关系,故设两者有关系第28页/共54页29第七章 相关与回归分析STAT相关系数 r 与回归系数 b 之间的关系:第29页/共54页30第七章 相关与回归分析STAT解:第30页/共54页31第七章 相关与回归分析STAT三、回归方程的方差分析(回归直线的评价)(一)总离差平方和的分解(拟合优度)两边平方得:第31页/共54页32第七章 相关与回归分析STAT离差分析:第32页/共54页33第七章 相关与回归分析STAT判定系数:第33页/共54页34第七章 相关与回归分析STAT判定系数的作用:第34页/共54页35第七章 相关与回归分析STAT第35页/共54页36第七章 相关与回归分析STAT第36页/共54页37第七章 相关与回归分析STAT四、判定系数与回归系数的关系:第37页/共54页38五、估计标准误误差()及其计算1、定义:观察值y与估计值 之间的平均误差。2、公式:第38页/共54页39第七章 相关与回归分析STAT六、相关系数与估计标准误差的关系第39页/共54页40第七章 相关与回归分析STAT例已知下列资料,试计算判定系数与估计标准误。第40页/共54页41第七章 相关与回归分析STAT例已知下列资料,试计算判定系数与估计标准误。第41页/共54页42第七章 相关与回归分析STAT七、一元线性回归模型的检验(一)回归系数的检验 样本回归系数=b 总体回归系数=对回归系数b检验时:第42页/共54页43第七章 相关与回归分析STAT 在大样本条件下,按此Z变量对b进行显著性检验,可查标准正态概率表确定临界值。如果是小样本,则需用标准化处理的t变量,即:此变量服从自由度为n-2的t分布,查t检验临界值表确定临界值。第43页/共54页44第七章 相关与回归分析STAT例:设第44页/共54页45第七章 相关与回归分析STAT第45页/共54页46第七章 相关与回归分析STAT(二)一元线性回归模型的检验 检验统计量:如果回归方程经检验回归是显著的,则可利用它对因变量y的值进行预测。第46页/共54页47第七章 相关与回归分析STAT八、一元线性回归的预测第47页/共54页48第七章 相关与回归分析STAT当n30时,预测区间为:第48页/共54页49第49页/共54页50第50页/共54页51国民经济核算基本原理一、课程定义 对一国国民经济运行的定量描述。二、核算原则 1、市场原则 确定国民生产的边界以及核算体系的范围;2、所有权原则 确定资产与负债的范围;3、国民三等价原则 搭起国民核算的骨架,确保整体的一致性;4、权责发生制原则 确定核算时点;5、现行市场价格原则 确定流量与存量的价格。三、核算方法 1、国民帐户法;2、平衡式;3、图示法;4、矩阵法第51页/共54页52国民经济核算基本原理四、国内生产总值 反映一国(地区)常住单位当期生产的所有最终产品的总价值。核算方法:1、生产法 国内生产总值=国内总产出-中间消耗 2、支出法 国内生产总值=总消费+总投资+净出口 3、收入法 国内生产总值=劳动报酬+生产税净额 +固定资本消耗+营业盈余五、国民总收入 一国(地区)常住单位当期所获得的初次分配收入的总和。核算方法:国民总收入=国内生产总值+来自国外的初次分配收入 -对国外的初次分配支出 国民总收入=各部门原始总收入的总和。第52页/共54页53国民经济核算基本原理六、国民可支配收入 一国(地区)常住单位当期获得能用于最终消费支出的最大数额。核算方法:国民可支配总收入=国民总收入+来自国外的再分配收入 -对国外的再分配支出 国民可支配总收入=各部门可支配总收入的总和第53页/共54页54谢谢您的观看!第54页/共54页