商务与经济统计相关与回归分析幻灯片.ppt
商务与经济统计相关与回归分析第1页,共63页,编辑于2022年,星期五第十章第十章 相关与回归分析相关与回归分析问题是:问题是:问题是:问题是:1、是否有足够的证据断定:在账单与小费数额之间存在某种联系?、是否有足够的证据断定:在账单与小费数额之间存在某种联系?2、如果存在某种联系,怎样使用这种联系来确定应该留下多少小费?、如果存在某种联系,怎样使用这种联系来确定应该留下多少小费?本章的重点就是基于成对出现的样本数据做出一些推论。如上例,我们想要本章的重点就是基于成对出现的样本数据做出一些推论。如上例,我们想要本章的重点就是基于成对出现的样本数据做出一些推论。如上例,我们想要本章的重点就是基于成对出现的样本数据做出一些推论。如上例,我们想要确定确定确定确定账单与小费数额之间是否存在某种联系,如果存在,我们就想用账单与小费数额之间是否存在某种联系,如果存在,我们就想用一个公式描述它,这样就能找出人们留小费时遵循的规则。类似这样一个公式描述它,这样就能找出人们留小费时遵循的规则。类似这样的问题还有很多,如:的问题还有很多,如:(1)犯罪率与偷窃率;()犯罪率与偷窃率;(2)香烟消费与患癌症率;)香烟消费与患癌症率;(3)个人收入水平与受教育年限;()个人收入水平与受教育年限;(4)血压与年龄;)血压与年龄;(5)父母身高与子女身高;()父母身高与子女身高;(6)薪金与酒价;)薪金与酒价;(7)人的手掌生命线的长度与人的寿命长短。)人的手掌生命线的长度与人的寿命长短。第2页,共63页,编辑于2022年,星期五第十章第十章 相关与回归分析相关与回归分析本章重点本章重点本章重点本章重点1、相关关系与回归方程概述;、相关关系与回归方程概述;2、相关关系的测定;、相关关系的测定;3、回归方程的拟合;、回归方程的拟合;4、回归方程的应用。、回归方程的应用。本章难点本章难点本章难点本章难点1、积差法相关系数的计算;、积差法相关系数的计算;2、总离差平方和及其分解。、总离差平方和及其分解。参考书目参考书目1、李心愉:、李心愉:应用经济统计学应用经济统计学,北京大学出版社;,北京大学出版社;2、David S.Moore:统计学的世界统计学的世界,中信出版社;,中信出版社;3、袁、袁 卫:卫:新编统计学教程新编统计学教程,经济科学出版社;,经济科学出版社;4、统计网站:、统计网站:UNSD、OECD、中国国家统计局、中国国家统计局第3页,共63页,编辑于2022年,星期五第十章第十章 相关与回归分析相关与回归分析第一节第一节第一节第一节 相关关系概述相关关系概述相关关系概述相关关系概述一、变量间的相互关系(一)函数关系函数关系1、定义:完全完全完全完全确定的(数量)关系。(1)某一(组)变量与另一变量间存在着一一对应的关系;例计件工资(y)与产量(x)y=f(x)=10 x;x0=1件,件,y0=10元;元;x1=2件件,y1=20元元 园的面积SR2,R=10,S=100(2)y被解释变量(因变量);x解释变量(自变量)。(二)相关关系相关关系、定义:不完全不完全不完全不完全确定的关系。(1)某一(组)变量与另一变量间有关系,但并非一一对应;第4页,共63页,编辑于2022年,星期五第十章第十章 相关与回归分析相关与回归分析例身高y与体重x;A:x=60kg、y=170m;B:x=60kg、y=1.72m;C:x=60kg、y=1.68m;D:x=60kg、y=1.65m。(2)表述:y=f(x)+。影响身高的因素:体重、遗传、锻炼、睡眠质量2、成因(1)某些影响因素尚未被认识;(2)虽已认识但无法测量;(3)测量误差。例某种水果P元/斤:购买额 y=Px 购买量 x=2斤斤 y=2P+=21.9+0.23、数量关系的形式第5页,共63页,编辑于2022年,星期五第十章第十章 相关与回归分析相关与回归分析(1)单一因果关系单一因果关系;(2)互为因果关系互为因果关系;(3)伴随关系伴随关系。三、相关关系的种类(一)按相关的程度分1、完全相关:函数关系;2、不相关:没有关系;3、不完全相关。(二)按相关的方向分1、正相关:变量的变动方向一致(同增同减同增同减);2、负相关:变量的变动方向相反(一增一减一增一减)。第6页,共63页,编辑于2022年,星期五第十章第十章 相关与回归分析相关与回归分析(三)按相关的形式分1、线性相关;2、非线性相关。相关程度密切相关程度密切相关程度不密切相关程度不密切第7页,共63页,编辑于2022年,星期五第十章第十章 相关与回归分析相关与回归分析(四)按影响因素的多少分1、单(简)相关:只有一个自变量;例学习成绩与学习时间;血压与年龄;亩产量与施肥量。2、复(多元)相关:两个或两个以上的自变量;例经济增长与人口增长、科技水平、自然资源、管理水平等之间的关系;体重与身高、食欲、睡眠时间之间的关系。3、偏相关:就多个变量测定其中两个变量的相关程度而假定其他变量不变。例就y=ax1+bx2+,研究y与x1之间的关系,假定x2不变。第8页,共63页,编辑于2022年,星期五第十章第十章 相关与回归分析相关与回归分析第二节第二节第二节第二节 线性相关关系的测定线性相关关系的测定线性相关关系的测定线性相关关系的测定目的测定变量间的相关方向相关方向与密切程度密切程度。一、相关图表(一)相关表1、单变量分组相关表单变量分组相关表:自变量分组且计算次数,因变量只计算平均数。第9页,共63页,编辑于2022年,星期五第十章第十章 相关与回归分析相关与回归分析2、双变量分组相关表双变量分组相关表:对自变量与因变量均进行分组。注:自变量X轴;因变量Y轴。(二)相关图:散点图散点图不足难以精确反映相关的密切程度。第10页,共63页,编辑于2022年,星期五第十章第十章 相关与回归分析相关与回归分析二、(线性)相关系数、(线性)相关系数(一)积差法计算公式第11页,共63页,编辑于2022年,星期五第十章第十章 相关与回归分析相关与回归分析(二)协方差 xy的作用1、显示x与y之间的相关方向。第12页,共63页,编辑于2022年,星期五第十章第十章 相关与回归分析相关与回归分析负相关第13页,共63页,编辑于2022年,星期五第十章第十章 相关与回归分析相关与回归分析2、显示x与y之间的相关程度。第14页,共63页,编辑于2022年,星期五第十章第十章 相关与回归分析相关与回归分析负相关第15页,共63页,编辑于2022年,星期五第十章第十章 相关与回归分析相关与回归分析不相关第16页,共63页,编辑于2022年,星期五第十章第十章 相关与回归分析相关与回归分析归纳 xy的作用第一、显示x与y之间的相关方向第二、显示x与y之间的相关密切程度第17页,共63页,编辑于2022年,星期五第十章第十章 相关与回归分析相关与回归分析(三)x、y的作用1、使不同变量的协方差标准化标准化直接对比。第18页,共63页,编辑于2022年,星期五第十章第十章 相关与回归分析相关与回归分析2、使第19页,共63页,编辑于2022年,星期五第十章第十章 相关与回归分析相关与回归分析(四)积差法相关系数的简捷计算公式第20页,共63页,编辑于2022年,星期五第十章第十章 相关与回归分析相关与回归分析简捷计算公式第21页,共63页,编辑于2022年,星期五第十章第十章 相关与回归分析相关与回归分析r的简捷计算式第22页,共63页,编辑于2022年,星期五第十章第十章 相关与回归分析相关与回归分析(五)线性相关的判断准则例为了解餐饮业消费数额与小费之间的数额关系,特从若干名消费者中随机抽取10消费者调查,所得数额如下:第23页,共63页,编辑于2022年,星期五第十章第十章 相关与回归分析相关与回归分析例计算过程。第24页,共63页,编辑于2022年,星期五第十章第十章 相关与回归分析相关与回归分析解答:即账单消费额与小费之间存在着高度的正相关关系。第25页,共63页,编辑于2022年,星期五第十章第十章 相关与回归分析相关与回归分析问:若令账单消费额为y,小费为x,则r的取值是否改变?第26页,共63页,编辑于2022年,星期五第十章第十章 相关与回归分析相关与回归分析一些人相信他们的手掌生命线的长度可以来预测他们的寿命。M.E.Wilson和L.E.Mather在美国医学协会学报上发表的一封信中,通过对尸体的研究对此给予了驳斥。死亡时的年龄与手掌生命线的长度被一起记录下来。作者得出死亡时的年龄与生命线的长度不存在显著相关的结论。手相术失传了,手也就放下了。第27页,共63页,编辑于2022年,星期五第十章第十章 相关与回归分析相关与回归分析(六)样本相关系数的特性1、两变量均为随机变量;2、两变量的地位是平等的 rxy=ryx。3、其接近于1的程度与样本容量n有关。n小,r 1。特例:当n=2时,r=1。例样本(x,y)为(6,12.6),(1,3.0),n=2。第28页,共63页,编辑于2022年,星期五第十章第十章 相关与回归分析相关与回归分析(十)关于相关的普通错误在解释关于相关的结果中会出现三种普通的错误:1、相关就一定意味着因果关系。如:一项研究表明,统计学教授的薪金与每人的啤酒消费量之间有很强的正相关关系,但这两个变量都受经济形势的影响。(隐藏变量)2、相关系数为0,一定不相关。3、基于平均数进行相关分析与基于个体数据进行相关分析,其相关程度不一样。如:一项研究中,关于个人收入和教育的成对数据产生了一个0.4的线性相关系数,但当使用区域平均时,线性相关系数变为0.7。第29页,共63页,编辑于2022年,星期五第十章第十章 相关与回归分析相关与回归分析(八)线性相关的假设检验(两种方法)1、提出原假设与备择假设2、给定显著性水平3、选择检验方法,构建检验统计量4、将检验统计量与临界值比较,如检验统计量的绝对值大于临界值,则拒绝原假设,否则,就不拒绝原假设。T检验法r检验法:用已经算好的r作为检验统计量,其临界值可以在附表中找到。第30页,共63页,编辑于2022年,星期五第十章第十章 相关与回归分析相关与回归分析(八)线性相关的假设检验(两种方法)如袭前例:账单与小费之间的r=0.92,若用T统计量:r检验法:N=10,r=0.92,r=0.632,r r拒绝原假设,则认为两者存在显著的线性相关。第31页,共63页,编辑于2022年,星期五第十章第十章 相关与回归分析相关与回归分析第三节第三节第三节第三节 回归分析回归分析回归分析回归分析一、回归分析概述(一)概念1、线性相关分析:计算线性相关系数 r 确定两变量之间的相关方向与密切程度。不足无法表明两变量之间的因果关系因果关系因果关系因果关系 无法从一个或几个变量(xi)的变化来推测另一个变量(y)的变化情况。10名用餐顾客消费金额与所付小费数据如下:账单X33.550.763.678.587.998.8107.3 102.3120.7 140.6小费Y5.55129.48.1171615.418.622.5 r=0.92第32页,共63页,编辑于2022年,星期五第十章第十章 相关与回归分析相关与回归分析2、回归分析回归分析:通过一个(些)变量的变化解释另一变量的变化 y=a+bx、y=a+b1x1+bx2、y=0+1x1+2x2+nxn 回归回归 英国生物学家 F Galton 首次提出。父辈身高 子辈身高 x y y=f(x)+人类的平均身高。(二)回归分析的种类1、按自变量的多少分(1)简单(一元)回归简单(一元)回归:自变量只有一个。例 y=a+bx 一元回归方程(2)复(多元)回归复(多元)回归:自变量为2个或2个以上。例 y=0+1x1+2x2+nxn第33页,共63页,编辑于2022年,星期五第十章第十章 相关与回归分析相关与回归分析2、按回归方程式的特征分(1)线性回归线性回归:因变量为自变量的线性函数。例 y=a+bx 一元线性回归方程一元线性回归方程(2)非线性回归非线性回归:因变量为自变量的非线性函数。例 第34页,共63页,编辑于2022年,星期五第十章第十章 相关与回归分析相关与回归分析(三)回归分析的步骤1、确定自变量和因变量确定自变量和因变量;例粮食产量(y)施肥量(x);消费支出(y)国民收入(x);火灾损失额(y)火灾发生地与最近一个消防站之间的距离(x)。2、确定样本回归方程确定样本回归方程;3、统计检验统计检验;4、预测或控制预测或控制。例 消费与收入的回归方程:y=a+bx=200+0.15x 已知 x确定y:估计或预测 已知y确定x:控制第35页,共63页,编辑于2022年,星期五第十章第十章 相关与回归分析相关与回归分析二、一元线性回归方程的拟合(一)总体回归方程总体回归方程第36页,共63页,编辑于2022年,星期五第十章第十章 相关与回归分析相关与回归分析图示第37页,共63页,编辑于2022年,星期五第十章第十章 相关与回归分析相关与回归分析假定所有所有Y分布的均值都正好在一条直线上分布的均值都正好在一条直线上。第38页,共63页,编辑于2022年,星期五第十章第十章 相关与回归分析相关与回归分析 Yi/Xi=条件均值+i=+Xi+i第39页,共63页,编辑于2022年,星期五第十章第十章 相关与回归分析相关与回归分析拟合思想抽样 N n,第40页,共63页,编辑于2022年,星期五第十章第十章 相关与回归分析相关与回归分析(二)样本回归方程的拟合样本回归方程的拟合 从总体中随机取样,获取一组样本观察值样本观察值。第41页,共63页,编辑于2022年,星期五第十章第十章 相关与回归分析相关与回归分析图示第42页,共63页,编辑于2022年,星期五第十章第十章 相关与回归分析相关与回归分析步骤:1、利用样本数据拟合样本回归直线,尽量减少误差;2、检验样本回归直线对总体回归直线的代表程度。第43页,共63页,编辑于2022年,星期五第十章第十章 相关与回归分析相关与回归分析(三)样本回归方程的拟合方法1、绝对值拟合法绝对值拟合法2、最小二乘法最小二乘法(OLS法)基本思路:使残差平方和最小的直线“最优直线”。第44页,共63页,编辑于2022年,星期五第十章第十章 相关与回归分析相关与回归分析 总可以设法找到一对a、b的取值,使Q为最小值。第45页,共63页,编辑于2022年,星期五第十章第十章 相关与回归分析相关与回归分析将a代入(2)式得第46页,共63页,编辑于2022年,星期五第十章第十章 相关与回归分析相关与回归分析简捷计算式第47页,共63页,编辑于2022年,星期五第十章第十章 相关与回归分析相关与回归分析相关系数相关系数r与回归系数与回归系数b之间的关系之间的关系(1)两者是同向的两者是同向的;(2)r反映变量的相关方向与密切程度反映变量的相关方向与密切程度;b反映某一变量变动一个单位时另一变量的平均变动量反映某一变量变动一个单位时另一变量的平均变动量。第48页,共63页,编辑于2022年,星期五第十章第十章 相关与回归分析相关与回归分析例为研究用餐消费与小费支出的关系,随机抽取了10位用餐顾客,得样本数据如下:请请拟拟合合样样本本回回归归方方程程样本的相关系数r=0.92第49页,共63页,编辑于2022年,星期五第十章第十章 相关与回归分析相关与回归分析例为研究用餐消费与小费支出的关系,随机抽取了10位用餐顾客,得样本数据如下(用EXCEL软件生成的散点图)请请拟拟合合样样本本回回归归方方程程第50页,共63页,编辑于2022年,星期五第十章第十章 相关与回归分析相关与回归分析解:通过散点图可近似看出收入与食品支出之间呈线性关系,故设两者有关系经济意义:用餐消费每增加经济意义:用餐消费每增加100100元,小费支出平均增加元,小费支出平均增加16.616.6元。元。第51页,共63页,编辑于2022年,星期五第十章第十章 相关与回归分析相关与回归分析三、回归方程的方差分析(一)总离差平方和的分解第52页,共63页,编辑于2022年,星期五第十章第十章 相关与回归分析相关与回归分析由:第53页,共63页,编辑于2022年,星期五第十章第十章 相关与回归分析相关与回归分析离差分析第54页,共63页,编辑于2022年,星期五第十章第十章 相关与回归分析相关与回归分析(二)判定系数判定系数第55页,共63页,编辑于2022年,星期五第十章第十章 相关与回归分析相关与回归分析 判定系数的作用判定系数的作用 第56页,共63页,编辑于2022年,星期五第十章第十章 相关与回归分析相关与回归分析判定系数判定系数r2与相关系数与相关系数r的关系的关系第57页,共63页,编辑于2022年,星期五第十章第十章 相关与回归分析相关与回归分析(三)估计标准误估计标准误1、定义:观察值与回归值之间的平均误差。2、公式第58页,共63页,编辑于2022年,星期五第十章第十章 相关与回归分析相关与回归分析图示第59页,共63页,编辑于2022年,星期五第十章第十章 相关与回归分析相关与回归分析(四)方差法相关系数方差法相关系数第60页,共63页,编辑于2022年,星期五第十章第十章 相关与回归分析相关与回归分析例已知下列资料,试计算判定系数与估计标准误。第61页,共63页,编辑于2022年,星期五第十章第十章 相关与回归分析相关与回归分析例已知下列资料,试计算判定系数与估计标准误。答:观察值与回归值之间的平均离差为答:观察值与回归值之间的平均离差为0.730.73,总离差中的总离差中的88.03%88.03%是是因为因为x x的变动所引起的的变动所引起的。第62页,共63页,编辑于2022年,星期五第十章第十章 相关与回归分析相关与回归分析第三节第三节 多元线性回归分析多元线性回归分析一、多元线性回归模型一、多元线性回归模型多元线性回归模型:是指在线性相关的条件下,研究2个或2个以上自变量与因变量之间的数量关系。其模型为:y=0+1X1 2X2+nXn+ei二、多元线性回归模型参数的估计:最小平方法最小平方法。求解回归系数的估计值,通常用统计软件。其方程用矩阵表示为:第63页,共63页,编辑于2022年,星期五