第10章 相关与回归分析.ppt
《第10章 相关与回归分析.ppt》由会员分享,可在线阅读,更多相关《第10章 相关与回归分析.ppt(96页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、第第1010章章 相关与回归分析相关与回归分析统计学1/4/20231统计学统计学STATISTICS 餐饮消费额与小费数据如下:单位:美元餐饮消费额与小费数据如下:单位:美元消费消费 33.5 50.7 87.9 98.8 63.6 107.3 120.7 78.5 102.3 140.6 小费小费 5.55.5 5.05.0 8.18.1 1717 1212 1616 18.618.6 9.49.4 15.415.4 22.422.4 实例实例 西方国家餐饮等服务行业有一条不成文的规定,即发生餐饮等服务项目消费时,必须给服务员一定数额小费,许多人都听说小费,但消费者应该留下多少小费?有人说
2、应该是账单的16%左右,是否真的如此呢?某机构经过调查搜集到以下数据,通过对这几组数据的分析与观察,他们发现了两者之间的数量关系。1/4/20232统计学统计学STATISTICS1.1.是否有足够的证据断定:在是否有足够的证据断定:在账单与小费数额之间存在账单与小费数额之间存在某种联系?某种联系?2.2.如果存在某种联系,怎样使如果存在某种联系,怎样使用这种联系来确定应该留用这种联系来确定应该留下多少小费?下多少小费?1/4/20233统计学统计学STATISTICS第第1010章章 相关与回归分析相关与回归分析一、简单线性相关分析一、简单线性相关分析二、简单线性回归分析二、简单线性回归分析
3、三、三、ExcelExcel在简单线性相关与回归在简单线性相关与回归分析中的应用分析中的应用1/4/20234统计学统计学STATISTICS本章学习目标本章学习目标1.1.熟悉相关关系的概念、特点、种类和度量熟悉相关关系的概念、特点、种类和度量2.2.掌握简单线性回归方程的建立方法掌握简单线性回归方程的建立方法3.3.理解简单线性回归方程的统计检验理解简单线性回归方程的统计检验拟拟合优度检验、变量显著性检验和方程显著性合优度检验、变量显著性检验和方程显著性检验检验4.4.掌握利用回归方程进行预测的方法掌握利用回归方程进行预测的方法5.5.利利用用 Excel Excel 进行相关与回归分析进
4、行相关与回归分析1/4/20235统计学统计学STATISTICS一、简单线性相关分析一、简单线性相关分析(一)变量间的关系(一)变量间的关系(二)相关关系的描述与测度(二)相关关系的描述与测度1/4/20236统计学统计学STATISTICS相关分析要解决的问题相关分析要解决的问题变量之间是否存在关系?如果存在关系,它们之间是什么样的关系?变量之间的关系强度如何?样本所反映的变量之间的关系能否代表总体变量之间的关系?为为解解决决这这些些问问题题,在在进进行行相相关关分分析析时时,对对总总体体有有以下两个主要假定以下两个主要假定两个变量之间是线性关系两个变量都是随机变量相关分析及其假定相关分析
5、及其假定1/4/20237统计学统计学STATISTICS 函数关系函数关系相关关系相关关系(一)变量的关系(一)变量的关系1/4/20238统计学统计学STATISTICS1.1.是一一对应的确定关系是一一对应的确定关系2.2.设设有有两两个个变变量量 x x 和和 y y,变变量量 y y 随随变变量量 x x 一一起起变变化化,并并完完全全依依赖赖于于 x x,当当变变量量 x x 取取某某个个数数值值时时,y y 依依确确定定的的关关系系取取相相应应的的值值,则则称称 y y 是是 x x 的的函函数数,记记为为 y=f(x),其其中中 x x 称称为为自自变变量量,y y 称称为为因
6、因变量变量3.3.各观测点落在一条线上各观测点落在一条线上 x xy y函数关系函数关系1/4/20239统计学统计学STATISTICS 函数关系的例子函数关系的例子某种商品的销售额(y)与销售量(x)之间的关系可表示为 y y=pxpx (p 为单价)圆的面积(S)与半径之间的关系可表示为S S=R R2 2 企业的原材料消耗额(y)与产量(x1)、单位产量消耗(x2)、原材料价格(x3)之间的关系可表示为y y=x x1 1 x x2 2 x x3 3 1/4/202310统计学统计学STATISTICS1.1.变变量量间间关关系系不不能能用用函函数数关关系精确表达系精确表达2.2.一一
7、个个变变量量的的取取值值不不能能由由另另一个变量唯一确定一个变量唯一确定3.3.当当变变量量 x x 取取某某个个值值时时,变变量量 y y 的的取取值值可可能能有有几几个个4.4.各观测点分布在直线周围各观测点分布在直线周围 xy 相关关系相关关系1/4/202311统计学统计学STATISTICS 相关关系的例子相关关系的例子父亲身高(y)与子女身高(x)之间的关系收入水平(y)与受教育程度(x)之间的关系粮食亩产量(y)与施肥量(x1)、降雨量(x2)、温度(x3)之间的关系商品的消费量(y)与居民收入(x)之间的关系商品销售额(y)与广告费支出(x)之间的关系1/4/202312统计学
8、统计学STATISTICS相关关系与函数关系的区别和联系相关关系与函数关系的区别和联系 联系:联系:具有函数关系的某些现象也会因观察测量具有函数关系的某些现象也会因观察测量的误差,而使得到的数据表现为非确定性的误差,而使得到的数据表现为非确定性的相关关系的相关关系对相关关系作进一步的观察,不难发现它对相关关系作进一步的观察,不难发现它们也是有规律可循的,可以借助函数关系们也是有规律可循的,可以借助函数关系的数学表达式来近似地描述的数学表达式来近似地描述 区别:区别:函数关系是变量值之间一种确定性的对应关函数关系是变量值之间一种确定性的对应关系,而相关关系则是一种非确定性的依存关系系,而相关关系
9、则是一种非确定性的依存关系 1/4/202313统计学统计学STATISTICS从变量相关的程度看从变量相关的程度看 完全相关(完全相关(B B)不完全相关(不完全相关(A A)不相关不相关(C)C)(二)相关关系的描述与测度(二)相关关系的描述与测度1.1.相关关系的类型相关关系的类型从变量相关关系变化的从变量相关关系变化的方向看看 正相关变量同方向变化变量同方向变化 同增同减同增同减 (A)(A)负相关变量反方向变化变量反方向变化 一增一减一增一减(B)(B)ABC1/4/202314统计学统计学STATISTICS从涉及的变量数量看从涉及的变量数量看 单相关:单相关:是两个变量之间存在的
10、相关关系是两个变量之间存在的相关关系 复复相相关关:三三个个或或三三个个以以上上变变量量之之间间存存在在的的相相关关系关关系从变量相关关系的表现形式看从变量相关关系的表现形式看 线性相关线性相关散布图接近一条直线散布图接近一条直线 非线性相关非线性相关散布图接近一条曲线散布图接近一条曲线1/4/202315统计学统计学STATISTICS定性分析法定性分析法是依据研究者的理论知识和实践经验,对客观现象之间是否存在相关关系,以及何种关系作出判断定量分析法定量分析法在定性分析的基础上,通过编制相关表、绘制相关图、计算相关系数与判定系数等方法,来判断现象之间相关的方向、形态及密切程度2.2.相关关系
11、的描述与测度方法相关关系的描述与测度方法1/4/202316统计学统计学STATISTICS 将一变量的若干变量值按从小到大的顺序排列,并将另一变量或多个相关变量的值与之对应排列形成的统计表。相关表相关表财务软件代理商的广告费与月平均销售额相关表财务软件代理商的广告费与月平均销售额相关表年广告费投入(万元)年广告费投入(万元)x月均销售额(万元)月均销售额(万元)y12.515.323.226.433.534.439.445.255.460.915.828.735.037.840.145.249.050.557.268.91/4/202317统计学统计学STATISTICS某银行所属的某银行所
12、属的2525家分行的有关业务数据家分行的有关业务数据 1/4/202318统计学统计学STATISTICS 将两个变量间相对应的变量值用坐标点的形式描绘将两个变量间相对应的变量值用坐标点的形式描绘出来,用以表明相关点分布状况的图形,出来,用以表明相关点分布状况的图形,又称散点图。又称散点图。相关图相关图1/4/202319统计学统计学STATISTICS1/4/202320统计学统计学STATISTICS 不相关不相关不相关不相关不相关不相关 负线性相关负线性相关负线性相关负线性相关 正线性相关正线性相关正线性相关正线性相关 非线性相关非线性相关非线性相关非线性相关 完全负线性相关完全负线性相
13、关完全负线性相关完全负线性相关完全正线性相关完全正线性相关完全正线性相关完全正线性相关 常见的散点图常见的散点图1/4/202321统计学统计学STATISTICS度量变量之间线性相关关系密切程度的指标度量变量之间线性相关关系密切程度的指标反反映映两两变变量量间间线线性性相相关关关关系系的的统统计计指指标标称称为为简简单单相相关关系系数数;反反映映多多元元线线性性相相关关关关系系的的统统计指标称为复相关系数。计指标称为复相关系数。若若相相关关系系数数是是根根据据总总体体全全部部数数据据计计算算的的,称称为总体相关系数,记为为总体相关系数,记为若若是是根根据据样样本本数数据据计计算算的的,则则称
14、称为为样样本本相相关关系数,记为系数,记为 r相关系数相关系数1/4/202322统计学统计学STATISTICS 总体相关系数总体相关系数 反映总体两个变量反映总体两个变量X X和和Y Y的线性相关程度的的线性相关程度的统计指标。其计算公式为:统计指标。其计算公式为:特点:特点:对于特定的总体来说,对于特定的总体来说,X X和和Y Y的数值是的数值是既定的,总体相关系数是客观存在的特定数既定的,总体相关系数是客观存在的特定数值,但通常是无法计算的。值,但通常是无法计算的。1/4/202323统计学统计学STATISTICS 样本相关系数样本相关系数 通过通过X X和和Y Y 的样本观测值的样
15、本观测值x x和和y y去估计的样本相关系去估计的样本相关系数。变量数。变量x x和和y y的样本相关系数通常用的样本相关系数通常用 表示表示 特点:特点:样本相关系数是根据从总体中抽取的随机样本的观测值计算出来的,是对总体相关系数的估计值,它是个随机变量。1/4/202324统计学统计学STATISTICS相关系数的取值及其意义相关系数的取值及其意义 r r 的取值范围是的取值范围是 -1,1-1,1|r r|=1|=1,为完全相关为完全相关r=1,为完全正相关r=-1,为完全负相关 r r=0=0,不存在线性相关关系(不相关)不存在线性相关关系(不相关)-1-1 r r00,为,为负相关负
16、相关 0 0 r r 1 1,为,为正相关正相关|r r|越越趋趋于于1 1表表示示关关系系越越密密切切;|r r|越越趋趋于于0 0表表示示关系越不密切关系越不密切1/4/202325统计学统计学STATISTICS-1.0+1.00-0.5+0.5完全负相关完全负相关无线性相关无线性相关完全正相关完全正相关负负相关程度增加相关程度增加r r正相关程度增加正相关程度增加-0.80.8+0.+0.8 8-0.30.3+0.3+0.31/4/202326统计学统计学STATISTICS相关系数的经验解释相关系数的经验解释|r r|0.80.8时时,可可视视为为两两个个变变量量之之间间高高度度相相
17、关关0.50.5|r r|0.8|0.8时,可视为中度相关时,可视为中度相关0.30.3|r r|0.5|0.5时,视为低度相关时,视为低度相关|r r|0.3|=7.5344t t0.0250.025(25-2)=2.0687(25-2)=2.0687,所所以以要要拒拒绝绝H H0 0,说说明明不不良良贷贷款款与与贷贷款款余余额额之之间间存存在在着着显显著著的的正正线性相关关系线性相关关系 1/4/202337统计学统计学STATISTICS各相关系数检验的统计量各相关系数检验的统计量1/4/202338统计学统计学STATISTICS二、简单线性回归分析二、简单线性回归分析(一)回归分析概
18、述(一)回归分析概述(二)简单线性回归模型(二)简单线性回归模型(三)参数的最小二乘估计(三)参数的最小二乘估计(四)回归直线的拟合程度(四)回归直线的拟合程度(五)回归系数的显著性检验(五)回归系数的显著性检验(六)利用回归方程进行估计和预测(六)利用回归方程进行估计和预测1/4/202339统计学统计学STATISTICS回归:退回回归:退回regression18771877年年 弗朗西斯弗朗西斯 高尔顿爵士高尔顿爵士 遗传学研究遗传学研究平均身高平均身高回归分析产生的历史回归分析产生的历史(一)回归分析概述(一)回归分析概述1/4/202340统计学统计学STATISTICS父亲们的身
19、高与儿子们的身高之间关系的研究父亲们的身高与儿子们的身高之间关系的研究 18891889年年F.GalltonF.Gallton和他的朋友和他的朋友K.PearsonK.Pearson收集了上千个家庭的身高、收集了上千个家庭的身高、臂长和腿长的记录臂长和腿长的记录 企图寻找出儿子们身高与父亲们企图寻找出儿子们身高与父亲们身高之间关系的具体表现形式身高之间关系的具体表现形式 下图是根据下图是根据10781078个家庭的调查所个家庭的调查所作的散点图作的散点图(略图)(略图)1/4/202341统计学统计学STATISTICS160165170175180185140150160170180190
20、200YX儿子们身高向着平均身高儿子们身高向着平均身高“回归回归”,以保持种族的稳定,以保持种族的稳定1/4/202342统计学统计学STATISTICS什么是回归分析?什么是回归分析?就是通过一个变量或一些变就是通过一个变量或一些变量的变化解释另一变量的变化。量的变化解释另一变量的变化。1/4/202343统计学统计学STATISTICS1.1.根据理论和对问题的分析判断,根据理论和对问题的分析判断,区分自区分自变量和因变量;变量和因变量;2.设法找出适合的数学方程式设法找出适合的数学方程式(即即 回归模回归模型型)描述变量间的关系描述变量间的关系 3.3.对回归模型进行统计检验;对回归模型
21、进行统计检验;4.4.统计检验通过后,利用回归模型,根据统计检验通过后,利用回归模型,根据解释变量去估计,预测因变量。解释变量去估计,预测因变量。回归分析的内容与步骤回归分析的内容与步骤1/4/202344统计学统计学STATISTICS回归模型的类型回归模型的类型1/4/202345统计学统计学STATISTICS2.2.简单线性回归模型可表示为简单线性回归模型可表示为Y 是X的线性函数(部分)加上误差项线性部分反映了由于 X 的变化而引起的 Y 的变化误差项 是随机变量反映了除 X 和 Y之间的线性关系之外的随机因素对 Y 的影响是不能由 X 和 Y 之间的线性关系所解释的变异性0和 1
22、称为回归模型的参数(二)简单线性回归模型(二)简单线性回归模型1.1.描述因变量描述因变量Y Y如何依赖于自变量如何依赖于自变量X X和误差项和误差项的的方程称为回归模型方程称为回归模型1/4/202346统计学统计学STATISTICS简单线性回归模型的基本假定简单线性回归模型的基本假定 1.1.线线性性假假设设。误差项是一个期望值为0的随机变量,即E()=0。对于一个给定的 X 值,Y 的期望值为2.2.同同方方差差假假设设。对于所有的 X 值,的方差2 都相同3.3.正正态态性性假假设设。误差项是一个服从正态分布的随机变量,且相互独立。即服从N(0,2)4.独独立立性性假假设设。对于一个
23、特定的 X 值,它所对应的与其他 X 值所对应的不相关;对于一个特定的 X 值,它所对应的 Y 值与其他 X 所对应的 Y 值也不相关1/4/202347统计学统计学STATISTICS1/4/202348统计学统计学STATISTICS1.1.描描述述 Y Y的的平平均均值值或或期期望望值值如如何何依依赖赖于于X X 的方程称为回归方程的方程称为回归方程2.2.简单线性回归方程的形式如下:简单线性回归方程的形式如下:方程的图示是一条直线,也称为直线回归方程方程的图示是一条直线,也称为直线回归方程0 0是是回回归归直直线线在在 Y Y 轴轴上上的的截截距距,是是当当 X X=0=0 时时Y Y
24、的期望值的期望值1 1是是直直线线的的斜斜率率,称称为为回回归归系系数数,表表示示当当X X每每变动一个单位时,变动一个单位时,Y Y 的平均变动值的平均变动值简单线性回归方程简单线性回归方程1/4/202349统计学统计学STATISTICS3.3.对于简单线性回归,估计的回归方程形式为对于简单线性回归,估计的回归方程形式为2.2.用用样样本本统统计计量量 和和 代代替替回回归归方方程程中中的的未未知知参数参数 和和 ,就得到了估计的回归方程,就得到了估计的回归方程1.1.总总体体回回归归参参数数 和和 是是未未知知的的,必必需需利利用用样样本本数数据去估计据去估计其其中中:是是估估计计的的
25、回回归归直直线线在在 y y 轴轴上上的的截截距距,是是直直线线的的斜斜率率,表表示示 x x 每每变变动动一一个个单单位位时时,y y 的平均变动值的平均变动值 估计的回归方程估计的回归方程1/4/202350统计学统计学STATISTICS1.1.使因变量的观察值与估计值之间的离差平方和达使因变量的观察值与估计值之间的离差平方和达到最小来求得到最小来求得 和和 的方法。即的方法。即2.2.用用最最小小二二乘乘法法拟拟合合的的直直线线来来代代表表x x与与y y之之间间的的关系与实际数据的误差比其他任何直线都小关系与实际数据的误差比其他任何直线都小参数的最小二乘估计参数的最小二乘估计1/4/
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 第10章 相关与回归分析 10 相关 回归 分析
限制150内