统计学课件 第8章 相关与回归分析-新.ppt
《统计学课件 第8章 相关与回归分析-新.ppt》由会员分享,可在线阅读,更多相关《统计学课件 第8章 相关与回归分析-新.ppt(72页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、第第 8章章 相关与回归分析相关与回归分析8.1 变量间关系的度量变量间关系的度量 8.2 一元线性回归一元线性回归8.3 多元线性回归多元线性回归2010年学习目标学习目标l相关关系的分析相关关系的分析l参数的最小二乘估计参数的最小二乘估计l回归直线的拟合优度回归直线的拟合优度l用用 Excel 进行回归进行回归2010年子代与父代一样吗?子代与父代一样吗?GaltonGalton被被被被誉誉誉誉为为为为现现现现代代代代回回回回归归归归和和和和相相相相关关关关技技技技术术术术的的的的创创创创始始始始人人人人。18751875年年年年,GaltonGalton利利利利用用用用豌豌豌豌豆豆豆豆实
2、实实实验验验验来来来来确确确确定定定定尺尺尺尺寸寸寸寸的的的的遗遗遗遗传传传传规规规规律律律律。他他他他挑挑挑挑选选选选了了了了7 7组组组组不不不不同同同同尺尺尺尺寸寸寸寸的的的的豌豌豌豌豆豆豆豆,并并并并说说说说服服服服他他他他在在在在英英英英国国国国不不不不同同同同地地地地区区区区的的的的朋朋朋朋友友友友每每每每一一一一组组组组种种种种植植植植1010粒粒粒粒种种种种子子子子,最最最最后后后后把把把把原原原原始始始始的的的的豌豌豌豌豆豆豆豆种种种种子子子子(父父父父代代代代)与与与与新新新新长长长长的的的的豌豌豌豌豆种子豆种子豆种子豆种子(子代子代子代子代)进行尺寸比较进行尺寸比较进行尺
3、寸比较进行尺寸比较当当当当结结结结果果果果被被被被绘绘绘绘制制制制出出出出来来来来之之之之后后后后,他他他他发发发发现现现现并并并并非非非非每每每每一一一一个个个个子子子子代代代代都都都都与与与与父父父父代代代代一一一一样样样样,不不不不同同同同的的的的是是是是,尺尺尺尺寸寸寸寸小小小小的的的的豌豌豌豌豆豆豆豆会会会会得得得得到到到到更更更更大大大大的的的的子子子子代代代代,而而而而尺尺尺尺寸寸寸寸大大大大的的的的豌豌豌豌豆豆豆豆却却却却得得得得到到到到较较较较小小小小的的的的子子子子代代代代。GaltonGalton把把把把这这这这一一一一现现现现象象象象叫叫叫叫做做做做“返返返返祖祖祖祖”
4、(趋趋趋趋向向向向于于于于祖祖祖祖先先先先的的的的某某某某种种种种平平平平均均均均类类类类型型型型),后后后后来来来来又又又又称称称称之之之之为为为为“向向向向平平平平均均均均回回回回归归归归”。一一一一个个个个总总总总体体体体中中中中在在在在某某某某一一一一时时时时期期期期具具具具有有有有某某某某一一一一极极极极端端端端特特特特征征征征(低低低低于于于于或或或或高高高高于于于于总总总总体体体体均均均均值值值值)的的的的个个个个体体体体在在在在未未未未来来来来的的的的某某某某一一一一时时时时期期期期将将将将减减减减弱弱弱弱它它它它的的的的极极极极端端端端性性性性(或或或或者者者者是是是是单单单
5、单个个个个个个个个体体体体或或或或者者者者是是是是整整整整个个个个子子子子代代代代),这这这这一一一一趋趋趋趋势势势势现现现现在在在在被被被被称称称称作作作作“回回回回归归归归效效效效应应应应”。人人人人们们们们发发发发现现现现它它它它的的的的应应应应用用用用很很很很广广广广,而而而而不不不不仅仅仅仅限限限限于于于于从一代到下一代豌豆大小问题从一代到下一代豌豆大小问题从一代到下一代豌豆大小问题从一代到下一代豌豆大小问题2010年子代与父代一样吗?子代与父代一样吗?正正正正如如如如GaltonGalton进进进进一一一一步步步步发发发发现现现现的的的的那那那那样样样样,平平平平均均均均来来来来说
6、说说说,非非非非常常常常矮矮矮矮小小小小的的的的父父父父辈辈辈辈倾倾倾倾向向向向于于于于有有有有偏偏偏偏高高高高的的的的子子子子代代代代;而而而而非非非非常常常常高高高高大大大大的的的的父父父父辈辈辈辈则则则则倾倾倾倾向向向向于于于于有有有有偏偏偏偏矮矮矮矮的的的的子子子子代代代代。在在在在第第第第一一一一次次次次考考考考试试试试中中中中成成成成绩绩绩绩最最最最差差差差的的的的那那那那些些些些学学学学生生生生在在在在第第第第二二二二次次次次考考考考试试试试中中中中倾倾倾倾向向向向于于于于有有有有更更更更好好好好的的的的成成成成绩绩绩绩(比比比比较较较较接接接接近近近近所所所所有有有有学学学学生
7、生生生的的的的平平平平均均均均成成成成绩绩绩绩),而而而而第第第第一一一一次次次次考考考考试试试试中中中中成成成成绩绩绩绩最最最最好好好好的的的的那那那那些些些些学学学学生生生生在在在在第第第第二二二二次次次次考考考考试试试试中中中中则则则则倾倾倾倾向向向向于于于于有有有有较较较较差差差差的的的的成成成成绩绩绩绩(同同同同样样样样比比比比较较较较接接接接近近近近所所所所有有有有学学学学生生生生的的的的平平平平均均均均成成成成绩绩绩绩)。同同同同样样样样,平平平平均均均均来来来来说说说说,第第第第一一一一年年年年利利利利润润润润最最最最低低低低的的的的公公公公司司司司第第第第二二二二年年年年不不
8、不不会会会会最最最最差差差差,而第一年利润最高的公司第二年则不会是最好的而第一年利润最高的公司第二年则不会是最好的而第一年利润最高的公司第二年则不会是最好的而第一年利润最高的公司第二年则不会是最好的如如如如果果果果把把把把父父父父代代代代和和和和子子子子代代代代看看看看作作作作两两两两个个个个变变变变量量量量,找找找找出出出出这这这这两两两两个个个个变变变变量量量量的的的的关关关关系系系系,并并并并根根根根据据据据这这这这种种种种关关关关系系系系建建建建立立立立适适适适当当当当的的的的数数数数学学学学模模模模型型型型,就就就就可可可可以以以以根根根根据据据据父父父父代代代代的的的的数数数数值值
9、值值预预预预测测测测子子子子代代代代的的的的取取取取值值值值,这这这这就就就就是是是是经经经经典典典典的的的的回回回回归归归归方方方方法法法法要要要要解解解解决决决决的的的的问问问问题。学完本章的内容你会对回归问题有更深入的理解题。学完本章的内容你会对回归问题有更深入的理解题。学完本章的内容你会对回归问题有更深入的理解题。学完本章的内容你会对回归问题有更深入的理解 2010年回归分析研究什么?回归分析研究什么?l l研研研研究究究究某某某某些些些些实实实实际际际际问问问问题题题题时时时时往往往往往往往往涉涉涉涉及及及及到到到到多多多多个个个个变变变变量量量量。在在在在这这这这些些些些变变变变量
10、量量量中中中中,有有有有一一一一个个个个变变变变量量量量是是是是研研研研究究究究中中中中特特特特别别别别关关关关注注注注的的的的,称称称称为为为为因因因因变变变变量量量量,而而而而其他变量则看成是影响这一变量的因素,称为自变量其他变量则看成是影响这一变量的因素,称为自变量其他变量则看成是影响这一变量的因素,称为自变量其他变量则看成是影响这一变量的因素,称为自变量l l假假假假定定定定因因因因变变变变量量量量与与与与自自自自变变变变量量量量之之之之间间间间有有有有某某某某种种种种关关关关系系系系,并并并并把把把把这这这这种种种种关关关关系系系系用用用用适适适适当当当当的的的的数数数数学学学学模模
11、模模型型型型表表表表达达达达出出出出来来来来,那那那那么么么么,就就就就可可可可以以以以利利利利用用用用这这这这一一一一模模模模型型型型根根根根据据据据给给给给定定定定的的的的自自自自变变变变量量量量来来来来预预预预测测测测因因因因变变变变量量量量,这这这这就就就就是是是是回回回回归归归归要要要要解解解解决决决决的的的的问题问题问题问题l l在在在在回回回回归归归归分分分分析析析析中中中中,只只只只涉涉涉涉及及及及一一一一个个个个自自自自变变变变量量量量时时时时称称称称为为为为一一一一元元元元回回回回归归归归,涉涉涉涉及及及及多多多多个个个个自自自自变变变变量量量量时时时时则则则则称称称称为为
12、为为多多多多元元元元回回回回归归归归。如如如如果果果果因因因因变变变变量量量量与与与与自自自自变变变变量量量量之之之之间间间间是是是是线线线线性性性性关关关关系系系系,则则则则称称称称为为为为线线线线性性性性回回回回归归归归(linear(linear regression)regression);如如如如果果果果因因因因变变变变量量量量与与与与自自自自变变变变量量量量之之之之间间间间是是是是非非非非线线线线性性性性关关关关系系系系则则则则称称称称为为为为非非非非线线线线性性性性回归回归回归回归(nonlinear regression)(nonlinear regression)2010年
13、8.1.1 变量间的关系变量间的关系 8.1.2 相关关系的描述与测度相关关系的描述与测度 8.1.3 相关系数的显著性检验相关系数的显著性检验8.1 变量间关系的度量变量间关系的度量2010年 x xy y函数关系函数关系1.是一一是一一对应的确定关系对应的确定关系2.设设有有两两个个变变量量 x x 和和 y y,变变量量 y y 随随变变量量 x x 一一起起变变化化,并并完完全全依依赖赖于于 x x ,当当变变量量 x x 取取某某个个数数值值时时,y y 依依确确定定的的关关系系取取相相应应的的值值,则则称称 y y 是是 x x 的的函函数数,记记为为 y y =f f(x x),
14、其其中中 x x 称称为为自自变变量量,y y 称称为为因因变变量量3.各各观测点落在一条线上观测点落在一条线上 8.1.1 变量间的关系变量间的关系2010年变量间的关系变量间的关系(函数关系)(函数关系)函数关系的例子某某种种商商品品的的销销售售额额(y y)与与销销售售量量(x x)之之间间的的关系可表示为关系可表示为 y y=p p x x(p p 为单价为单价)圆圆的的面面积积(S)(S)与与半半径径之之间间的的关关系系可可表表示示为为S S=R R2 2 企企业业的的原原材材料料消消耗耗额额(y y)与与产产量量(x x1 1)、单单位位产产量量消消耗耗(x x2 2)、原原材材料
15、料价价格格(x x3 3)之之间间的的关关系系可表示为可表示为y y=x x1 1 x x2 2 x x3 3 2010年相关关系相关关系(几个例子几个例子)l l子女的身高与其父母身高的关系子女的身高与其父母身高的关系子女的身高与其父母身高的关系子女的身高与其父母身高的关系uu从从遗遗传传学学角角度度看看,父父母母身身高高较较高高时时,其其子子女女的的身身高高一一般般也也比比较较高高。但但实实际际情情况况并并不不完完全全是是这这样样,因因为为子子女女的的身身高高并并不不完完全全是是由由父父母母身高一个因素所决定的,还有其他许多因素的影响身高一个因素所决定的,还有其他许多因素的影响l l一个人
16、的收入水平同他受教育程度的关系一个人的收入水平同他受教育程度的关系一个人的收入水平同他受教育程度的关系一个人的收入水平同他受教育程度的关系uu收收入入水水平平相相同同的的人人,他他们们受受教教育育的的程程度度也也不不可可能能不不同同,而而受受教教育育程程度度相相同同的的人人,他他们们的的收收入入水水平平也也往往往往不不同同。因因为为收收入入水水平平虽虽然然与与受受教教育育程程度度有有关关系系,但但它它并并不不是是决决定定收收入入的的惟惟一一因因素素,还还有有职职业、工作年限等诸多因素的影响业、工作年限等诸多因素的影响l l农作物的单位面积产量与降雨量之间的关系农作物的单位面积产量与降雨量之间的
17、关系农作物的单位面积产量与降雨量之间的关系农作物的单位面积产量与降雨量之间的关系uu在在一一定定条条件件下下,降降雨雨量量越越多多,单单位位面面积积产产量量就就越越高高。但但产产量量并并不不是是由由降降雨雨量量一一个个因因素素决决定定的的,还还有有施施肥肥量量、温温度度、管管理理水水平平等等其其他许多因素的影响他许多因素的影响l l商品的消费量商品的消费量商品的消费量商品的消费量(y)(y)与居民收入与居民收入与居民收入与居民收入(x)(x)之间的关系之间的关系之间的关系之间的关系l l商品销售额商品销售额商品销售额商品销售额(y)(y)与广告费支出与广告费支出与广告费支出与广告费支出(x)(
18、x)之间的关系之间的关系之间的关系之间的关系2010年相关关系相关关系(correlation)1.一一一一个个个个变变变变量量量量的的的的取取取取值值值值不不不不能能能能由由由由另另另另一个变量唯一确定一个变量唯一确定一个变量唯一确定一个变量唯一确定2.对对对对大大大大量量量量的的的的数数数数据据据据观观观观察察察察研研研研究究究究,就就就就会会会会发发发发现现现现许许许许多多多多变变变变量量量量之之之之间间间间存存存存在这一定的客观规律。在这一定的客观规律。在这一定的客观规律。在这一定的客观规律。3.当当当当变变变变量量量量 x x 取取取取某某某某个个个个值值值值时时时时,变变变变量量量
19、量 y y 的的的的取取取取值值值值对对对对应应应应着着着着一一一一个个个个分分分分布布布布4.各观测各观测各观测各观测点分布在直线周围点分布在直线周围点分布在直线周围点分布在直线周围 y y x x 2010年 相关分析就是对两个变量之间线性关系的描述与度量,解决的主要问题:pp变量之间是否存在关系?变量之间是否存在关系?pp如果存在关系,是什么样的关系?如果存在关系,是什么样的关系?pp变量之间的关系强度如何?变量之间的关系强度如何?pp样本所反映的变量之间的关系能否代表总体变量只见到关样本所反映的变量之间的关系能否代表总体变量只见到关系?系?2010年 完全负线性相关完全负线性相关完全负
20、线性相关完全负线性相关完全负线性相关完全负线性相关完全正线性相关完全正线性相关完全正线性相关完全正线性相关完全正线性相关完全正线性相关 散点图散点图(scatter diagram)不相关不相关不相关不相关不相关不相关 负线性相关负线性相关负线性相关负线性相关负线性相关负线性相关 正线性相关正线性相关正线性相关正线性相关正线性相关正线性相关 非线性相关非线性相关非线性相关非线性相关非线性相关非线性相关8.1.2 相关关系的描述与测度相关关系的描述与测度2010年相关关系的类型相关关系的类型相关关系相关关系非非线性相关线性相关线性相关线性相关正正相相关关正正相相关关负负相相关关负负相相关关完全相
21、关完全相关不不相关相关2010年用散点图描述变量间的关系用散点图描述变量间的关系(例题分析例题分析)【例例例例8.18.1】一一一一家家家家大大大大型型型型商商商商业业业业银银银银行行行行在在在在多多多多个个个个地地地地区区区区设设设设有有有有分分分分行行行行,其其其其业业业业务务务务主主主主要要要要是是是是进进进进行行行行基基基基础础础础设设设设施施施施建建建建设设设设、国国国国家家家家重重重重点点点点项项项项目目目目建建建建设设设设、固固固固定定定定资资资资产产产产投投投投资资资资等等等等项项项项目目目目的的的的贷贷贷贷款款款款。近近近近年年年年来来来来,该该该该银银银银行行行行的的的的贷
22、贷贷贷款款款款额额额额平平平平稳稳稳稳增增增增长长长长,但但但但不不不不良良良良贷贷贷贷款款款款额额额额也也也也有有有有较较较较大大大大比比比比例例例例的的的的提提提提高高高高,这这这这给给给给银银银银行行行行业业业业务务务务的的的的发发发发展展展展带带带带来来来来较较较较大大大大压压压压力力力力。为为为为弄弄弄弄清清清清楚楚楚楚不不不不良良良良贷贷贷贷款款款款形形形形成成成成的的的的原原原原因因因因,希希希希望望望望利利利利用用用用银银银银行行行行业业业业务务务务的的的的有有有有关关关关数数数数据据据据做做做做些些些些定定定定量量量量分分分分析析析析,以以以以便便便便找找找找出出出出控控控控
23、制制制制不不不不良良良良贷贷贷贷款款款款的的的的办办办办法法法法。下下下下面面面面是是是是该该该该银银银银行行行行所所所所属属属属的的的的2525家家家家分分分分行行行行20022002年的有关业务数据年的有关业务数据年的有关业务数据年的有关业务数据 绘制散点图绘制散点图绘制散点图绘制散点图2010年散点图散点图(例题分析例题分析)2010年相关系数相关系数(correlation coefficient)1.度量变量之间线性关系强度的一个统计量度量变量之间线性关系强度的一个统计量n n若若相相关关系系数数是是根根据据总总体体全全部部数数据据计计算算的的,称称为为总总体相关系数,记为体相关系数
24、,记为 n n若若是是根根据据样样本本数数据据计计算算的的,则则称称为为样样本本相相关关系系数数,简称为相关系数,记为简称为相关系数,记为 r rl l也也称称为为PearsonPearson相相关关系系数数 (Pearsons(Pearsons correlation correlation coefficient)coefficient)2010年样本相关系数样本相关系数样本相关系数的计算公式或或化简为化简为按上述计算公式计算的相关系数也称为按上述计算公式计算的相关系数也称为线性相关系数线性相关系数或或PearsonPearson系数系数计算相关系数计算相关系数计算相关系数计算相关系数20
25、10年相关系数相关系数(例题分析例题分析)2010年相关系数的性质相关系数的性质性质性质1:r 的取值范围是-1,1n n|r r|=|=1 1,为完全相关为完全相关l lr r=1 1,为,为完全正相关完全正相关l lr r=-1-1,为完全负正相关为完全负正相关n nr r=0=0,不存在不存在线性线性线性线性相关相关关系关系n n-1-1 r r 0 0,为负相关为负相关n n0 0 r r 1 1,为正相关为正相关n n|r r|越越趋趋于于1 1表表示示关关系系越越强强;|r r|越越趋趋于于0 0表表示示关关系越弱系越弱2010年相关关系的性质相关关系的性质-1.0+1.00-0.
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 统计学课件 第8章 相关与回归分析-新 统计学 课件 相关 回归 分析
限制150内