第7单元 相关与回归分析.ppt
《第7单元 相关与回归分析.ppt》由会员分享,可在线阅读,更多相关《第7单元 相关与回归分析.ppt(64页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、第第7 7单元单元 相关分析与回归分析相关分析与回归分析 本单元学习目标本单元学习目标 1 1、理解相关关系的概念与种类、理解相关关系的概念与种类相关关系相关关系概念概念种类种类2 2、掌握相关系数的理论及计算、掌握相关系数的理论及计算 相关系数相关系数计算计算 3 3、理解相关分析与回归分析特点、理解相关分析与回归分析特点相关分析相关分析回归分析回归分析特点特点4 4、掌握一元线性回归方程的确定方法、掌握一元线性回归方程的确定方法 及估计标准误差的计算及估计标准误差的计算计算计算线性回归方程线性回归方程估计标准误差估计标准误差5 5、准确、准确理解回归系数及估计标准误差的意义理解回归系数及估
2、计标准误差的意义 意义意义 回归系数回归系数估计标准误差估计标准误差 能力目标能力目标1.相关系数的测定与分析相关系数的测定与分析2.一元回归方程的建立与应用一元回归方程的建立与应用日常生活中有哪些相关现象?日常生活中有哪些相关现象?请同学们举例谈谈:请同学们举例谈谈:学习时间学习时间/学习成绩学习成绩 身高身高/体重体重 受教育程度受教育程度/工作后收入工作后收入预防疾病支出预防疾病支出/疾病的发病率疾病的发病率 联系与相互影响是普遍的现象联系与相互影响是普遍的现象受教受教育的育的水平水平工作工作后的后的收入收入预防预防疾病疾病支出支出疾病疾病的发的发病率病率身高与体重:身高与体重:一般一般
3、身高越高身高越高,则体重越重。则体重越重。一般一般身高越低身高越低,则体重越轻则体重越轻.确定性关系确定性关系非确定性关系非确定性关系例如:圆的周长与圆半径:例如:圆的周长与圆半径:圆周长圆周长=2=2 圆半径圆半径另外还有一种关系另外还有一种关系确定性关系确定性关系函数关系函数关系非确定性关系非确定性关系相关关系相关关系 表表7.1 20007.1 2000年我国部分省市人均年我国部分省市人均GDPGDP及人均消费水平原始资料及人均消费水平原始资料 单位:元单位:元地区地区北京北京辽宁辽宁上海上海江西江西河南河南贵州贵州陕西陕西人均人均GDPGDP2246022460112261122634
4、5473454748514851544454442662266245494549人均消费水平人均消费水平7326732644904490115461154623962396220822081608160820352035 表表7.2 20007.2 2000年我国部分省市人均年我国部分省市人均GDPGDP及人均消费水平相关表及人均消费水平相关表 单位:元单位:元地区地区贵州贵州陕西陕西江西江西河南河南辽宁辽宁北京北京上海上海人均人均GDPGDP26622662454945494851485154445444112261122622460224603454734547人均消费水平人均消费水平16
5、0816082035203523962396220822084490449073267326115461154623962396 2208 2208再如:再如:按人均按人均GDP排序排序结论:结论:(1)现象之间现象之间存在存在某种某种 内在的、数量上的内在的、数量上的关系关系;(2)这种这种内在的、数量上的内在的、数量上的关关系系却又是却又是不能确定不能确定的数量的数量关系关系。相相关关关关系系第七单元第七单元 相关分析相关分析重点内容网络图重点内容网络图 一:相关关系的含义一:相关关系的含义二二:相关关系的种类:相关关系的种类相关的意义和种类相关的意义和种类相关图表和相关系数相关图表和相关
6、系数相相关关分分析析一:相关关系的一般判断一:相关关系的一般判断二二:相关关系的测定:相关关系的测定相关系数相关系数四:估计标准误差四:估计标准误差回归分析回归分析一:回归分析的含义一:回归分析的含义二:回归分析与相关分析的关系二:回归分析与相关分析的关系三:简单线性回归方程的拟合三:简单线性回归方程的拟合三:相关关系分析的主要内容三:相关关系分析的主要内容相关的意义和种类相关的意义和种类 一、相关关系的含义一、相关关系的含义二、相关关系的种类二、相关关系的种类三、相关关系分析的主要内容三、相关关系分析的主要内容一、相关关系的含义一、相关关系的含义相关关系相关关系是指现象间的是指现象间的非非确
7、定性确定性的的数量上数量上的依存关系。的依存关系。两种关系两种关系 区区别别与与联联系系两两个个特特点点有数量依存有数量依存关系关系不不确定确定确定性确定性的的数量依存数量依存关系关系?函数关系函数关系y=2x+1区区别别:相关关系相关关系是是不不确定的确定的 函数关系函数关系是是确定的确定的 相关关系相关关系是是相关相关分析分析的的(研究研究)对对象象,函数关系函数关系是是相关相关分析分析的的工具工具。联联系:系:(一)按相关程度不同(一)按相关程度不同完全相关完全相关 不完全相关不完全相关 不相关不相关 完全相关完全相关不相关不相关不完全相关不完全相关二、相关关系的种类二、相关关系的种类(
8、二)按相关方向不同(二)按相关方向不同 正相关正相关负相关负相关正相关正相关负相关负相关(三)按相关的表现形式不同(三)按相关的表现形式不同 线性相关线性相关 非线性相关非线性相关 线性相关线性相关非线性相关非线性相关(四)按相关的变量多少不同(四)按相关的变量多少不同 单相关单相关复相关复相关两个变量两个变量之间的相关关系之间的相关关系三个或三个以上三个或三个以上变量的相关关系变量的相关关系 单相关单相关复相关复相关 完全相关完全相关不完全相关不完全相关 不相关不相关正相关正相关负相关负相关线性相关线性相关非线性相关非线性相关单相关单相关复相关复相关小结小结我们我们重点学习重点学习的的 相关
9、关系相关关系不完全相关不完全相关正相关正相关负相关负相关线性相关线性相关单相关单相关三、相关关系分析的主要内容三、相关关系分析的主要内容广义:广义:(1)确定确定相关关系的相关关系的数学表达式数学表达式 (通过建立(通过建立回归方程回归方程确定)确定)(2)确定因变量估计值的)确定因变量估计值的误差误差的程度的程度 (通过通过计算计算估计标准误差估计标准误差确定)确定)狭义:狭义:(1)判断判断现象之间现象之间是否是否存在相关关系存在相关关系(通过编制(通过编制相关表相关表和绘制和绘制相关图相关图确定)确定)(3)确定确定相关关系的相关关系的密切程度密切程度和和方向方向(通过计算(通过计算相关
10、系数相关系数确定)确定)(2)确定确定相关关系的相关关系的表现形式(表现形式(历史经验历史经验)相关图表和相关系数相关图表和相关系数一、相关关系的一般判断一、相关关系的一般判断二、相关关系的测定二、相关关系的测定相关系数相关系数一、相关关系的一般判断一、相关关系的一般判断(一)定性分析(一)定性分析(二)相关表(二)相关表(三)相关图(三)相关图(一)定性分析(一)定性分析在分析现象之间相关关系的具体数量之前,在分析现象之间相关关系的具体数量之前,先要对现象进行定性分析。先要对现象进行定性分析。若判定有数量关系,才进行下一步分析,若判定有数量关系,才进行下一步分析,否则,不再进行分析。否则,不
11、再进行分析。(二)相关表(二)相关表相关表相关表是一种反映变量之间相关关系的统计表。是一种反映变量之间相关关系的统计表。表表7.1 20007.1 2000年我国部分省市人均年我国部分省市人均GDPGDP及人均消费水平原始资料及人均消费水平原始资料 单位:元单位:元地区地区北京北京辽宁辽宁上海上海江西江西河南河南贵州贵州陕西陕西人均人均GDPGDP22460224601122611226345473454748514851544454442662266245494549人均消费水平人均消费水平732673264490449011546115462396239622082208160816082
12、0352035 表表7.2 20007.2 2000年我国部分省市人均年我国部分省市人均GDPGDP及人均消费水平相关表及人均消费水平相关表 单位:元单位:元地区地区贵州贵州陕西陕西江西江西河南河南辽宁辽宁北京北京上海上海人均人均GDPGDP26622662454945494851485154445444112261122622460224603454734547人均消费水平人均消费水平1608160820352035239623962208220844904490732673261154611546将其中一个变量将其中一个变量按其取值大小顺序排列按其取值大小顺序排列,同时同时将与其相关的另一
13、变量数值将与其相关的另一变量数值对应列出来对应列出来,便可形成便可形成简单简单相关表相关表。它它是是把把相相关关表表中中的的原原始始对对应应数数据据在在平平面面直直角角坐坐标标系系中用中用坐标点坐标点描绘出来。描绘出来。以以横轴横轴表示表示自变量自变量(dependent variable)(dependent variable),纵轴纵轴表示表示因变量因变量(independent variable)(independent variable),通通过过标标出出的的每每对对变变量量值值的的坐坐标标点点或或散散布布点点,观察其观察其分布状况分布状况。相关图:又称相关图:又称散点图散点图(三)相
14、关图(三)相关图 表表7.2 20007.2 2000年我国部分省市人均年我国部分省市人均GDPGDP及人均消费水平相关表及人均消费水平相关表 单位:元单位:元地区地区贵州贵州陕西陕西江西江西河南河南辽宁辽宁北京北京上海上海人均人均GDPGDP26622662454945494851485154445444112261122622460224603454734547人均消费水平人均消费水平1608160820352035239623962208220844904490732673261154611546散点图散点图二、相关关系的测定二、相关关系的测定相关系数相关系数相关系数的意义:相关系数的意
15、义:相关系数相关系数是在直线相关条件下,是在直线相关条件下,说说明明两两个个变变量量之之间间相相关关关关系系密密切切程程度度和和方向方向的统计分析的统计分析指标指标,通通常常用用r表表示示。其其表表现现形形式式为为相相对对数数,不不受受变量值变量值水平水平和和计量单位计量单位的影响。的影响。(一)相关系数的计算(一)相关系数的计算在在直直线线相相关关的的条条件件下下,相相关关系系数数的的定定义义公公式式是是通通过过自自变变量量和和因因变变量量的的各各个个离离差差的的乘乘积积来来表表明明相相关关关关系系的的密密切切程程度的,所以用这种方法计算的相关系数叫度的,所以用这种方法计算的相关系数叫积差法
16、积差法。不需要详细了解不需要详细了解计算公式为:计算公式为:需要需要知道知道计算公式简化为:计算公式简化为:需要需要掌握掌握列列表表计算计算?表表9.3 人均人均GDP与人均消费水平与人均消费水平相关系数计算表相关系数计算表 单位:元单位:元编号编号人均人均GDP人均消费水平人均消费水平1234567合计合计2662454948515444112262246034547857391608203523962208449073261154631609xyxyx2708624420693401235322012963713612602307650445160011934952091904918867
17、y225856644141225574081648752642016010053670276133310116224483461x y42804969257215116229961202035250404740164541960398879662651007421x2y2xyn解:根据表中资料得:解:根据表中资料得:-1r+1-1r+1 r r0 0正相关正相关负相关负相关r r0 0 r=+1r=+1 完全正完全正线性相关线性相关r=-1r=-1 完全负完全负 线性相关线性相关r=0r=0 完全无完全无线性相关线性相关0 0|r|r|0.30.3 微相关微相关 0.3|r|0.3|r|0.5
18、0.5 低度相关低度相关 0.5|r|0.5|r|0.80.8 显著相关显著相关 0.8|r|0.8|r|1 1 高度相关高度相关 取值范围取值范围 相关系数相关系数的的特点特点0.9981高度高度(正)(正)相关相关0.8868高度高度(正)(正)相关相关相关系数的特点相关系数的特点(坐标坐标)-1.0+1.00-0.5+0.5完全负线性相关完全负线性相关完全无线性相关完全无线性相关完全正线性相关完全正线性相关负负相关程度增加相关程度增加r正相关程度增加正相关程度增加相关系数相关系数的的绝对值绝对值很小,表明变量间很小,表明变量间没有没有关系?关系?相关关系相关关系等于等于因果关系因果关系吗
19、?吗?思考思考?是两个变量之是两个变量之间有间有很微弱很微弱的的线性线性关系关系是否因果关系?是否因果关系?统计一下世界各国平均每人拥有电视机数x及人民预期寿命y。你会找到很高的正相关:有很多有很多电视机的国家,电视机的国家,人人民预期寿命比较长民预期寿命比较长。那么,我们能不能运一堆电视机到非洲去,来延长那里人民的寿命呢?当然不行。富国的电视机比穷国多,但这是因为他们有较好的营养、干净的水以及较好的医疗资源。电视机的电视机的多少多少与与人的寿命人的寿命长短长短?n电视机与寿命长短之间并没有因果关系。-伪相关,伪回归。美国印第安纳州的地区教会的神父收集了近 年的教堂数与在监狱服刑的人数进行统计
20、分析。结果却令教会大吃一惊。最近年教堂数与监狱服刑人数呈显著的正相关。那么是否可以由此得出,教堂建得越多,就可能带来更多的犯罪呢?经过统计学家和教会神父深入讨论,并进一步收集近年的当地人口变动资料和犯罪率等资料作进一步分析,发现监狱服刑人数的增加和教堂数的增加都与人口的增加有关。教堂数的增加并非监狱服刑人数增加的原因。例:教堂数与监狱服刑人数同步增长例:教堂数与监狱服刑人数同步增长9.2 9.2 回归分析(广义分析)回归分析(广义分析)9.2.19.2.1回归分析的意义回归分析的意义 1.1.回归回归(regression)(regression)平均身高平均身高1877年年 英国著名统计学家
21、英国著名统计学家Francis Galton(18221911)弗朗西斯弗朗西斯高尔顿爵士高尔顿爵士 在遗传学研究中所发现的。在遗传学研究中所发现的。回归分析(来历)回归分析(来历)Galton在在19世纪末研究孩子世纪末研究孩子父母的身高父母的身高对对孩子身高孩子身高的影响的影响这个问题提出来的。这个问题提出来的。Galton对对1078对对父子身高之间的关系进行了研究,父子身高之间的关系进行了研究,他他假设假设父亲的身高父亲的身高是是影响因素影响因素(自变量),记为(自变量),记为x(单位:英寸)(单位:英寸)结果:结果:yc33.73+0.516xyc:儿子身高的:儿子身高的估计值估计值
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 第7单元 相关与回归分析 单元 相关 回归 分析
限制150内