《统计学相关与回归分析法ppt课件.ppt》由会员分享,可在线阅读,更多相关《统计学相关与回归分析法ppt课件.ppt(50页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、第九章第九章 相关与回归分析法相关与回归分析法“雪亮工程是以区(县)、乡(镇)、村(社区)三级综治中心为指挥平台、以综治信息化为支撑、以网格化管理为基础、以公共安全视频监控联网应用为重点的“群众性治安防控工程”。第九章第九章 相关与回归分析相关与回归分析法法“雪亮工程是以区(县)、乡(镇)、村(社区)三级综治中心为指挥平台、以综治信息化为支撑、以网格化管理为基础、以公共安全视频监控联网应用为重点的“群众性治安防控工程”。第一节第一节 相关与回归分析概述相关与回归分析概述相关和回归分析是研究事物的相互关系、相关和回归分析是研究事物的相互关系、测定它们联系的紧密程度、揭示其变化的测定它们联系的紧密
2、程度、揭示其变化的具体形式和规律性的统计方法,是构造各具体形式和规律性的统计方法,是构造各种经济模型、进行结构分析、政策评价、种经济模型、进行结构分析、政策评价、预测和控制的重要工具。预测和控制的重要工具。“雪亮工程是以区(县)、乡(镇)、村(社区)三级综治中心为指挥平台、以综治信息化为支撑、以网格化管理为基础、以公共安全视频监控联网应用为重点的“群众性治安防控工程”。 一种商品的销售收入与其销售量:一种商品的销售收入与其销售量: 销售收入销售收入=销售量销售量 商品价格商品价格PQG 家庭收入与恩格尔系数:家庭收入与恩格尔系数: 家庭收入高,则恩格尔系数低。家庭收入高,则恩格尔系数低。相关关
3、系相关关系一、相关关系与相关分析“雪亮工程是以区(县)、乡(镇)、村(社区)三级综治中心为指挥平台、以综治信息化为支撑、以网格化管理为基础、以公共安全视频监控联网应用为重点的“群众性治安防控工程”。“雪亮工程是以区(县)、乡(镇)、村(社区)三级综治中心为指挥平台、以综治信息化为支撑、以网格化管理为基础、以公共安全视频监控联网应用为重点的“群众性治安防控工程”。“雪亮工程是以区(县)、乡(镇)、村(社区)三级综治中心为指挥平台、以综治信息化为支撑、以网格化管理为基础、以公共安全视频监控联网应用为重点的“群众性治安防控工程”。“雪亮工程是以区(县)、乡(镇)、村(社区)三级综治中心为指挥平台、以
4、综治信息化为支撑、以网格化管理为基础、以公共安全视频监控联网应用为重点的“群众性治安防控工程”。现象之间的相互联系,在许多情况下表现现象之间的相互联系,在许多情况下表现为一定的因果关系,将这些现象数量化则为一定的因果关系,将这些现象数量化则成为变量:成为变量:自变量自变量X因因变量变量Y“雪亮工程是以区(县)、乡(镇)、村(社区)三级综治中心为指挥平台、以综治信息化为支撑、以网格化管理为基础、以公共安全视频监控联网应用为重点的“群众性治安防控工程”。4.按涉及变量的多少分为按涉及变量的多少分为按相关的形式不同分为按相关的形式不同分为按相关的方向不同分为按相关的方向不同分为直线相关直线相关曲线相
5、关曲线相关负相关负相关正相关正相关按相关的程度不同分为按相关的程度不同分为完全相关完全相关不完全相关不完全相关不相关不相关复相关复相关单相关单相关“雪亮工程是以区(县)、乡(镇)、村(社区)三级综治中心为指挥平台、以综治信息化为支撑、以网格化管理为基础、以公共安全视频监控联网应用为重点的“群众性治安防控工程”。相关分析相关分析“雪亮工程是以区(县)、乡(镇)、村(社区)三级综治中心为指挥平台、以综治信息化为支撑、以网格化管理为基础、以公共安全视频监控联网应用为重点的“群众性治安防控工程”。回归分析回归分析二、回归与回归分析“雪亮工程是以区(县)、乡(镇)、村(社区)三级综治中心为指挥平台、以综
6、治信息化为支撑、以网格化管理为基础、以公共安全视频监控联网应用为重点的“群众性治安防控工程”。按回归方程的形式分为按回归方程的形式分为直线回归直线回归曲线回归曲线回归按自变量的个数分为按自变量的个数分为复回归复回归简单回归简单回归“雪亮工程是以区(县)、乡(镇)、村(社区)三级综治中心为指挥平台、以综治信息化为支撑、以网格化管理为基础、以公共安全视频监控联网应用为重点的“群众性治安防控工程”。q有共同的研究对象:现象之间的相关关系;有共同的研究对象:现象之间的相关关系;q互相补充:互相补充:相关分析要依靠回归分析表明现相关分析要依靠回归分析表明现象数量相关的具体形式;而回归分析要依靠相象数量相
7、关的具体形式;而回归分析要依靠相关分析来表明现象数量的相关程度。只有变量关分析来表明现象数量的相关程度。只有变量之间存在着高度相关时,进行回归分析寻求其之间存在着高度相关时,进行回归分析寻求其相关的具体形式才有意义。相关的具体形式才有意义。三、相关分析与回归分析的关系“雪亮工程是以区(县)、乡(镇)、村(社区)三级综治中心为指挥平台、以综治信息化为支撑、以网格化管理为基础、以公共安全视频监控联网应用为重点的“群众性治安防控工程”。q相关分析不必确定自变量和因变量,所涉相关分析不必确定自变量和因变量,所涉及的都是随机变量;回归分析事先要确定自及的都是随机变量;回归分析事先要确定自变量和因变量,只
8、有因变量为随机变量。变量和因变量,只有因变量为随机变量。q内容上:相关分析研究相关的方向和程度,内容上:相关分析研究相关的方向和程度,不能指出相关的具体形式,无法从一个变量不能指出相关的具体形式,无法从一个变量的变化推测另一个变量的变化;而回归分析的变化推测另一个变量的变化;而回归分析研究变量之间相互关系的具体形式,可根据研究变量之间相互关系的具体形式,可根据回归模型从已知量估计和预测未知量。回归模型从已知量估计和预测未知量。q方法上:相关分析通过编制相关表、绘制方法上:相关分析通过编制相关表、绘制相关图、计算相关系数;回归分析通过建立相关图、计算相关系数;回归分析通过建立回归模型。回归模型。
9、“雪亮工程是以区(县)、乡(镇)、村(社区)三级综治中心为指挥平台、以综治信息化为支撑、以网格化管理为基础、以公共安全视频监控联网应用为重点的“群众性治安防控工程”。“雪亮工程是以区(县)、乡(镇)、村(社区)三级综治中心为指挥平台、以综治信息化为支撑、以网格化管理为基础、以公共安全视频监控联网应用为重点的“群众性治安防控工程”。定性分析定性分析定量分析定量分析第二节第二节 简单线性相关分析简单线性相关分析“雪亮工程是以区(县)、乡(镇)、村(社区)三级综治中心为指挥平台、以综治信息化为支撑、以网格化管理为基础、以公共安全视频监控联网应用为重点的“群众性治安防控工程”。“雪亮工程是以区(县)、
10、乡(镇)、村(社区)三级综治中心为指挥平台、以综治信息化为支撑、以网格化管理为基础、以公共安全视频监控联网应用为重点的“群众性治安防控工程”。企业编号企业编号月产量(千吨)月产量(千吨)X生产费用(万元)生产费用(万元)Y123456781.22.03.13.85.06.17.28.0628680110115132135160八个同类工业企业的月产量与生产费用八个同类工业企业的月产量与生产费用“雪亮工程是以区(县)、乡(镇)、村(社区)三级综治中心为指挥平台、以综治信息化为支撑、以网格化管理为基础、以公共安全视频监控联网应用为重点的“群众性治安防控工程”。平均每昼平均每昼夜产量夜产量 固定资产
11、原值固定资产原值35404045455050555560606565706006501 15506001235005502134505001517400450224350400030035022223543120(百万元)(百万元)(吨)(吨)YfXf20个同类工业企业固定资产原值与平均每昼夜产量个同类工业企业固定资产原值与平均每昼夜产量“雪亮工程是以区(县)、乡(镇)、村(社区)三级综治中心为指挥平台、以综治信息化为支撑、以网格化管理为基础、以公共安全视频监控联网应用为重点的“群众性治安防控工程”。正正 相相 关关负负 相相 关关曲线相关曲线相关不不 相相 关关xyxyxyxy又称又称,用直
12、角坐标系的,用直角坐标系的x轴代表自变量,轴代表自变量,y轴代表因变量,将两个变量间相对应的变量轴代表因变量,将两个变量间相对应的变量值用坐标点的形式描绘出来,用以表明相关值用坐标点的形式描绘出来,用以表明相关点分布状况的图形。点分布状况的图形。“雪亮工程是以区(县)、乡(镇)、村(社区)三级综治中心为指挥平台、以综治信息化为支撑、以网格化管理为基础、以公共安全视频监控联网应用为重点的“群众性治安防控工程”。在在的条件下,用以反映的条件下,用以反映两变量两变量间间密切程度的统计指标,用密切程度的统计指标,用r表示表示)(22222积差法yyxxyyxxnyynxxnyyxxryxxy“雪亮工程
13、是以区(县)、乡(镇)、村(社区)三级综治中心为指挥平台、以综治信息化为支撑、以网格化管理为基础、以公共安全视频监控联网应用为重点的“群众性治安防控工程”。 xyLyxnxyyyxx1)(令xxLxnxxx222)(1)(yyLynyyy222)(1)(yyxxxyLLLr:则 2222)()(yynxxnyxxynryxnynxnxyyxyxxy“雪亮工程是以区(县)、乡(镇)、村(社区)三级综治中心为指挥平台、以综治信息化为支撑、以网格化管理为基础、以公共安全视频监控联网应用为重点的“群众性治安防控工程”。相关系数相关系数r r的取值范围:的取值范围:r0 为正相关,为正相关,r 0 为负
14、相关;为负相关;|r|=0 表示不存在表示不存在关系;关系;|r|1 表示完全表示完全相关;相关; |r| 0.3 为微弱相关为微弱相关(基本无关基本无关); 0.3 |r| 0.5为低度相关;为低度相关; 0.5 |r| 0.8为显著相关为显著相关(中度相关中度相关) ; 0.8 |r| 1.0为高度相关为高度相关(强相关强相关) 。“雪亮工程是以区(县)、乡(镇)、村(社区)三级综治中心为指挥平台、以综治信息化为支撑、以网格化管理为基础、以公共安全视频监控联网应用为重点的“群众性治安防控工程”。相关系数的取值及其意义图示“雪亮工程是以区(县)、乡(镇)、村(社区)三级综治中心为指挥平台、以
15、综治信息化为支撑、以网格化管理为基础、以公共安全视频监控联网应用为重点的“群众性治安防控工程”。序号序号能源消耗量能源消耗量(十万吨)(十万吨)x工业总产值工业总产值(亿元)(亿元)yx2y2xy1234567891011121314151635384042495254596264656869717276242524283231374041404750495148581225144416001764240127042916348138444096422546244761504151845776576625576784102496113691600168116002209250024012601
16、230433648409509601176156816121998236025422560305534003381362134564408合计合计916625550862617537887“雪亮工程是以区(县)、乡(镇)、村(社区)三级综治中心为指挥平台、以综治信息化为支撑、以网格化管理为基础、以公共安全视频监控联网应用为重点的“群众性治安防控工程”。能 源 消 耗 量807060504030工业总产值6050403020“雪亮工程是以区(县)、乡(镇)、村(社区)三级综治中心为指挥平台、以综治信息化为支撑、以网格化管理为基础、以公共安全视频监控联网应用为重点的“群众性治安防控工程”。()97
17、57. 0=625-2617516916-5508616625916-3788716=)(-=26175=,55086=,37887=,625=,916=,16=22222222yynxxnyxxynryxxyyxn解:已知结论:结论:工业总产值与能源消耗量之间存工业总产值与能源消耗量之间存在高度的正相关关系。在高度的正相关关系。“雪亮工程是以区(县)、乡(镇)、村(社区)三级综治中心为指挥平台、以综治信息化为支撑、以网格化管理为基础、以公共安全视频监控联网应用为重点的“群众性治安防控工程”。回归分析回归分析指根据变量之间相关关系的指根据变量之间相关关系的具体形态,建立一个数学方具体形态,建立
18、一个数学方程(回归方程)来描述变量程(回归方程)来描述变量之间关系;对给定的之间关系;对给定的自变量自变量x x,揭示,揭示因变量因变量y y在数量上的在数量上的平均变化并求得因变量的预平均变化并求得因变量的预测值的统计分析方法。测值的统计分析方法。第三节第三节 简单线性回归分析简单线性回归分析“雪亮工程是以区(县)、乡(镇)、村(社区)三级综治中心为指挥平台、以综治信息化为支撑、以网格化管理为基础、以公共安全视频监控联网应用为重点的“群众性治安防控工程”。XY为随机误差项为模型参数,与式中:XYEY“雪亮工程是以区(县)、乡(镇)、村(社区)三级综治中心为指挥平台、以综治信息化为支撑、以网格
19、化管理为基础、以公共安全视频监控联网应用为重点的“群众性治安防控工程”。)(YEXXY截距截距斜率斜率一元线性回归方程的可能形态一元线性回归方程的可能形态 为正为正 为负为负 为为0“雪亮工程是以区(县)、乡(镇)、村(社区)三级综治中心为指挥平台、以综治信息化为支撑、以网格化管理为基础、以公共安全视频监控联网应用为重点的“群众性治安防控工程”。XYEYbxay以样本统计量估计总体参数以样本统计量估计总体参数斜率(回归系数)斜率(回归系数)截距截距截距截距a 表示在自变量表示在自变量x为为0时,其它各种因素时,其它各种因素对因变量对因变量y的平均影响;的平均影响;回归系数回归系数b 表明自变表
20、明自变量量x每变动一个单位,因变量每变动一个单位,因变量y平均变动平均变动b个个单位。单位。“雪亮工程是以区(县)、乡(镇)、村(社区)三级综治中心为指挥平台、以综治信息化为支撑、以网格化管理为基础、以公共安全视频监控联网应用为重点的“群众性治安防控工程”。iiiiiybxayyyxbxay)(值应为的实际而变量之间的平均变动关系,变量与是理论模型,表明“雪亮工程是以区(县)、乡(镇)、村(社区)三级综治中心为指挥平台、以综治信息化为支撑、以网格化管理为基础、以公共安全视频监控联网应用为重点的“群众性治安防控工程”。10名学生的身高与体重散点图10名学生的身高与体重散点图40404545505
21、055556060656570707575158158163163168168173173178178身高(X )身高(X )体重(Y )体重(Y )bxayxbay残差:残差:e“雪亮工程是以区(县)、乡(镇)、村(社区)三级综治中心为指挥平台、以综治信息化为支撑、以网格化管理为基础、以公共安全视频监控联网应用为重点的“群众性治安防控工程”。bxay最小平方法最小平方法基本数学要求:基本数学要求:min)(02yyyy02012min,min) (22xbxaybxaybabxayyy,有求偏导数,并令其为零、分别对函数中,有由“雪亮工程是以区(县)、乡(镇)、村(社区)三级综治中心为指挥平
22、台、以综治信息化为支撑、以网格化管理为基础、以公共安全视频监控联网应用为重点的“群众性治安防控工程”。2xbxaxyxbnayxbynxbnyayxxyLLxxnyxxynbxxxxy222)(“雪亮工程是以区(县)、乡(镇)、村(社区)三级综治中心为指挥平台、以综治信息化为支撑、以网格化管理为基础、以公共安全视频监控联网应用为重点的“群众性治安防控工程”。9757. 0=r,55086,37887,625,916,162xxyyxn由计算表知bxay“雪亮工程是以区(县)、乡(镇)、村(社区)三级综治中心为指挥平台、以综治信息化为支撑、以网格化管理为基础、以公共安全视频监控联网应用为重点的“
23、群众性治安防控工程”。5142. 6169167961. 0166257961. 091655086166259163788716222 xbyaxxnyxxynbxy7961.05142.6“雪亮工程是以区(县)、乡(镇)、村(社区)三级综治中心为指挥平台、以综治信息化为支撑、以网格化管理为基础、以公共安全视频监控联网应用为重点的“群众性治安防控工程”。0 xbxayyxxy7961.05142.6对于若若 x = 80(十万吨),则:(十万吨),则:亿元1738.57807961. 05142. 6y“雪亮工程是以区(县)、乡(镇)、村(社区)三级综治中心为指挥平台、以综治信息化为支撑、以
24、网格化管理为基础、以公共安全视频监控联网应用为重点的“群众性治安防控工程”。 r0 r0 r=0b0 b0 b=0 xyyxrbbr;“雪亮工程是以区(县)、乡(镇)、村(社区)三级综治中心为指挥平台、以综治信息化为支撑、以网格化管理为基础、以公共安全视频监控联网应用为重点的“群众性治安防控工程”。10名学生的身高与体重散点图10名学生的身高与体重散点图40404545505055556060656570707575158158 160160 162162 164164 166166 168168 170170 172172 174174 176176 178178身高(X )身高(X )体重
25、(Y )体重(Y )yy yy yyyy2)(yySST2) (yySSE2) (yySSR误差平方和误差平方和回归回归平方和平方和总离差平方和总离差平方和“雪亮工程是以区(县)、乡(镇)、村(社区)三级综治中心为指挥平台、以综治信息化为支撑、以网格化管理为基础、以公共安全视频监控联网应用为重点的“群众性治安防控工程”。) ()(yyyyyy22) ()()(yyyyyy) )(2) ()(22yyyyyyyy0)() )(exbxebexbabxayyyy222) ()()(yyyyyyQyyUyyLyyyy222) (,)(,)(令QULyy:则总离差平方和的分解:总离差平方和的分解:“雪
26、亮工程是以区(县)、乡(镇)、村(社区)三级综治中心为指挥平台、以综治信息化为支撑、以网格化管理为基础、以公共安全视频监控联网应用为重点的“群众性治安防控工程”。222)/()(nynyyyLSSTyy xyyyyybLLULbxayQSSE2)()()()()() ()(2222222xxnnyxxynbLLLLbxxbxbabxayyUSSRxyxxxxxy“雪亮工程是以区(县)、乡(镇)、村(社区)三级综治中心为指挥平台、以综治信息化为支撑、以网格化管理为基础、以公共安全视频监控联网应用为重点的“群众性治安防控工程”。102 r判定系数取值范围:判定系数取值范围:222)()(yyyyL
27、Uryy判定系数是评价回归方程拟合优度的指判定系数是评价回归方程拟合优度的指标,可以说明回归方程的代表性大小。标,可以说明回归方程的代表性大小。“雪亮工程是以区(县)、乡(镇)、村(社区)三级综治中心为指挥平台、以综治信息化为支撑、以网格化管理为基础、以公共安全视频监控联网应用为重点的“群众性治安防控工程”。判定系数与相关系数的关系判定系数与相关系数的关系2)(rbr的符号22)(yyxxxyyyxyxxxyyyxyyyLLLLLLLLbLLUr“雪亮工程是以区(县)、乡(镇)、村(社区)三级综治中心为指挥平台、以综治信息化为支撑、以网格化管理为基础、以公共安全视频监控联网应用为重点的“群众性
28、治安防控工程”。无方向性,无方向性,则有方向,则有方向,其方向与样本回归系数其方向与样本回归系数 b 相同;相同;说明变量值的总离差平方和中说明变量值的总离差平方和中可以用回归线来解释的比例,主要用于评可以用回归线来解释的比例,主要用于评价回归方程的拟合优度;价回归方程的拟合优度;只说明只说明两变量间关联程度及方向,主要用于评价两变量间关联程度及方向,主要用于评价两变量间线性关系的密切程度。两变量间线性关系的密切程度。“雪亮工程是以区(县)、乡(镇)、村(社区)三级综治中心为指挥平台、以综治信息化为支撑、以网格化管理为基础、以公共安全视频监控联网应用为重点的“群众性治安防控工程”。是因变量各实
29、际值与其估计值之间的是因变量各实际值与其估计值之间的平均差异程度,表明其估计值对各实平均差异程度,表明其估计值对各实际值代表性的强弱;其值越小,回归际值代表性的强弱;其值越小,回归方程的代表性越强,用回归方程估计方程的代表性越强,用回归方程估计或预测的结果越准确。或预测的结果越准确。22) (22nxybyaynyySe“雪亮工程是以区(县)、乡(镇)、村(社区)三级综治中心为指挥平台、以综治信息化为支撑、以网格化管理为基础、以公共安全视频监控联网应用为重点的“群众性治安防控工程”。亿元,且知解:已知457.227961.0,5142.626175,37887,625,1622nxybyayS
30、bayxyynenxybyaynyySe22) (“雪亮工程是以区(县)、乡(镇)、村(社区)三级综治中心为指挥平台、以综治信息化为支撑、以网格化管理为基础、以公共安全视频监控联网应用为重点的“群众性治安防控工程”。222)() (11yyyyLQLUryyyy2221yeSSr2) (2nyy1)(2nyy“雪亮工程是以区(县)、乡(镇)、村(社区)三级综治中心为指挥平台、以综治信息化为支撑、以网格化管理为基础、以公共安全视频监控联网应用为重点的“群众性治安防控工程”。1、在因变量的总离差平方和中,如果回归、在因变量的总离差平方和中,如果回归平方和所占比重大,剩余平方和所占比平方和所占比重大
31、,剩余平方和所占比重小,则两变量之间(重小,则两变量之间( )A. 相关程度高相关程度高B. 相关程度低相关程度低C. 完全相关完全相关D. 完全不相关完全不相关课堂练习题:“雪亮工程是以区(县)、乡(镇)、村(社区)三级综治中心为指挥平台、以综治信息化为支撑、以网格化管理为基础、以公共安全视频监控联网应用为重点的“群众性治安防控工程”。1、某商业企业、某商业企业20002004年五年内商品销售额的年五年内商品销售额的年平均数为年平均数为421万元,标准差为万元,标准差为30.07万元;万元;商业利润的年平均数为商业利润的年平均数为113万元,标准差为万元,标准差为15.41万元;五年内商品销售额与商业利润的万元;五年内商品销售额与商业利润的乘积和为乘积和为240170万元。试就以上资料计算:万元。试就以上资料计算:(1) 商品销售额与商业利润的相关系数。商品销售额与商业利润的相关系数。(2) 其他条件不变时,估计当商品销售额为其他条件不变时,估计当商品销售额为600万万元时,商业利润可能为多少万元。元时,商业利润可能为多少万元。练习题:
限制150内