《《应用统计学》第九章:相关分析与回归分析.ppt》由会员分享,可在线阅读,更多相关《《应用统计学》第九章:相关分析与回归分析.ppt(32页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、应用统计学编编编编 著著著著 陈在余陈在余陈在余陈在余 陶应虎陶应虎陶应虎陶应虎第9章 相关分析与回归分析 1.1 相关分析概述 1.2 相关关系的测定 1.3 一元线性回归分析 1.4 多元线性回归分析 案例分析学习目标与关键概念n学习目标 1 1、了解相关关系的概念及种类、相关分析的概念和内容、了解相关关系的概念及种类、相关分析的概念和内容 2 2、重点掌握简单相关系数的计算方法、重点掌握简单相关系数的计算方法 3 3、掌握回归分析的概念及建立线性回归方程的方法、掌握回归分析的概念及建立线性回归方程的方法 4 4、掌握相关参数的统计检验,能对统计软件回归计算的结、掌握相关参数的统计检验,能
2、对统计软件回归计算的结果做出正确的解释。果做出正确的解释。n关键概念相关分析、相关系数、回归方程、相关分析、相关系数、回归方程、统计检验统计检验第一节 相关分析概述一、相关关系的概念 n n在现实生活中存在许多社会经济现象,它们之间在现实生活中存在许多社会经济现象,它们之间相互依存、相互制约,彼此之间构成相互联系的相互依存、相互制约,彼此之间构成相互联系的整体。整体。n n现象之间的联系表现为变量之间的依存关系,而现象之间的联系表现为变量之间的依存关系,而这种依存关系有两种不同的类型:一是函数关系,这种依存关系有两种不同的类型:一是函数关系,二是相关关系。二是相关关系。时间序列的作用n n描述
3、社会经济现象的发展状况和结果n n研究社会经济现象的发展速度、发展趋势,探索现象发展变化的规律,并据以进行统计预测n n利用不同的但有互相联系的数列进行对比分析或相关分析,以分析现象之间发展变化的相互依存关系不确定(随机性)依存关系确定性依存关系函数关系相关关系因果关系互为因果关系共变关系图9-1函数关系与相关关系示意图【专栏专栏】对象之间有相关关系即为因果关系吗?二、相关关系的种类n n按相关关系涉及的因素多少可以分为单相关、复按相关关系涉及的因素多少可以分为单相关、复相关和偏相关相关和偏相关 n n按相关关系的表现形态可分为直线相关和曲线相按相关关系的表现形态可分为直线相关和曲线相关关n
4、n按相关关系的变化方向可分为正相关和负相关按相关关系的变化方向可分为正相关和负相关 n n按相关关系的相关程度可分为完全相关、不相关按相关关系的相关程度可分为完全相关、不相关和不完全相关和不完全相关【专栏专栏】真实相关与虚假相关真实相关与虚假相关三、相关分析与回归分析三、相关分析与回归分析 相关分析是研究两个或两个以上变量之间的相关方向和相关密切程度的统计分析方法,回归分析是对具有相关关系的变量之间的数量变化的一般关系进行测定,确定一个合适的回归方程,据以进行估计或预测的统计方法。相关分析与回归分析的联系与区别n n描述的方式不同 n n变量的地位不同 n n描述的内容不同返回返回第二节 相关
5、关系的测定一、相关表n n简单相关表 指资料未经分组,将某一变量按其变量值的大小指资料未经分组,将某一变量按其变量值的大小顺序排列,然后再将与其相关的另一变量的对应顺序排列,然后再将与其相关的另一变量的对应值进行排列所形成的表格。值进行排列所形成的表格。【举举例例】对对1010家家企企业业的的年年销销售售收收入入和和广广告告费费支支出出进进行调查,请编制简单相关表。行调查,请编制简单相关表。n n分组相关表 单变量分组相关表单变量分组相关表双变量分组相关表双变量分组相关表【举例举例】女大学生身高与体重的关系女大学生身高与体重的关系二、散点图n n散点图又称相关图,它是以直角坐标系的横轴代散点图
6、又称相关图,它是以直角坐标系的横轴代表变量表变量x x,纵轴代表变量,纵轴代表变量y y,将变量间相对变量数,将变量间相对变量数值用坐标点的形式描绘出来,用于反映两变量相值用坐标点的形式描绘出来,用于反映两变量相关关系的图形,比相关表更为直观地表明了两变关关系的图形,比相关表更为直观地表明了两变量之间的相关关系。量之间的相关关系。三、相关关系三、相关关系 相关系数是度量两个变量之间线性相关的方向和相关系数是度量两个变量之间线性相关的方向和强度的测度,常用的度量指标是皮尔逊强度的测度,常用的度量指标是皮尔逊(Pearson)(Pearson)相关系数相关系数 【专栏专栏】在相关分析中,定性分析或
7、经济理论分析重要吗在相关分析中,定性分析或经济理论分析重要吗?返回返回第三节 一元线性回归分析 回归分析实质就是通过建立数学方程,研究因变量与自变量之间的变动关系,如果分析一个自变量与一个因变量的线性关系,称为一元线性回归分析,如果分析两个或两个以上的自变量与一个因变量的线性关系,则称为多元线性回归。一、一元线性回归理论模型n n一元线性回归模型是用于分析一个自变量x与一个因变量y之间线性关系的数学方程,在变量x与y的直角坐标平面上,可以绘制散点图,可以看出所有的散点大致呈线性关系 二、普通最小二乘估计OLSn n普通最小二乘法基本思想是:因变量实际观察值y与因变量的估计值的离差平方和(也称为
8、残差平方和)最小,即这是一条最为接近真实直线的模拟直线。普通最小二乘法估计n n正规方程的回归系数的估计值【举例举例】根据某地区居民货币收入和社会商品零售额的资料,建立两个变量的回归方程 普通最小二乘法估计n n实际工作中,如果样本量很大,计算也很麻烦,一般常用统计软件如eviews、spss、stata等进行模拟估计,可直接得出输出结果【举例举例】eviews统计软件应用:根据某地区居民货币收入统计软件应用:根据某地区居民货币收入和社会商品零售额的资料,模拟回归方程和社会商品零售额的资料,模拟回归方程 三、一元线性回归的统计检验 统计检验包括线性关系检验和回归系数检验,统计检验包括线性关系检
9、验和回归系数检验,具体包括拟合优度检验、参数显著性检验以及具体包括拟合优度检验、参数显著性检验以及回归总体线性的显著性检验回归总体线性的显著性检验回归的统计检验n n离差平方和的分解 TSS=RSS+ESS n n拟合优度检验(判决系数R2)n n估计标准误差 n n相关系数计算n n检验的步骤根据公式计算相关系数根据公式计算相关系数r r值值 根据给定的显著性水平根据给定的显著性水平,查相关系数检验表,查相关系数检验表,自由度为自由度为n-2n-2,得到临界值,得到临界值 统计决策统计决策相关性检验(r检验)参数的显著性检验(t检验)n nt检验:是对回归系数的显著性检验 t(n-2)n n
10、t检验的基本步骤 提出假设提出假设构造构造t t检验统计量,并由样本数据计算检验统计量,并由样本数据计算t t检验值检验值 根据显著性水平根据显著性水平,查,查t t分布表,得到临界值分布表,得到临界值 统计决策统计决策回归总体线性的显著性检验(F检验)n nF F检验是对回归总体线性关系是否显著的一种假设检验是对回归总体线性关系是否显著的一种假设检验检验n nF F检验的基本步骤检验的基本步骤 提出假设提出假设 构造构造F F检验统计量,并由样本数据计算检验统计量,并由样本数据计算F F检验值检验值 根据显著性水平根据显著性水平,查,查F F分布表,得到临界值分布表,得到临界值 统计决策统计
11、决策四、一元线性回归方程的预测n n点预测 当给定x=x0时,利用样本回归方程,可以求出相应的样本拟合值;点估计的优点是当给定x0时,就能确切地给出预测值 区间预测n n当数据来自小样本当数据来自小样本n30n30时,可以构造时,可以构造t t统计量,统计量,服从自由度为服从自由度为n-2n-2的的t t分布,给定显著性水平分布,给定显著性水平,则实际值则实际值y y0 0的置信区间:的置信区间:区间预测n n当数据来自大样本当数据来自大样本n n3030时,可以构造时,可以构造Z Z统计量,服从统计量,服从标准正态分布,给定显著性水平标准正态分布,给定显著性水平,则实际值,则实际值y0y0的
12、置信的置信区间区间 【举例举例】对该地区社会商品零售额进行区间预测 返回返回第四节 多元线性回归分析一、多元线性回归的理论模型 假定因变量y与n个解释变量x1,x2,xn具有线性相关关系,则多元线性回归的理论模型可表示为:二、多元线性回归方程的估计与检验n n多元回归方程估计的检验包括拟合优度检验多元回归方程估计的检验包括拟合优度检验(R(R2 2检检验验)、相关系数检验、相关系数检验(r(r检验检验)、总体方程的显著性、总体方程的显著性检验检验(F(F检验检验)及回归方程的参数检验及回归方程的参数检验(t(t检验检验),其,其基本思想与一元回归方程的检验类似基本思想与一元回归方程的检验类似
13、n n在实际统计工作中,通常使用计算机来处理,常在实际统计工作中,通常使用计算机来处理,常用的经济计量软件有用的经济计量软件有eviewseviews、statastata、spssspss等等【举例举例】建立某地区机电行业的销售额与汽车产量、建建立某地区机电行业的销售额与汽车产量、建筑业生产的线性回归方程,并进行统计检验及预测筑业生产的线性回归方程,并进行统计检验及预测 三、曲线回归的线性化n n多项式曲线方程 n n双曲线函数方程 n n指数函数方程n n对数函数方程 n nS曲线回归方程【举例举例】用最小二乘法模拟某省第三产业的用最小二乘法模拟某省第三产业的C-D生产生产函数的回归方程函数的回归方程 四、应用回归分析应注意的几个问题n n在定性基础上进行定量分析 n n回归系数只说明因变量与自变量之间的变动比例,而不表示变动的密切程度。n n在回归分析中,估计参数的有效性应进行显著性检验返回返回案例分析【案例案例】预测大学足球比赛的获胜得分差额预测大学足球比赛的获胜得分差额 分析:可以分析:可以“比赛获胜得分的差值比赛获胜得分的差值”为因为因变量,相关影响因素为自变量,建立多元变量,相关影响因素为自变量,建立多元回归方程,并通过方程,分析大学足球赛回归方程,并通过方程,分析大学足球赛获胜的原因及进行相关预测获胜的原因及进行相关预测返回返回
限制150内