Chap相关与回归分析实用.pptx
第一节第一节 相关回归的基本概念相关回归的基本概念 相关分析与回归分析是研究客观现象之相关分析与回归分析是研究客观现象之间数量联系的重要统计方法。对于相关分析间数量联系的重要统计方法。对于相关分析和回归分析既可以从描述统计的角度也可以和回归分析既可以从描述统计的角度也可以从推断统计的角度来说明。从推断统计的角度来说明。一、一、函数关系函数关系、相关关系相关关系二、相关关系的种类二、相关关系的种类相关程度相关程度、相关方向相关方向、相关形式相关形式、变量多少变量多少、相关性质相关性质散点图散点图第1页/共44页第二节第二节 直线相关分直线相关分析析相关关系的识别相关关系的识别一、一、散点图散点图 (例子例子)最简单的识别方法,但不能给出相关的程度.二、直线相关系数二、直线相关系数1.直线相关系数的设计思想及计算 2.应用相关系数时的注意事项 3.相关系数的判断与检验 第2页/共44页第三节第三节 一元线性回归分析一元线性回归分析变量变量y y对对x x的一元线性回归理论模型的一元线性回归理论模型 一元线性经验回归方程一元线性经验回归方程 估计方法:估计方法:普通最小二乘估计普通最小二乘估计 评价方法:评价方法:可决系数可决系数、估计标准误差估计标准误差、显著性检验显著性检验1 1 显著性检验显著性检验2 2 预测方法:点估计预测方法:点估计将代入回归方程得将代入回归方程得=181.5830+0.441410000=4595.5830=181.5830+0.441410000=4595.5830(元)(元)第3页/共44页第四节第四节 多元线性回归分析多元线性回归分析基本概念:基本概念:回归系数、被解释变量(因变量)、解释回归系数、被解释变量(因变量)、解释变量(自变量)、多元回归、变量(自变量)、多元回归、随机误差项。随机误差项。例子例子基本假定基本假定参数估计参数估计模型评价模型评价-拟合优度拟合优度模型评价模型评价-t-t检验检验模型评价模型评价-F-F检验检验矩阵矩阵第4页/共44页第五节第五节 非线性回归非线性回归 线性关系(Intrinsically Linear Models)可转换成线性关系,用最小二乘法的方法求出回归系数。(下面我们要研究的)非线性关系(Intrinsically Nonlinear Models)不可转换成线性关系,用迭代方法或分段平均值方法完成。第5页/共44页非线性回归分析非线性回归分析例子第6页/共44页非线性回归分析非线性回归分析例子第7页/共44页相关与回归的区别相关与回归的区别相关分析相关分析 用一个指标来表明现象间相互依存关用一个指标来表明现象间相互依存关系的密切程度。系的密切程度。回归分析回归分析 根据相关关系的具体形态,选择一个根据相关关系的具体形态,选择一个合适的数学模型,来近似地表达变量间关合适的数学模型,来近似地表达变量间关系。系。第8页/共44页相关与回归的区别相关与回归的区别相关分析所研究的变量是相关分析所研究的变量是对等对等关系;回关系;回归分析所研究的两个变量不是对等关系,归分析所研究的两个变量不是对等关系,需要确定因变量和自变量。需要确定因变量和自变量。相关分析要求两个变量都必须是相关分析要求两个变量都必须是随机随机的,的,而回归分析,通常自变量不是随机变量,而回归分析,通常自变量不是随机变量,因变量是随机的。因变量是随机的。第9页/共44页 函数关系:函数关系:对一个或几个变量任意一个取对一个或几个变量任意一个取值,另一个变量都有唯一确定值与之相对应,值,另一个变量都有唯一确定值与之相对应,这种关系确定性的关系称为这种关系确定性的关系称为函数关系函数关系。如某种商品的销售额如某种商品的销售额Y Y与该商品的销售量与该商品的销售量X X以及价格以及价格P P之间的关系可以表示为之间的关系可以表示为Y=PXY=PX,这就,这就是一种函数关系。是一种函数关系。一般把作为影响因素的变量称为一般把作为影响因素的变量称为自变量自变量;把发生对应变化的变量称为把发生对应变化的变量称为因变量因变量。Y Y是因变量,是因变量,P P与与X X是自变量。是自变量。函数关系函数关系第10页/共44页 相关关系相关关系:当一个或几个相互联系的变量取当一个或几个相互联系的变量取一定数值时,与之相对应的另一变量的值虽然不一定数值时,与之相对应的另一变量的值虽然不确定,但它仍按某种规律在一定的范围内变化,确定,但它仍按某种规律在一定的范围内变化,这种这种不确定的不确定的相互关系,称为相互关系,称为相关关系相关关系。如:劳动生产率与工资水平的关系、投资额如:劳动生产率与工资水平的关系、投资额与国民收入的关系与国民收入的关系,家庭支出和收入的关系。家庭支出和收入的关系。相关关系不能用函数相关关系不能用函数精确精确表达表达,但经常用一但经常用一定的函数形式去定的函数形式去近似地近似地描述。描述。相关关系相关关系第11页/共44页按相关程度划分按相关程度划分 完全相关完全相关:当一种现象的数量变化完全由当一种现象的数量变化完全由另一个现象的数量变化所确定时,这两种现象另一个现象的数量变化所确定时,这两种现象间的关系为完全相关。即函数关系。间的关系为完全相关。即函数关系。不相关不相关:当两个现象彼此互不影响,其数当两个现象彼此互不影响,其数量变化各自独立时,称为不相关。量变化各自独立时,称为不相关。不完全相关不完全相关:两个现象之间的关系介于完两个现象之间的关系介于完全相关和不相关之间,称为不完全相关。全相关和不相关之间,称为不完全相关。(主要表主要表现形式现形式,主要研究对象主要研究对象)第12页/共44页 正相关:正相关:当一个现象的数量由小变大,当一个现象的数量由小变大,另一个现象的数量也相应由小变大,这种相另一个现象的数量也相应由小变大,这种相关称为正相关。如工人的工资随劳动生产率关称为正相关。如工人的工资随劳动生产率的提高而增加。的提高而增加。负相关:负相关:当一个现象的数量由小变大,当一个现象的数量由小变大,而另一个现象的数量相反地由大变小,这种而另一个现象的数量相反地由大变小,这种相关称为负相关。如商品流转的规模越大,相关称为负相关。如商品流转的规模越大,流通费用水平则越低。流通费用水平则越低。按相关方向划分按相关方向划分第13页/共44页按相关形式划分按相关形式划分 线性相关:当两种相关现象之间的关当两种相关现象之间的关系大致呈现为直线关系时,称之为线性相系大致呈现为直线关系时,称之为线性相关。关。如人均消费与人均收入通常呈线性关系。如人均消费与人均收入通常呈线性关系。非线性相关:如果两种相关现象之间如果两种相关现象之间,并不表现为直线的关系并不表现为直线的关系,而是近似于某种曲而是近似于某种曲线关系,则这种关系称为非线性相关。线关系,则这种关系称为非线性相关。如产如产品的平均成本与产品总产量之间的相关关系就是一种非线性关品的平均成本与产品总产量之间的相关关系就是一种非线性关系。系。第14页/共44页 单相关:一个变量对另一个变量的相关关一个变量对另一个变量的相关关系,称为单相关。系,称为单相关。复相关:一个变量对两个或两个以上其他一个变量对两个或两个以上其他变量的相关关系时,称为复相关。变量的相关关系时,称为复相关。如某种商品如某种商品的需求与其价格水平及人们收入水平之间的相关关的需求与其价格水平及人们收入水平之间的相关关系就是一种复相关。系就是一种复相关。偏相关:在某一变量与多种变量相关的场在某一变量与多种变量相关的场合,当假定其他变量不变时,其中两个变量的合,当假定其他变量不变时,其中两个变量的相关关系称为偏相关。相关关系称为偏相关。按变量多少划分按变量多少划分第15页/共44页 真实相关:真实相关:当两种现象之间的相关当两种现象之间的相关确实具有内在的联系时,称之为确实具有内在的联系时,称之为“真实真实相关相关”。虚假相关:虚假相关:当两种现象之间的相关当两种现象之间的相关只是表面存在,实质上并没有内在的联只是表面存在,实质上并没有内在的联系时,称之为系时,称之为“虚假相关虚假相关”。按相关性质划分按相关性质划分第16页/共44页散点图散点图第17页/共44页又称相关图。又称相关图。它是以直角坐标系的横轴代它是以直角坐标系的横轴代表变量表变量X X,纵轴代表变量,纵轴代表变量Y Y,将两,将两个变量相对应的数值用坐标点的个变量相对应的数值用坐标点的形式描述出来,用来反映两变量形式描述出来,用来反映两变量之间相关关系的图形。之间相关关系的图形。散点图散点图第18页/共44页数据数据散点图散点图第19页/共44页散点图散点图第20页/共44页设计思想及计算设计思想及计算例子第21页/共44页例子例子第22页/共44页注意事项注意事项 (1)相关系数的符号代表变量间的线性相 关方向 (2)相关系数的取值介于-1和1之间 (3)相关系数很大不表示变量间存在因果 关系,也可能两个变量同时受第三个 变量的影响而使它们有很强的相。“虚假相关”(4)相关系数是说明线性联系程度的,相 关系数很小的变量间可能存在非线性 联系。第23页/共44页主观经验判别主观经验判别n高度线性相关高度线性相关 n中度线性相关中度线性相关n低度线性相关低度线性相关n基本不线性相关基本不线性相关第24页/共44页相关系数检验相关系数检验1.t统计量:若取显著性水平0.05,查表得到临界值得:2.查相关系数临界值表,根据n 与,就能直接找到相关系数的临界值 第25页/共44页普通最小二乘估计普通最小二乘估计正规方程组:求解正规方程组得:例子第26页/共44页例子例子回归方程:第27页/共44页可决系数可决系数示意图示意图第28页/共44页示意图第29页/共44页估计标准误差估计标准误差例子第30页/共44页例子例子第31页/共44页显著性检验显著性检验2例子第32页/共44页显著性检验显著性检验1例子第33页/共44页例子(检验例子(检验1、2)第34页/共44页矩阵表示矩阵表示第35页/共44页基本假设基本假设 解释变量是确定性变量,不是随机变解释变量是确定性变量,不是随机变量,且要求矩阵量,且要求矩阵X X中的自变量列之间不相中的自变量列之间不相关,样本容量的个数应大于解释变量的个关,样本容量的个数应大于解释变量的个数。数。独立、同分布、零均值独立、同分布、零均值 正态分布的假定条件正态分布的假定条件:第36页/共44页参数估参数估计计 与一元线性回归方程的参数估计原理与一元线性回归方程的参数估计原理一样一样,应该使得估计值与观测值应该使得估计值与观测值y y之间的残之间的残差在所有样本点上达到最小:差在所有样本点上达到最小:即使即使QQ达到最小。参数的最小二乘估计值达到最小。参数的最小二乘估计值为:为:另外另外:第37页/共44页模型评价模型评价-拟合优度拟合优度一般不再用可决系数一般不再用可决系数而是用修正的可决系数而是用修正的可决系数第38页/共44页模型评价模型评价-F检验检验整个回归模型的检验整个回归模型的检验第39页/共44页模型评价模型评价-t检验检验回归系数的显著性检验回归系数的显著性检验第40页/共44页五、多元线性回归分析五、多元线性回归分析例子例子第41页/共44页非线性例子非线性例子1数据数据模型模型第42页/共44页非线性例子非线性例子2柯布道格拉斯生产函数C-D函数 数据数据模型模型变换变换第43页/共44页感谢您的欣赏!第44页/共44页