统计学 相关与回归分析.ppt
《统计学 相关与回归分析.ppt》由会员分享,可在线阅读,更多相关《统计学 相关与回归分析.ppt(58页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、相关回归第九章 相关与回归分析南京财经大学统计学系相关分析与回归分析是现代统计学中非常重要的内容,在相关分析与回归分析是现代统计学中非常重要的内容,在自然、管理科学和社会经济领域有着十分广泛的应用。自然、管理科学和社会经济领域有着十分广泛的应用。在分析变量之间关系的时,常用的基本模型在分析变量之间关系的时,常用的基本模型:(1)(1)相关模型相关模型;(2)(2)回归模型回归模型实践中到底使用哪种模型取决于研究者的研究目的和数据实践中到底使用哪种模型取决于研究者的研究目的和数据的收集方式和条件。的收集方式和条件。相关分析相关分析:变量变量 X 和和 Y 都被视为随机都被视为随机变量,服从二元分
2、布;变量,服从二元分布;经典经典的的回归分析回归分析:通常变量通常变量 x 不是不是随机变量,在事先选好的值中取值,变量随机变量,在事先选好的值中取值,变量 Y 是随机变量,是随机变量,在变量在变量 x 的给定值处有相应的观测值。的给定值处有相应的观测值。例例1 1:太阳镜的日销售数量太阳镜的日销售数量 Y 与日最高气温与日最高气温 X 之间的关系之间的关系例例2 2:人均消费与人均人均消费与人均GDPGDP的关系的关系相关分析与回归分析相关分析与回归分析相关分析相关分析 用一个指标来表明现象间相互依存关系用一个指标来表明现象间相互依存关系的密切程度。的密切程度。回归分析回归分析 根据相关关系
3、的具体形态,选择一个合根据相关关系的具体形态,选择一个合适的数学模型,来近似地表达变量间关系。适的数学模型,来近似地表达变量间关系。相关分析所研究的变量是相关分析所研究的变量是对等对等关系;回归分析所关系;回归分析所研究的两个变量不是对等关系。研究的两个变量不是对等关系。因果因果本章内容本章内容一、相关关系的概念和分类一、相关关系的概念和分类二、线性相关关系的识别二、线性相关关系的识别三、三、一元线性回归分析一元线性回归分析四、多元线性回归分析四、多元线性回归分析五、非线性回归分析五、非线性回归分析相相关关分分析析NewNew一、相关关系的概念相关关系的概念和分类和分类一、一、函数关系函数关系
4、和和相关关系相关关系二、二、相关关系的分类相关关系的分类 相关程度相关程度相关程度相关程度、相关方向相关方向相关方向相关方向、相关形式相关形式相关形式相关形式、变量多少变量多少变量多少变量多少、相关性质相关性质相关性质相关性质二、线性相关关系的识别二、线性相关关系的识别(一)一)散点图散点图 (例子例子)最简单、最直观的识别方法最简单、最直观的识别方法,但难以给出相关的程度但难以给出相关的程度.(二)(二)直线直线相关相关系数系数 直线相关系数的直线相关系数的设计思想设计思想 总体相关系数总体相关系数与与PearsonPearson相关系数相关系数 相关系数的检验相关系数的检验 三、三、一元线
5、性回归分析一元线性回归分析变量变量y y对对x x的一元线性回归总体模型的一元线性回归总体模型 一元线性回归方程一元线性回归方程 一元线性经验回归方程一元线性经验回归方程 估计方法:估计方法:普通最小二乘估计普通最小二乘估计 、标准误差标准误差 的估计的估计模型评价:模型评价:可决系数可决系数、显著性检验显著性检验1 1 2 2预测方法:预测方法:点预测,区间预测点预测,区间预测将代入回归方程得将代入回归方程得=181.5830+0.4414=181.5830+0.441410000=4595.562810000=4595.5628(元)(元)一元线性回归模型的概念一元线性回归模型的概念New
6、四、多元线性回归分析四、多元线性回归分析基本概念:基本概念:回归系数、被解释变量(因变量)、解释回归系数、被解释变量(因变量)、解释 变量(自变量)、多元回归、变量(自变量)、多元回归、随机误差项。随机误差项。基本假设基本假设解释变量是确定性变量,不是随机变量,且要求矩解释变量是确定性变量,不是随机变量,且要求矩阵阵X X中的自变量列之间不相关,样本容量的个数应中的自变量列之间不相关,样本容量的个数应大于解释变量的个数。大于解释变量的个数。独立、同分布、零均值独立、同分布、零均值正态分布的假定条件:正态分布的假定条件:参数估计参数估计与一元线性回归方程的参数估计原理一样与一元线性回归方程的参数
7、估计原理一样,应该使得估应该使得估计值与观测值计值与观测值y y之间的残差在所有样本点上达到最小,之间的残差在所有样本点上达到最小,即使即使Q Q达到最小达到最小参数的最小二乘估计值为:参数的最小二乘估计值为:另外,另外,模型评价模型评价-拟合优度拟合优度一般不再用可决系数一般不再用可决系数而是用修正的可决系数而是用修正的可决系数模型评价模型评价-显著性检验显著性检验1整个回归方程的检验整个回归方程的检验模型评价模型评价-显著性检验显著性检验2单个回归系数的检验单个回归系数的检验EXCELEXCEL演示和解释演示和解释五、非五、非线性回归分析线性回归分析线性回归模型的结构特点线性回归模型的结构
8、特点:(1 1)被解释变量是解释变量的线性函数)被解释变量是解释变量的线性函数变量线性变量线性 (2 2)被解释变量也是参数的线性函数)被解释变量也是参数的线性函数参数线性参数线性根据实际分析建立的模型往往不符合上述线性特点,称为根据实际分析建立的模型往往不符合上述线性特点,称为非线性模型非线性模型。如。如:柯布柯布道格拉斯生产函数道格拉斯生产函数处理非线性回归模型的方法有两种:处理非线性回归模型的方法有两种:(1)(1)把非线性关系转化为线性关系,然后再运用线性回把非线性关系转化为线性关系,然后再运用线性回归的分析方法进行估计。归的分析方法进行估计。(2)(2)利用非线性最小二乘法直接估计利
9、用非线性最小二乘法直接估计非线性模型转换成线性模型的常用方法非线性模型转换成线性模型的常用方法:直接和间接代换法直接和间接代换法 函数关系:函数关系:对一个或几个变量任意一个取对一个或几个变量任意一个取值,另一个变量都有唯一确定值与之相对应,值,另一个变量都有唯一确定值与之相对应,这种关系这种关系确定性确定性的关系称为的关系称为函数关系函数关系。如某种商品的销售额如某种商品的销售额Y Y与该商品的销售量与该商品的销售量X X以及价格以及价格P P之间的关系可以表示为之间的关系可以表示为Y=PXY=PX,这就这就是一种函数关系。是一种函数关系。一般把作为影响因素的变量称为一般把作为影响因素的变量
10、称为自变量自变量;把发生对应变化的变量称为把发生对应变化的变量称为因变量因变量。Y Y是因变量,是因变量,P P与与X X是自变量。是自变量。函数关系函数关系 相关关系相关关系:当一个或几个相互联系的变量当一个或几个相互联系的变量取一定数值时,与之相对应的另一变量的值虽取一定数值时,与之相对应的另一变量的值虽然不确定,但它仍按某种规律在一定的范围内然不确定,但它仍按某种规律在一定的范围内变化,这种变化,这种不确定不确定的的相互关系,称为相互关系,称为相关关系相关关系如:劳动生产率与工资水平的关系如:劳动生产率与工资水平的关系,家庭支出家庭支出和收入的关系,人的体重和身高的关系。和收入的关系,人
11、的体重和身高的关系。相关关系不能用函数相关关系不能用函数精确精确表达表达,但经常用一定但经常用一定的函数形式去的函数形式去近似地近似地描述。描述。相关关系相关关系按相关程度划分按相关程度划分 完全相关完全相关:当一种现象的数量变化完全由当一种现象的数量变化完全由另一个现象的数量变化所确定时,这两种现另一个现象的数量变化所确定时,这两种现象间的关系为完全相关。即函数关系。象间的关系为完全相关。即函数关系。不相关不相关:当两个现象彼此互不影响,其当两个现象彼此互不影响,其数量变化各自独立时,称为不相关。数量变化各自独立时,称为不相关。不完全相关不完全相关:两个现象之间的关系介于两个现象之间的关系介
12、于完全相关和不相关之间,称为不完全相关。完全相关和不相关之间,称为不完全相关。(主主要表现形式要表现形式,主要研究对象,常主要研究对象,常简称为相关简称为相关,即狭义的相关,即狭义的相关)正相关:正相关:当一个现象的数量由小变大,当一个现象的数量由小变大,另一个现象的数量也相应由小变大,这种相另一个现象的数量也相应由小变大,这种相关称为正相关。如家庭支出随家庭收入的提关称为正相关。如家庭支出随家庭收入的提高而增加。高而增加。负相关:负相关:当一个现象的数量由小变大,而当一个现象的数量由小变大,而另一个现象的数量相反地由大变小,这种相另一个现象的数量相反地由大变小,这种相关称为负相关。如商品流转
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 统计学 相关与回归分析 相关 回归 分析
限制150内