(专科)ch11相关与回归分析教学ppt课件.pptx
《(专科)ch11相关与回归分析教学ppt课件.pptx》由会员分享,可在线阅读,更多相关《(专科)ch11相关与回归分析教学ppt课件.pptx(74页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、(专科)ch11相关与回归分析教学ppt课件第11章 相关与回归分析PPT模板下载:行业PPT模板:节日PPT模板:素材下载:PPT背景图片:图表下载:优秀PPT下载:教程: Word教程: 教程:资料下载:课件下载:范文下载:试卷下载:教案下载:论坛: 本章目录CONTENTS相关与回归分析的概述01一元线性相关分析02多元线性回归分析04一元线性回归分析03随着人民生活的不断改善,轻工业蓬勃发展,但行业内部的竞争压力也日益增大。某市为大力发展轻工业、强化竞争力、提高该市轻工业整体销量及利润,特成立专项小组。经过小组讨论,认为轻工业企业广告费用的投入可能会对其产品销量产生一定的影响,于是专项
2、小组随机抽取了该市15家轻工业企业进行调查,得到这些企业的广告费用(万元)与产品销售量(万件)如下表所示:某市轻工业广告费用及产品销售量情况表某市轻工业广告费用及产品销售量情况表序号广告费用(万元)产品销量(万件)160842354033842471895566762329745608799394554102837114555126477135269143440154961在得到这些数据后,若想要确认该市轻工业企业广告投入费用的多少是否会对其产品销量产生一定的影响,是否广告费用投入越多,轻工业企业销售量就越大?要解决此类问题,就需运用本章所介绍的相关分析法与回归分析法。 变量间的相互依存关系有
3、两种类型:函数关系:函数关系是指变量之间存在着严格确定的数量依存关系,即一个或几个变量X取一定数值时,另一个变量Y总有确定的值与之相对应。例如,圆的直径与其面积的关系,个人所得与应纳个人所得税的关系、钟点工工作时长与其所得劳务报酬的关系、出租车打表距离与其所收费用的关系等等,都属于函数关系。相关关系:相关关系是指变量之间不确定性的数量依存关系,即指当一个变量X(或几个变量)取一定数值时,与之相关的某一个变量Y不是只有唯一一个数值与之对应,而是可能有若干个数值与之对应,这些数值表现出一定的随机波动性,但又总是以一定的规律围绕其均值上下波动。例如,居民收入与居民消费支出之间存在一定关系,当居民收入
4、增加时,居民消费支出一般会随之而增加,但居民收入增加一定数额,居民消费支出并非随之增加固定的数额。因为居民消费支出的变动,还会受到诸如居民消费倾向、价格水平、存款利率等其他很多因素的影响,因此二者之间的关系也属于相关关系而非函数关系。11.1 相关与回归分析的概述相关关系的概念 指变量之间一一对应的确定性的数量依存关系; 设有两个变量 x 和 y ,当变量 x 取某个数值时, y 有确定的值与之对应,则称 y 是 x 的函数y = f (x), 通常将 x 称为自变量,y 称为因变量; 所有观察点全都落在一条线上。 1.函数关系11.1 相关与回归分析的概述相关关系的概念1.是指变量间的关系数
5、量上不确定的依存关系;2.一个变量的取值不能唯一地由另一个变量来确定。即当变量 x 取某个值时,与之相关的变量 y 的取值可能有若干个;3.各观察点分布在直线(或曲线)周围。2.相关关系11.1 相关与回归分析的概述相关关系的概念11.1.2 相关关系的类型v1. 按按涉及变量数目涉及变量数目分为:分为:单相关(一元相关):单相关(一元相关):指仅涉及两个变量仅涉及两个变量的相关关系。复相关(多元相关):复相关(多元相关):指涉及三个或三个以上变量涉及三个或三个以上变量的相关关系。v2. 按按相关关系的表现形式相关关系的表现形式分为:分为:直线相关(线性相关):直线相关(线性相关):指变量之间
6、的数量关系大体上接近于一条直线接近于一条直线。曲线相关(非线性相关):曲线相关(非线性相关):指变量之间的数量关系大体上接近于一条曲线接近于一条曲线。v3. 按按相关方向相关方向分为:分为:正相关:正相关:指两个变量大致呈同方向变化的相关关系,即一个变量的数值增加时,另一个变量的数值也大体上随之而增加随之而增加。负相关:负相关:指两个变量大致呈相反方向变化的相关关系,即当一个变量增加时,另一个变量却大体上随之而减少随之而减少。11.1.3 散点图相关图(也称为散点图。)一对数据对应坐标图上一个点,将成对的观察数据表现为坐标图的散点而形成的图。编制相关表、图的意义有助于分析者判断 相关的有无、方
7、向、形态、密切程度。曲线相关曲线相关不相关不相关(零相关)(零相关)11.1.3 散点图相关关系定量分析的基本内容散点图可对变量之间的相关关系进行直观的视觉分析,我们还需要更精确和更客观的定量分析。相关分析和回归分析是对变量之间相关关系进行定量分析的两大基本内容。相关分析的主要内容是根据观测数据计算相关系数,以此说明变量之间相关的密切程度以及相关方向。相关关系的种类不同,相关系数的计算方法也不尽相同。回归分析是研究存在相关关系的变量之间具体的数量变化关系,只有变量之间关系密切时,进行回归分析才有意义。回归分析的主要内容包括:首先,根据观测数据拟合回归方程,即寻找一个适当的数量关系式来代表变量间
8、平均的数量变化关系,这种数量关系式称为回归方程;其次,对回归方程的可信程度进行检验;最后,利用所选定的回归方程进行分析或预测。相关关系的种类不同,所拟合的回归方程也就有不同类型。进行相关分析的一般程序进行相关分析的一般程序:定量分析定量分析相关表和相关图相关表和相关图计算相关系数计算相关系数和判定系数和判定系数相关关系定量分析的基本内容11.1 相关与回归分析的概述相关关系定量分析的基本内容相关分析与回归分析的区别与联系:l 仅就两个变量而言,相关分析中的两个变量是完全对等的,都看作随机变量,仅是研究变量之间的相关方向及相关程度。不必区分自变量与因变量。而回归分析旨在通过一个变量去解释或预测另
9、一个变量,因此回归分析首先要将所研究变量区分为自变量和因变量。因变量也称为被解释变量,是回归分析所要预测的变量,自变量也称为解释变量,是用来解释和预测因变量的。例如,在分析银行存款利率对居民存款额的影响时,目的是要预测一定的银行存款利率下的居民存款额是多少,因此,居民储蓄额是因变量,而银行存款利率是自变量。对于存在因果关系的变量,应该将“原因”作为自变量,将“结果”作为因变量 。l 另一方面,相关分析与回归分析又具有密不可分的联系。若两个变量之间存在线性相关关系,其线性相关程度越高,所拟合的线性回归方程就越有效,回归估计的误差就越小;反之若两个变量之间不存在线性相关关系,其线性相关程度就越低,
10、所拟合的线性回归方程就越无效,回归估计的误差就越大。若是两个变量之间存在非线性相关关系,相关程度的测定通常又要以回归分析的结果为基础。同样,若是要测定多个变量之间复相关的密切程度,通常也要依靠回归分析的结果。11.2 一元线性相关分析11.2.1 简单线性相关系数11.2.1 简单线性相关系数相关系数相关系数r的的性质性质11.2 一元线性相关分析11.2.1 简单线性相关系数【例11-1】从某市工业企业中随机抽取10个生产同类产品的企业,调查得知它们的研发费用(单位:万元)与产品产量(单位:万件)的数据如下表的第(1)和(2)列所示。试计算相关系数来说明该市工业企业中研发费用与产品产量之间的
11、相关关系。序号(甲)(1)(2)130402354533542455655707568090790100896110910412010105123合计70081011.2.1 简单线性相关系数企业的研发费用与产品产量及其相关系数计算表企业的研发费用与产品产量及其相关系数计算表序号(甲)(1)(2)(3)(4)(5)(6)(7)13040-40-4116401600168123545-35-3612601225129633542-35-3913651225152145565-15-16240225256570750-6003668090109901008179010020193804003618
12、96110262975467684191041203439132611561521101051233542147012251764合计7008100085257832935811.2.2 相关系数的显著性检验t 检验提出假设:H0: ;H1: 0确定检验的统计量:当X,Y均为正态随机变量时,计算检验统计量的值计算检验统计量的值 或或 P值,确定显著性水平值,确定显著性水平 n 若若 t t 或或 P值值0,Xrs0,X和和Y Y正相关;正相关;rs0rs0,负相关,负相关,rs=0rs=0,不相关。,不相关。11.2.3 等级相关系数 【例例11-2】试根据例11-1的数据计算该市工业企业中研
13、发费用与产品产量之间的等级相关关系。解:解:先计算样本中各个企业在研发费用与产品产量两个变量上的排序位次,再计算对应的位次差及其平方,如下表所示。企业研发费用与产品产量的等级相关系数计算表企业研发费用与产品产量的等级相关系数计算表序号研发费用的排序位次 xsi产品产量的排序位次ysi(甲)(1)(2)(3)(4)(5)(6)130401100235452.53-0.50.25335422.520.50.25455654400570755500680906600790100770089611088009104120990010105123101000合计700810555500.511.2.3
14、等级相关系数 根据上表所计算的结果,由式(11-4)可计算得:2S2660 .51=10 .9 9 6 9 7(1)1 0(1 0 01)idrnn可见,该市工业企业中研发费用与产品产量的等级顺序之间存在高度线性正相关关系。利用SPSS可直接计算两组定量数据的Spearman相关系数(Spearmans rho),且同时输出检验的P值和样本量等信息。例11-2的输出结果如图11-2所示。 SPSS的Spearman相关系数输出结果图11.2.3 等级相关系数 11.3 一元线性回归分析一元线性回归方程的估计“回归”一词最早是由英国生物学家高尔顿(Galton)在遗传学研究中提出来的。现代意义的
15、现代意义的“回归回归”是研究一个变量是研究一个变量(因变量因变量)对另外一个或多个变量对另外一个或多个变量(自变量自变量)的依存关系的统计方法,其目的就是寻找一个适当的数量关系式(回归方程)来的依存关系的统计方法,其目的就是寻找一个适当的数量关系式(回归方程)来近似代表变量间依存关系并据以进行估计或预测。近似代表变量间依存关系并据以进行估计或预测。回归方程中自变量可以只有一个,也可以有两个和两个以上,因此,按照自变量的个数来划分,回归分析相应地可分为一元回归分析和多元回归分析。回归分析相应地可分为一元回归分析和多元回归分析。根据回归方程的形态,回归分析又可以分为线性回归分析和非线性回归分析。这
16、里只介绍一元线性回归分析。回归分析的意义广义的相关分析变量之间相关关系的分析 狭义的相关分析 回归分析11.3 一元线性回归分析一元线性回归方程的估计回归分析的内容1.从一组样本数据出发,确定变量之间的数学关系式建立回归模型;借助于数学模型来表达变量之间的平均数量关系2.对这些关系式的可信程度进行各种统计检验并从某一特定变量的诸多影响因素(变量)中找出哪些变量的影响显著,哪些不显著;3.利用所求的回归模型进行分析,预测或控制 (并给出这种预测或控制的精确程度) 。11.3 一元线性回归分析一元线性回归方程的估计回归模型的类型v1. 按涉及变量多少分为:简单回归(一元回归)复回归(多元回归)v2
17、. 按回归曲线的形态分为:直线回归(线性回归)曲线回归(非线性回归)11.3 一元线性回归分析一元线性回归方程的估计1.总体回归方程和样本回归方程的概念11.3 一元线性回归分析一元线性回归方程的估计1.总体回归方程和样本回归方程的概念11.3 一元线性回归分析一元线性回归方程的估计2.随机项的基本假定11.3 一元线性回归分析一元线性回归方程的估计最小平方法也称为最小二乘法使因变量的观察值与估计值之间的离差平方和达到最小来求得 a和b 的方法,即满足下列条件: Q= = minniiixy120)(niiiyy12)(3.回归方程参数的估计方法最小二乘法11.3 一元线性回归分析一元线性回归
18、方程的估计nxnyxyxxyyxxiiiii11021)()(3.回归方程参数的估计方法最小二乘法11.3 一元线性回归分析一元线性回归方程的估计3.回归方程参数的估计方法最小二乘法【例11-3】根据例11-1的数据,试建立该市工业企业研发费用与产品产量之间的回归方程。解:对于工业企业来说,研发费用支出显然是影响工业企业产品产量的一个重要因素,因此,将研发费用作为自变量X,将企业产品产量作为因变量Y。根据前例中的计算结果,可得:上述回归方程表明,当没有研发费用投入时,即X=0时,产品产量平均只有4.8062万件;当研发费用投入每增加一万元时,企业的产品产量将平均增加1.0885万件。11.3
19、一元线性回归分析一元线性回归方程的估计3.回归方程参数的估计方法最小二乘法用用Excel的的“数据分析数据分析”中的中的“回归回归”可实现线性回归分析的有关计算,输出结果如可实现线性回归分析的有关计算,输出结果如下图下图所示。所示。11.3 一元线性回归分析一元线性回归方程的估计例例11-311-3的的ExcelExcel回归输出结果回归输出结果图图1.判定系数因变量 y 的取值是不同的,y 取值的这种波动称为变差或离差。对一个具体的观测值来说,变差的大小可以通过该实际观测值与其均值之差 来表示。变差来源于两个方面:由于自变量 x 的取值不同造成的;除 x 以外的其他因素 (包括 x 对 y
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 专科 ch11 相关 回归 分析 教学 ppt 课件
限制150内