(高职)第七章回归分析预测ppt课件.ppt
《(高职)第七章回归分析预测ppt课件.ppt》由会员分享,可在线阅读,更多相关《(高职)第七章回归分析预测ppt课件.ppt(155页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、第七章 回归分析预测第七章 回归分析预测 3学习目标理解回归分析的基本原理;理解回归分析的基本原理;掌握一元线性回归预测法的思路、步骤及其掌握一元线性回归预测法的思路、步骤及其在经济活动中的应用;在经济活动中的应用; 了解多元线性回归预测模型,知道模型检验了解多元线性回归预测模型,知道模型检验方法,掌握二元线性回归预测模型的应用;方法,掌握二元线性回归预测模型的应用;会将非线性模型转化为线性模型,并能应用会将非线性模型转化为线性模型,并能应用于市场现象的分析预测;于市场现象的分析预测;知道数学软件在回归分析中的应用。知道数学软件在回归分析中的应用。4概述回归分析预测是一种常用的定量预测方法。回
2、归分析预测是一种常用的定量预测方法。这种方法是依据事物内部因素变化的因果这种方法是依据事物内部因素变化的因果关系来预测事物未来的发展趋势,所以,关系来预测事物未来的发展趋势,所以,又称为因果分析法。在因果关系的分析预又称为因果分析法。在因果关系的分析预测中,不仅要确定前因与后果的一般依赖测中,不仅要确定前因与后果的一般依赖关系,而且要确定前因对后果的影响程度,关系,而且要确定前因对后果的影响程度,并作出量的估计。并作出量的估计。这里涉及到较多的数理统计知识,我们这里涉及到较多的数理统计知识,我们给出了建立和检验数学模型的一些思路,给出了建立和检验数学模型的一些思路,精简了过于繁琐的数学证明和推
3、理过程,精简了过于繁琐的数学证明和推理过程,着眼于运用数学知识去分析和解决市场着眼于运用数学知识去分析和解决市场预测问题。预测问题。5目录1.回归分析的的基本原理回归分析的的基本原理2.一元线性回归预测法一元线性回归预测法3.多元线性回归预测法多元线性回归预测法4.非线性回归预测法非线性回归预测法67.1 回归分析的的基本原理一、回归分析的意义一、回归分析的意义现实世界中,任何客观事物都不是孤现实世界中,任何客观事物都不是孤立存在,而是与另一些事物相互联系、相立存在,而是与另一些事物相互联系、相互影响着的。市场的发展变化同影响其变互影响着的。市场的发展变化同影响其变化的各种因素之间存在一定的依
4、存关系,化的各种因素之间存在一定的依存关系,一方面市场的发展变化是其影响因素影响一方面市场的发展变化是其影响因素影响的结果,另一方面,市场的发展变化也影的结果,另一方面,市场的发展变化也影响着其影响因素的发展变化。这种现象间响着其影响因素的发展变化。这种现象间存在的依存关系称为因果关系。存在的依存关系称为因果关系。 7经济现象间的因果关系与市场变量之经济现象间的因果关系与市场变量之间的关系形态,大致可分为两类:一类是间的关系形态,大致可分为两类:一类是变量之间存在着完全确定的关系,即一个变量之间存在着完全确定的关系,即一个变量能被一个或若干个其他变量按某一规变量能被一个或若干个其他变量按某一规
5、律唯一确定,这种关系通常被称为函数关律唯一确定,这种关系通常被称为函数关系。系。 8例如,设某种商品的单价为例如,设某种商品的单价为a(元),销售(元),销售量为量为x(件),销售收入为(件),销售收入为y(元),显然(元),显然销售收入与销售量之间存在确定的函数关销售收入与销售量之间存在确定的函数关系系y=ax。9另一类是变量之间存在着一定关系,而这另一类是变量之间存在着一定关系,而这种关系具有某种不确定性。种关系具有某种不确定性。例如,商品的价格与商品销售量之间的关例如,商品的价格与商品销售量之间的关系,一般来说,价格提高,销售量就会减少;价系,一般来说,价格提高,销售量就会减少;价格降低
6、,销售量就会增加。但是,我们不可能断格降低,销售量就会增加。但是,我们不可能断言,商品价格提高多少销售量就一定会减少多少,言,商品价格提高多少销售量就一定会减少多少,有时价格提高了,销售量反而会有所增加,这是有时价格提高了,销售量反而会有所增加,这是因为影响销售量的因素还有收入、个人爱好、季因为影响销售量的因素还有收入、个人爱好、季节变化等等。节变化等等。 10所以商品价格与销售量之间的关系不能用所以商品价格与销售量之间的关系不能用一个确定的函数关系来计算。这种非确定一个确定的函数关系来计算。这种非确定性的关系,称为相关关系。属于这类相关性的关系,称为相关关系。属于这类相关关系的现象,在自然界
7、和社会生活中都是关系的现象,在自然界和社会生活中都是屡见不鲜的。屡见不鲜的。 例如,父母身高与子女身高的关系,居民消费支出与居民收入的关系,人口增长与能源消耗的关系等等。11具有相关关系的变量之间虽然具有某种不具有相关关系的变量之间虽然具有某种不确定性的关系,但是,通过对现象的不断确定性的关系,但是,通过对现象的不断观察可以探索出它们之间的统计规律,这观察可以探索出它们之间的统计规律,这种统计规律称为回归方程,回归方程可以种统计规律称为回归方程,回归方程可以用来近似表达相关变量间的平均关系。用来近似表达相关变量间的平均关系。 12有关寻求回归方程的理论、计算和分析称有关寻求回归方程的理论、计算
8、和分析称为回归分析。表明相关变量密切程度的指为回归分析。表明相关变量密切程度的指标称为相关指标,其理论、计算和分析称标称为相关指标,其理论、计算和分析称为相关性分析。回归分析和相关分析两种为相关性分析。回归分析和相关分析两种方法往往是结合在一起使用。方法往往是结合在一起使用。13二、回归分析预测法的一般思路二、回归分析预测法的一般思路 回归分析预测法在实际应用中,一般可以回归分析预测法在实际应用中,一般可以分为四个步骤:分为四个步骤: 收集数据资料,绘制散点图收集数据资料,绘制散点图建立回归方程建立回归方程进行相关检验进行相关检验利用回归模型进行预测利用回归模型进行预测14收集数据资料,绘制散
9、点图根据调查统计取得的一系列相互对应的数根据调查统计取得的一系列相互对应的数据,这些数据称为观察点或实际值,将它据,这些数据称为观察点或实际值,将它们编制成数据表。把预测目标确定为因变们编制成数据表。把预测目标确定为因变量,而自变量就是引起预测目标发生变化量,而自变量就是引起预测目标发生变化的一个或多个因素。当数据点是二维数组的一个或多个因素。当数据点是二维数组时,在平面直角坐标系中将每一组数据以时,在平面直角坐标系中将每一组数据以一个点表示,这样所得的图形称为散点图。一个点表示,这样所得的图形称为散点图。15建立回归方程根据散点的分布状况,选择适当的回归数根据散点的分布状况,选择适当的回归数
10、学模型。如果点的分布呈直线趋势,则要学模型。如果点的分布呈直线趋势,则要求拟合成一条直线,作为描述散点分布直求拟合成一条直线,作为描述散点分布直线趋势的预测线,这就是一元线性回归预线趋势的预测线,这就是一元线性回归预测问题。如果点的分布不是直线趋势,根测问题。如果点的分布不是直线趋势,根据散点图的特点,选择相应的非线性回归据散点图的特点,选择相应的非线性回归模型,则要求拟合成一条曲线作为预测线,模型,则要求拟合成一条曲线作为预测线,这就是一元非线性回归预测问题这就是一元非线性回归预测问题 16建立回归方程研究两个变量之间的回归关系,称为一元研究两个变量之间的回归关系,称为一元回归问题;研究若干
11、个变量与另一个变量回归问题;研究若干个变量与另一个变量之间的回归关系,称为多元回归问题。之间的回归关系,称为多元回归问题。 17进行相关检验相关检验就是选择恰当的相关指标,去判相关检验就是选择恰当的相关指标,去判定回归方程变量之间关系的密切程度。相定回归方程变量之间关系的密切程度。相关程度越高,就表明回归方程与实际值的关程度越高,就表明回归方程与实际值的偏差越小,拟合效果越好。如果回归方程偏差越小,拟合效果越好。如果回归方程变量间的相关关系不好,在此情况下所得变量间的相关关系不好,在此情况下所得的回归方程没有什么意义。的回归方程没有什么意义。 18利用回归模型进行预测如果回归方程拟合得好,我们
12、就可以用它来作预如果回归方程拟合得好,我们就可以用它来作预测。所谓预测就是根据自变量取值来估计因变量测。所谓预测就是根据自变量取值来估计因变量(预测目标)的值。由于回归方程与实际值之间(预测目标)的值。由于回归方程与实际值之间存在误差,预测值不可能简单地表为由回归方程存在误差,预测值不可能简单地表为由回归方程计算所得的确定值,而应该是一个范围或区间,计算所得的确定值,而应该是一个范围或区间,一般要求实际值位于这个区间的可靠度应达到一般要求实际值位于这个区间的可靠度应达到95%以上,这个区间称为预测区间或预测值的置以上,这个区间称为预测区间或预测值的置信区间。置信区间说明回归模型的适用范围或精信
13、区间。置信区间说明回归模型的适用范围或精确程度。确程度。 197.2 7.2 一元线性回归预测法一元线性回归预测法一元线性回归的数学模型设设x为自变量,为自变量,y为因变量,根据一系列数为因变量,根据一系列数据点作出散点图,它们的关系具有直线趋据点作出散点图,它们的关系具有直线趋势,则可用以下直线方程来拟合它们变量势,则可用以下直线方程来拟合它们变量间的关系:间的关系: bxayy 为y的估计值a为回归常数b为回归系数20式(式(7-1)就是一元线性回归的数学模型。)就是一元线性回归的数学模型。根据两个变量根据两个变量x、y现有的统计数据或实际现有的统计数据或实际数据(数据(xi,yi),()
14、,(i=1,2,n),应),应用最小二乘法估计参数用最小二乘法估计参数a和和b,是确定回归,是确定回归方程的关键。方程的关键。 21我们将我们将xi代入(代入(7-1),则可求得估计值),则可求得估计值, (i= 1,2 ,),)实际值实际值yi与估计值与估计值 之差,称为估计误差之差,称为估计误差或残差,以或残差,以 ei 表示。表示。 (i=1,2,),)iibxayiy iiyeiiibxayy22为了避免误差求和时正负抵消,通常用误为了避免误差求和时正负抵消,通常用误差的平方差的平方 来表达误差,用误差平方和度来表达误差,用误差平方和度量全部量全部y与与 之间的偏差程度,设之间的偏差程
15、度,设Q表示误表示误差平方和,则差平方和,则iy 2ienIiiniibxayeQ1212 (7-2)23要使式(要使式(7-2)所表示的误差平方和)所表示的误差平方和Q达达到最小值,根据多元微分学中的极值原理,到最小值,根据多元微分学中的极值原理,a和和b须满足下列方程组:须满足下列方程组: niiiiniiixbxaybQbxayaQ110)(20224经整理得:经整理得: (7-3)上式称为正规方程组。解此线性方程组可上式称为正规方程组。解此线性方程组可得关于参数得关于参数a和和b的计算公式:的计算公式: nininiiiiiniiniixbxayxxbnay11121125 xbynx
16、byaxnxyxnyxxnxyxnyxbniiniiniiniiiniiniininiiiniii112121211211111niixnx11(7-4) niiyny11其中 26【例【例1】 某地区某地区19972006年工业总年工业总产值和货运量的统计资料如表产值和货运量的统计资料如表7-1所示。所示。yx货运量工业总产值年份 (亿吨) (10亿元)19971998199920002001200220032004200520062.82.93.23.23.43.23.33.73.94.225272932343635394245表表7-1 货运量与工业总产值资料货运量与工业总产值资料27根
17、据表根据表7-1资料作出的散点图如图资料作出的散点图如图7-1所示。所示。总产值(10亿元)亿吨24(54025303545货运量(图图7-1 货运量与工业总产值散点图货运量与工业总产值散点图28从散点图可知,散点大体上有直线趋势,从散点图可知,散点大体上有直线趋势,因此可用回归直线进行拟合。建立一元线因此可用回归直线进行拟合。建立一元线性模型:性模型:其中其中y表示货运量,表示货运量,x表示工业总产值。关表示工业总产值。关于参数于参数a、b的计算通常通过列表进行。的计算通常通过列表进行。bxay29表表7-27-2 货运量与工业总产值回归计算表货运量与工业总产值回归计算表2ix2iy序号货运
18、量yi工业总产值xixiyi1 12 23 34 45 56 67 78 89 910102.82.82.92.93.23.23.23.23.43.43.23.23.33.33.73.73.93.94.24.22525272729293232343438383535393942424545707078.378.392.892.8102.4102.4115.6115.6115.2115.2115.5115.5144.3144.3163.8163.8189189625625729729841841102410241156115612961296152115211225122517641764202
19、520257.847.848.418.4110.2410.2410.2410.2411.5611.5610.2410.2410.8910.8913.6913.6915.2115.2117.6417.6433.833.83443441186.91186.91220612206 115.96 115.9630由公式(由公式(7-4)及表)及表7-2中的数据可得中的数据可得 06493. 04 .37218.241/3441220610/8 .333449 .11861122112111oxnxyxnyxbniiniiniiniiniii1464. 11034406493. 0108 .33111n
20、xbynaniinii31故回归方程为故回归方程为式中式中a=1.1464为估计的固定货运量,为估计的固定货运量,b=0.06493表示当工业总产值每增加表示当工业总产值每增加10亿元,货运总量平均增加亿元,货运总量平均增加0.06493亿吨。亿吨。xy06493. 01464. 132二、对预测模型进行检验从前面的例子中可以看到,计算回归方程从前面的例子中可以看到,计算回归方程的参数和时,并不需要一定知道两个变量的参数和时,并不需要一定知道两个变量是否具有线性相关性,由散点图仅能作一是否具有线性相关性,由散点图仅能作一个粗略的直观判断,不能作定量分析。也个粗略的直观判断,不能作定量分析。也就
21、是说,就方法本身而言,即使对平面上就是说,就方法本身而言,即使对平面上一堆完全杂乱无章的散点,也可以由这些一堆完全杂乱无章的散点,也可以由这些数据点计算参数数据点计算参数a和和b,从而配一个直线方,从而配一个直线方程表示程表示y和和x之间的关系。之间的关系。33显然,此时所配的直线是毫无意义的,因显然,此时所配的直线是毫无意义的,因此,需要用一个数量指标检验回归方程拟此,需要用一个数量指标检验回归方程拟合的合的“优良性优良性”。模型检验常用的方法有。模型检验常用的方法有相关系数检验和估计标准差检验。其它如相关系数检验和估计标准差检验。其它如t检验法、检验法、F检验法在下一节作介绍。检验法在下一
22、节作介绍。341. 相关系数及显著性检验 相关系数是描述两个变量间线性相关密切相关系数是描述两个变量间线性相关密切程度的一个数量性指标,常用字母程度的一个数量性指标,常用字母r表示。表示。相关系数的公式为:相关系数的公式为: 3521122112111111niiniiniiniiniiniiniiiynyxnxyxnyxr2122121ynyxnxyxnyxniiniiniii(7-5) 36为简便起见,我们令:为简便起见,我们令:211221221121212niiniiniiniiniiniixxxnxxnxxnxxxxxL2112212121niiniiniiniiyyynyynyyy
23、LniiniiniiiniiiniiixyyxnyxyxnyxyyxxL11111137于是关于参数于是关于参数a、b的计算公式(的计算公式(7-4)可简化为:)可简化为: 相关系数的计算公式(相关系数的计算公式(7-5)可以简化为:)可以简化为: xbyaLLbxxxyyyxxxyLLLr (7-6)38显然,回归系数显然,回归系数b与相关系数与相关系数r有以下关系:有以下关系: 可以证明可以证明 ,而且,而且r的值反映了的值反映了y与与x之间的之间的内在联系,如图内在联系,如图7-2所示,有以下结论:所示,有以下结论:xxyyxxxxyyxxyyxxxyxxxyLLLrLLLLLLLLb(
24、7-7)1r39(1)当)当r=0时,由公式(时,由公式(7-7)可得回)可得回归系数归系数b=0,故回归直线是与,故回归直线是与x轴平行的轴平行的直线,它表明直线,它表明y的变化与的变化与x无关,此时称无关,此时称y与与x毫无线性关系。在通常的情况下,这毫无线性关系。在通常的情况下,这时散点的分布是不规则的。时散点的分布是不规则的。40(2)当)当0|x|1时,这是绝大多数的情形,时,这是绝大多数的情形,即即y与与x存在一定的线性相关性。当存在一定的线性相关性。当0r0,此时,此时y随随x的增加而的增加而增加,称增加,称y与与x正相关;当正相关;当-1r0时,时,有有b0,此时,此时y随随x
25、的增加而减少,称的增加而减少,称y与与x负相关。负相关。41当当|x|越小,接近于越小,接近于0时,散点偏离回归直时,散点偏离回归直线的程度越大,即线的程度越大,即y与与x的线性关系越差;的线性关系越差;当当|x|越大,接近于越大,接近于1时,散点就越靠近回时,散点就越靠近回归直线,即归直线,即y与与x的线性关系越好。的线性关系越好。42(3)当)当r=1时,所有散点完全在回归直时,所有散点完全在回归直线上。此时称线上。此时称y与与x完全线性相关。当完全线性相关。当r=1时,称完全正相关;当时,称完全正相关;当r=-1时,称完全负时,称完全负相关。相关。43图7-2 线性相关性示意图-1r00
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 高职第七章 回归分析预测ppt课件 高职 第七 回归 分析 预测 ppt 课件
限制150内