时间序列预测方法.pptx
Market survey&ForecastMarket survey&Forecast 市场调查与预测市场调查与预测主讲:主讲:雷思友雷思友 系主任系主任/副教授副教授/硕导硕导安徽理工大学经济与管理学院工商管理系安徽理工大学经济与管理学院工商管理系 2014201420142014年年年年8 8 8 8月月月月第1页/共105页 在我们的生活中,有时候需要对未来的经济现象进行预测。而预测的依据就是已经发生的经济现象,当把历史数据按照时间顺序排列进行分析、归纳、总结,就可从中得到一些规律东西,并利用这些规律进行预测。而时间序列预测法是市场预测中一个重要方法之一。时间序列是指各种各样的社会、经济、自然现象的数量指标依时间秩序排列起来的统计数据(动态)。例如,大学的每年招生人数是依时间变化的,这就是一种时间序列。第六章第六章 时间序列预测方法时间序列预测方法第2页/共105页v时间序列预测法时间序列预测法 是根据历史资料和数据,按照时间序列所反映的经济现象的发展过程、方向和趋势、将时间序列外推或延伸,以预测经济现象未来可能达到的水平。v时间序列预测法特点时间序列预测法特点 在时间序列中,数据的大小受到各种因素的影响。数据的变化趋势也表现出各种形状,通常根据这些影响因素将数据的变化趋势分为四大类:长期趋势、季节趋势、循环趋势、和不规则变动。对于前三种数据趋势预测问题,由于数据呈现某种规律性,因此能够将数据进行简化、分析,从而使预测成为可能;而不规则变动是指由某种偶然因素引起的突然变动,如战争的发生、政权的更迭、重大的自然灾害(地震、海啸)等,预测的难度就大,有的甚至无法预测。第3页/共105页一、时间序列分析一、时间序列分析一、时间序列分析一、时间序列分析 时间序列一般用:y1 1,y2 2,yt t;表示,其中t时间 在时间序列中,每个时期变量数值的大小,都受到许多不同因素的影响。例如,手机销售量受到居民的收入、质量,功能、价格等因素的影响。因此,时间序列按性质不同分成以下四类:第一节第一节 时间序列概述时间序列概述 时间序列预测法时间序列预测法早在国外应用,国内是在二十世纪60年代初应用于水文预测,随计算机的广泛应用,在许多领域已经应用,并取得了很好的效果。目前,已成为世界各国进行市场预测的基本方法基本方法。第4页/共105页1 1、长期趋势、长期趋势(Long-term Tend)指受某种根本性因素的影响,时间序列在较长时间内朝着一定的方向持续上升或下降,以及停留在某一水平上的倾向。如图6-1所示。时间时间时间销售额销售额销售额(a)上升变动趋势图 (b)下降变动趋势图 (c)水平变动趋势图 图6-1 时间序列数据长期趋势变化曲线.第5页/共105页2 2、季节变动、季节变动(Seasons VarietySeasons Variety)指由于自然条件自然条件和社会条件社会条件的影响,时间序列在一年内随着季节的转变而引起某一因子呈周期性的变动。例如,农作物的生长季节影响,导致农产品加工业的季节变动。季节变动的周期比较稳定,一般,周期为一年。季 销 售 额年销售额时间时间图6-2 时间序列数据季节变化曲线 图6-3 时间序列数据循环变化曲线 第6页/共105页3 3、循环变动、循环变动(Alternation varietyAlternation variety)如图4-3所示。循环变动与季节变动有相似之处,时间序列都会在周期内有波动,而季节波动的时间序列周期长短固定;而循环变动的时间序列波动较长、周期长短不一,少则一两年,多则数年甚至是数十年,周期不好预测。4 4、不规则变动、不规则变动(Irregular VarietyIrregular Variety)它是由各种偶然性因素引起的无周期变动。又可分为突然变动和随机变动。例如,战争、自然灾害、地震、意外事故的改变所引起的变动都属于突然变动;而随机变动是由随机因素所产生的影响。(前两天,日本地震)二、时间序列的组合形式二、时间序列的组合形式二、时间序列的组合形式二、时间序列的组合形式 时间序列是由长期变动、季节变动、循环变动和不规则变动四类因素组成。四类因素的组合形式,常见的有以下几种类型:第7页/共105页 对于一个具体的时间序列,由哪几类变动组合,采用哪种组合形式,应根据所掌握的资料、时间序列、及研究的目的来确定。下面,我们将要分别介绍这类问题的预测方法。第8页/共105页 平均数法是一种传统的趋势变动分析预测法,它通过计算时间序列一定项数的平均数,来估计模型参数,建立趋势变动分析预测模型进行外推预测。一、全列算术平均法一、全列算术平均法一、全列算术平均法一、全列算术平均法 是移动平均法的一种,它含有算术平均法、几何平均法、加权平均法等。1、算术平均法 设时间序列为:第二节第二节 平均数预测法平均数预测法第9页/共105页(2 2)预测值预测值可用最后一年的每月平均值或数年的每月平均值;(3 3)当当观察期的长短不同,预测值也随之不同(误差)若误差过大,就会使预测失去意义,因此,预测时应确定合理的误差,误差公式为:(4 4)当时间序列波动较小时,预测期可短一些;反之,可长一些。用此公式应注意:(1 1)时间序列波动较小的情况下使用;第10页/共105页1 1、显著性水平、显著性水平()本来正确的数据却被错误的否定掉,即犯弃真错误,犯此错误的概率称为显著性水平。本来错误的数据却被认为是正确的而被保留下来,即犯存伪错误,犯此错误的概率记作。(n-m-1)自由度。其中:n时间序列的个数 m自变量的个数2 2、标准差(、标准差(S S)实质上是平均差,它反映个体与平均值差别的程度。补充资料补充资料补充资料补充资料第11页/共105页 请你根据食盐在请你根据食盐在20012001年年-2004-2004年的每月销售量见表年的每月销售量见表6-16-1所示,预测所示,预测20052005年的年的每月销售量。每月销售量。月 年2001年2003年2003年2004年132833029833523313243173213360348328346431836033036353243273233296294342348327734236034236883483573513509357321318341103212973363121133031835432712348354358351全年平均4001403840034070表6-1 食盐的销售量及平均值算术平均预测法举例1第12页/共105页解:解:由表6-1可知,方法(方法(1 1)以2001年2004年的4年的月平均值作为2005年的预测值,则有:第13页/共105页 在95%的置信度下,确定2005年每月预测区间为:方法(方法(2 2)以2004年每月的平均值作为1998年的每月预测值结论结论比较(1)、(2)可知:方法(1)精确度高。第14页/共105页 某商店汗衫的销售量如表6-2所示,试预测第第五年每月的销售量。月 年2001年2002年2003年2004年116.017.320.117.8219.021.022.020.7321.323.025.023.1425.027.029.225.7532.836.038.535.86 665.265.270.270.277.077.070.870.87 799.099.0107.0107.0118.0118.0108.0108.08 8131.0131.0140.2140.2152.8152.8141.3141.39 980.580.587.287.294.094.087.287.21038.041.445.041.51122.224.026.024.11218.419.822.520.2全年平均47.451.255.8表 6-2 某商店汗衫的销售量统计表 单位:百元问题问题问题问题第15页/共105页由表6-2可知:(1)112月内出现季节波动,特别是在68月份,要比淡季高出23倍。(2)汗衫销售量还出现长期变动趋势(每一年的销售量逐年增加)在这种情况下,用算术平均法求第四年每月的平均值,显然误差较大,就不能用这种方法 第16页/共105页2 2 2 2、几何平均、几何平均、几何平均、几何平均(1)n(1)n个变量值乘积的个变量值乘积的n n次根次根;(2)(2)适用于对比率数据的平均适用于对比率数据的平均;(3)(3)主要用于计算平均增长率主要用于计算平均增长率;(4)G(4)G的确定方法:的确定方法:根据公式直接 计算 (5)可看作是平均数的一种变形。第17页/共105页问题问题1 1 某水泥厂1999年的水泥产量为100万吨,2000年与1999年相比增长率为9%,2001年与2002年相比增长率为16%,2002年与2001年相比增长率为20%,求各年的平均增长率。解:解:第18页/共105页问题问题问题问题2 2 2 2 一位投资者购有一种股票,在2000,2001,2002,2003年收益率分别为4.5%,2.1%,25.5%,1.9%,计算其平均收益率。第19页/共105页适用条件:适用条件:具有对比或近似对比关系的时间序列。具有对比或近似对比关系的时间序列。几何平均预测法几何平均预测法第20页/共105页观察期(年)9192939495969798990001020304销售额(万元)718183908987929610095145105120142 某企业19912004年的销售额资料如表6-3所示,预测该企业2005年的销售额 表6-3 某企业19912004年的销售额问题问题问题问题3 3 3 3第21页/共105页解解:(方法一)由预测公式直接计算(略)(方法二)由环比指数进行预测预测步骤如下:(1)以上年度的基数分别求各年的环比指数。1991年的环比指数=81/71100%=114.08%2004年的环比指数=83/81100%=102.47%,同理可得出各年的环比指数,见表(2)求环比指数的几何平均数,即发展速度。可用两种方法:直接用所求得的环比指数,求平均发展速度。第22页/共105页采用对数运算,求得的环比指数的几何平均数,见表。G=arclg lgxi/n=arclg2.0231=105.46 平均发展速度为5.52%。两种方法所得结果梢有差异,是由于计算中四舍五如的原因。(3)求环比指数几何平均数的简便算法。以1991年销售额为x0 0(基数),2004年销售额为xn(当前期),那么其环比指数的几何平均数为:第23页/共105页观察期实际销售额环比指数(x)lgx(1)(2)(3)(4)199171.00199281.00114.082.0572199383.00102.472.0106199490.00108.432.0352199589.0098.891.9951199687.0097.751.9901199792.00105.752.0243199896.00104.352.01831999100.00104.172.0177200095.0095.001.97772001145.00153.632.18362002105.0072.411.85982003120.00114.292.05802004142.00118.332.0727/n2.0231 表6-4 1991 2004年销售额及几何发展速度 单位:万元第24页/共105页 是在求平均数时,根据观察期各资料重要性的不同,分别赋予不同的权重,然后再平均的方法。特点:特点:加权后的平均值包含了长期趋势变动。3 3、加权平均法、加权平均法第25页/共105页的选择原则的选择原则:由表达式可知,的选择不同,近期数据的数据权重选择大一些;远期数据权重选择小一些。有三种形式:(1)当 x xt t 变动不大时变动不大时,采用等差级数采用等差级数的形式,1,2,n(2)当x xt t变动较大时变动较大时,采用等比级数采用等比级数的形式,1,2,4,8,(3)当 xt变动不大时,采用0.2,0.3,0.5,等。第26页/共105页 某商店近几年的资料如表6-5所示,试预测1998年的销售额。表 6-5 19931997年销售额及赋权权值 单位:万元观察期销售额Xi权重iiXi1993401401994602120199555316519965543001997755425315151050问题问题:第27页/共105页 是将观察期的数据,按时间先后顺序排列时间先后顺序排列,由远及由远及近,以一定的跨越期进行移动的平均,求得的平均值近,以一定的跨越期进行移动的平均,求得的平均值,即:x1 1,x2 2,xn n,方法:方法:每次移动平均总是在上次移动平均的基础上,去掉去掉一个最远的数据,增加一个紧挨跨越期后面的新数据新一个最远的数据,增加一个紧挨跨越期后面的新数据新数据,保持跨越期不变,每次只向前移动一步,逐项移数据,保持跨越期不变,每次只向前移动一步,逐项移动,滚动前移。动,滚动前移。下面具体介绍如下:二、移动平均法二、移动平均法分析分析:由表可知,随着时间的推移,销售额逐年稳步的增加,若用算术平均或几何平均,其预测值较小,不能刻化时间序列的长期趋势.而加权平均法只要选取的好,就能较好的反映长期趋势,故选用加权平均法进行预测。第28页/共105页(一)一次移动平均法(一)一次移动平均法1、原理原理第29页/共105页第30页/共105页 某城市汽车配件销售公司某年1月至12月的化油器销售量如表6-6所示,请预测明年1月的销售量。问题:移动平均法中n的大小比较月份123456789101112 销售量423423358358434434445445527527429429426426502502480480384384427427446446第31页/共105页月月三期移动平均预测三期移动平均预测注:注:右图右图,兰线为兰线为n=3,n=3,红线为红线为n=5.n=5.图图6-46-4解:解:(1 1)分别)分别取取N=3,和N=5 由预测公式:其结果作图分别为:第32页/共105页1 1、由图6-4可知:销售量的随机波动较大,经过平均移动法计算后,随机波动显著减少,即较大程度消除了随机因素的影响。2 2、n的取值愈大,修匀的程度也愈大,因此波动也愈小。但对实际销售量的真实变化趋势反应也愈迟钝;反之,N的取值愈小,对实际销售量的真实变化趋势反应也愈灵敏。讨论讨论讨论讨论1 1 1 1第33页/共105页讨论讨论2 2 由前面的讨论可知:1、N的取值大小,决定了对实际情况描述误差的的取值大小,决定了对实际情况描述误差的大大 小。故小。故N的取值很重要。的取值很重要。N应取多大,才能基应取多大,才能基本反应真实情况应视具体情况而定。本反应真实情况应视具体情况而定。2、在实际应用中,是取几个、在实际应用中,是取几个N值进行试算,比较值进行试算,比较他们的预测误差的大小。具体方法如下:他们的预测误差的大小。具体方法如下:第34页/共105页 其计算结果表明:应取其计算结果表明:应取N=5N=5。第35页/共105页移动平均法特点移动平均法特点:所求得的各序列平均值,不仅构成了新的时间新的时间序列序列,而且新的时间序列与原时间序列相比较,削削弱了季节变动、周期变动和不规则变动的影响,具弱了季节变动、周期变动和不规则变动的影响,具有明显的修复效果,同时又保持了原时间序列的长有明显的修复效果,同时又保持了原时间序列的长期趋势变动期趋势变动,正是它具有这种特点,因此,移动平均法在市场预测这被非常广泛的应用。第36页/共105页2 2、一次平均移动值的位置、一次平均移动值的位置 由 的表达式可知:是时间序列的中间值,即 放在中间的位置。但实际上是放在跨越期末的位置。这就出现了偏差,即使得预测值落后与实际值n-1/2,为了纠正这种误差,规定将 放在n+1/2的位置上。3 3、一次移动平均法预测的步骤、一次移动平均法预测的步骤(1)绘制散点图(根据收集的资料)(2)选择跨越期并计算移动平均值(3)计算趋势变动值(4)当年趋势变动值=当年移动平均值上年的移动平均值 =1 n+1/2 n 一次移动产生滞后偏一次移动产生滞后偏差的原因差的原因第37页/共105页注意:注意:在以下情况,趋势变动情况可分别处理:当各年的趋势变动值比较平稳时比较平稳时,可直接采用最后一最后一 年的趋势变动值进行预测。年的趋势变动值进行预测。当各年的趋势变动值波动较大时波动较大时,可采用下面两种方法:(a)趋势变动值趋势变动值=算术平均值算术平均值(b)趋势变动值趋势变动值=各年的趋势变动值求移动平均,并以最后一个移动平均值作为趋势变各年的趋势变动值求移动平均,并以最后一个移动平均值作为趋势变动值。动值。(5)计算绝对误差、平均绝对误差 绝对误差=(6)建立预测模型第38页/共105页应应 用用1 1 我国19852003年的发电总量基本呈直线上升趋势,具体资料如表所示,请你预测2004年和2005年的发电总量?我国发电总量及一次移动平均值计算表第39页/共105页年份发电总量ytN=7时趋势变动值移动平均趋势变动值1985676198482519857741986716 924.86924.8619879401046.00121.14198811591166.43120.43198913841279.00130.57199015241474.43177.43 146.84146.84199116681630.29155.86155.98199216681783.86153.57166.08199319581952.71168.86176.16199420312137.86185.15177.73199522342329.00191.14185.73199625662530.14201.14195.14199728202718.57188.43227.4219983006293043211.86199930933149.86219.43200032773370.00220.14200135142002377020034107第40页/共105页t t50004000300020001000 0y yt t1985 1990 1995 2000 2005 图 我国19852003发电量及一次移动平均值的散点图解解:(1 1)绘制散点图绘制散点图由散点图可以看出,发电量基本呈直线上升趋势,可用移动平均法进行预测。N=7时移动平均曲线观察值曲线(2 2)选择跨越期)选择跨越期 取取N=7N=7。第41页/共105页第42页/共105页第43页/共105页 由上可知,趋势变动值采用不同的算法,其结果很不一样,这三答案都是对的。那么在实际的预测中到底采用哪一个预测值呢?只有决策才能最后选定。第44页/共105页1 1、二次移动平均法原理、二次移动平均法原理 二次移动平均法是对一组时间序列数据先后进行两次移动平均,即在一次的基础上,再进行第二次移动的平均,并根据最后的两个移动平均值的结果建立预测模型,求得预测值。二次移动平均法与一次移动平均法关系密切。第一,第一,一次移动平均法,存在滞后偏差,使移动平均值滞后于实际观察值的 期,而二次移动平均法正是利用这一滞后偏差,把一次、二次移动平均值置于跨越期末的水平上,并建立预测模型,求得预测值。第二第二 ,二次移动平均法不是一种独立的方法,它必须在一次移动平均值的基础上再进行第二次移动平均,同时,要与一次移动平均值(最后一项的一次移动平均值)一起才能建立预测模型进行预测。(二)二次移动平均法(二)二次移动平均法第45页/共105页2 2、二次移动平均值计算方法、二次移动平均值计算方法第46页/共105页(1)选择跨越期 一般情况下,求二次移动平均时,采用与一次相同的跨越期。(2)计算一次移动平均值(的第一个放在n=7上 )(3)计算二次移动平均值(的第一个放在n=7上 )(4)建立二次移动平均法预测模型二次移动平均法预测步骤二次移动平均法预测步骤第47页/共105页应用应用3 3 时间序列的数据资料如应用2,试用二次移动平均法预测2006年、2007年的发电量。解:(1)选择跨越期 n=7。(2)计算 、(3)建立二次预测模型 见表第48页/共105页观察期观察值 N=7,N=7,196567619668251967774196871619699401970115919711384 924.86924.86197215241046.00197316681166.43197416681279.00197519581474.43197620311630.29197722341783.86 1331.84 1331.84197825661952.711478.67197928202137.861634.65198030062329.001800.74198130932530.141976.90198232772718.572145.63198335142930432340.37198437703149.863535.51198541073370.002737.98一次、二次移动计算表第49页/共105页 前面介绍的移动平均法移动平均法存在两个不足之处,一一是存储数据数量较大,二是对最近的是存储数据数量较大,二是对最近的N N期数据等权期数据等权看待,而看待,而 对对t-Tt-T期以前的数据则完全不考虑。期以前的数据则完全不考虑。因此,预测的结果准确度不高预测的结果准确度不高。指数平滑指数平滑法法却有效的克服却有效的克服了这两个缺点。了这两个缺点。它既不需要存储大量的历史数据,又考虑了各期数据的重要性,而且使用了全部历史资料。因此,指数平滑移动平均法的改进和发展,应用极为广泛。指数平滑法指数平滑法根据平滑的次数不同,可分为一次指数平滑、二次指数平滑、三次指数平滑等。分别介绍如下:第三节第三节 指数平滑指数平滑第50页/共105页(一)一次指数平滑原理(一)一次指数平滑原理(Once index gloss)设时间序列为x1 1,x2 2,xt t一次指数平滑公式为:(2)(1)(3)(4)一、一次指数平滑一、一次指数平滑第51页/共105页对(对(1 1)进行展开,)进行展开,有:第52页/共105页(5)由(5)可知一次指数平滑特点:(1)(2)由于由于加权系数符合指数规律加权系数符合指数规律,又具有平滑功能,又具有平滑功能,故称为指数平滑。第53页/共105页3 3、权重之和为、权重之和为1 1,即:令误差et t=xt t-Ft t在指数递推公式(4)中,第54页/共105页 的选择,既是指数平滑法指数平滑法的灵魂所在,又是应用指数平滑法的难点之一,迄今没有从理论上完全解决,它的确定带有一定的经验性。通常取值方法应遵循下列原则:1 1、当xt t波动较大时波动较大时,取=0.10.3 (滤去季节波动、不规则变动不规则变动,使预测模型不易受它们的影响,保留长使预测模型不易受它们的影响,保留长期趋势描述实际观察值期趋势描述实际观察值)2 2、当xt t波动较小时波动较小时,取=0.60.8,(加大近期数据(加大近期数据的比重,提高修正误差程度使预测模型保留长期趋势的比重,提高修正误差程度使预测模型保留长期趋势来描述实际观察值来描述实际观察值)3 3、在实际应用中,可取若干个可取若干个 值进行比较,选择一值进行比较,选择一个误差最小的个误差最小的。(二)(二)的选择的选择 第55页/共105页 用一次指数平滑进行预测,除了选择的值外,还要确定初始值确定初始值 初始值是预测者估计或指定的。1 1、当时间序列N10N10时时,此时的此时的 对以后预测值的影对以后预测值的影响较小,响较小,故可直接选用第一个观察值即:2 2、当时间序列N N1010时时,此时的此时的 对以后的预测值的对以后的预测值的影响较大,影响较大,这时一般采用最初几期的观察值的算术最初几期的观察值的算术平均值作为初始值平均值作为初始值。(三)初始值的确定(三)初始值的确定第56页/共105页(四)一次指数平滑预测步骤1、确定初始值2、选定平滑系数:(若不能确定,可选不同的)3、计算一次指数平滑值4、计算预测值:5、计算各标准差S,选择一个Smin,6、确定预测值:第57页/共105页 某商店某商店1995199520042004年销售额资料如表所示。年销售额资料如表所示。试预测试预测20052005年销售额为多少万元?并已知:年销售额为多少万元?并已知:=0.2,=0.3,=0.8,S=0.2,=0.3,=0.8,S0 0=x=400=x=400年份1995199619971998199920002001200220032004销售额400450503551602657709758809862表 19952004年商品销售额及一次指数平滑法计算表一次指数平滑预测法举例第58页/共105页 2、的取值 历年的销售额都是逐年稳步上升,故可取 的值小一些,本题取=0.2 3、为了对值有一个较深刻的认识 不妨,取=0.5和=0.8进行比较。年年销.售额=0.5=0.2实际实际观察值图 一次指数平滑思考:第59页/共105页第60页/共105页19952004年商品销售额及一次指数平滑法计算表年份销售额 =0.2=0.2=0.5=0.5=0.8=0.8=0.2=0.2=0.5=0.5=0.8=0.819954004004004004004004000 00 00 019964504104104254254404404040252510101997503428.6428.6464464490.4490.474.474.4393912.612.61998551453.1453.1507.5507.5538.9538.997.997.943.543.512.112.11999602482.9482.9554.8554.8589.4589.4119.1119.147.247.212.612.62000657517.7517.7605.9605.9643.5643.5139.3139.351.151.113.513.52001709556.0556.0657.4657.4659.9659.9153.0153.051.651.613.113.12002758596.4596.4707.7707.7745.6745.6161.6161.650.350.312.412.42003809638.9638.9758.4758.4796.3796.3170.1170.150.650.612.712.72004862683.5683.5810.2810.2848.9848.9178.5178.551.851.813.113.1第61页/共105页(4 4)预测值)预测值 (5 5)计算标准差)计算标准差S S,确定预测值,确定预测值 当=0.2时,S1=106062.9 =0.5时,S2=1931.4 =0.8时,S3=140.4 S3=140.4 最小,预测值为:第62页/共105页1、二次指数平滑原理二次指数平滑原理 一次指数平滑一次指数平滑虽然克服了移动平均法的缺点,但当时间序列的变动出现直线趋势时,用一次指数平滑发法进行预测,仍存在明显的滞后偏差仍存在明显的滞后偏差。因此,必须加以修正。修正的方法与趋势移动平均法相同,即再作二次指数平滑,利用滞后偏差的规律建立直线趋势模型。与一次指数平滑公式基本相似,二次指数平滑基本公式为:2、二次指数平滑预测模型二次指数平滑预测模型为二、二次指数平滑二、二次指数平滑第63页/共105页 某公司某公司1990199020042004年销售收入年销售收入y yt t如表所示,如表所示,试用二次指数平滑法预测试用二次指数平滑法预测20052005年和年和20062006年的销年的销售收入各为多少万元?售收入各为多少万元?年份199019911992199319941995199619971998199920002001200220032004销售额6768257747169401159138415241468166819582031223425662820 表4-11 历年销售收入数据 单位:万元二次指数平滑预测法举例第64页/共105页思考1、确定初始值表中的历年实际销售收入可知变化不大,随时间的推移,销售收入逐年增加,并且N=1510 =6762、确定平滑指数 历史资料表明基本上是长期稳定的增加的,应取小一些,令=0.3注意:二次指数平滑预测可用线性趋势数据的方法 进行预测。第65页/共105页第66页/共105页年t19901676676676676676676.0019912825720.7720.7689.4689.4652.013.4676.019923774736.7736.7703.6703.6769.814.2765.419934716730.5730.5711.7711.7749.38.1784.019945940793.3793.3736.2736.2850.424.5757.4199561159903.0903.0786.2786.21019.850.1874.91996713841047.31047.3864.5864.51230.178.31069.91997815421190.31190.3962.3962.31418.397.71308.41998914681273.61273.61055.71055.71491.593.41516.019991016681391.91391.91156.51156.51627.3100.91584.920001119581561.81561.81278.11278.11845.5121.61728.220011220311702.51702.51405.41405.41999.6127.31967.120021322341862.01862.01542.41542.42181.6137.02126.920031425662073.22073.21701.61701.62444.8159.32318.620041528202297.22297.21880.31880.32714.1178.72604.1表4-11 历年销售收入数据 单位:万元第67页/共105页 趋势外推法趋势外推法是根据某一事件的历史规律,寻求该事件的变化规律,从而推出事件未来状况的一种比较常见的预测方法。利用趋势外推法进行预测,主要包括六阶段:(1)选择所需的预测的参数(2)收集必要的数据(3)利用数据拟和曲线(最小二乘法最小二乘法)(4)趋势外推(直线、对数、曲线)(5)预测说明(6)研究预测结果在进行决策中应用的可能性。第四节第四节 线性外推预测法线性外推预测法第68页/共105页 1、拟合直线方程法的数学模型 依据的是最小二乘法,是将时间序列拟合成一条直线趋势,使该直线上的预测值与实际值之间的离差和为最小。设n(x1 1,y1 1),(x2 2,y2 2),(xn n,yn n)它们的位置如图,代求的拟合直线AB,它使n个观察值对该直线的离差分别为e1 1,e2 2,en n。其中在AB上方一侧的离差为正离差,下方一侧的离差为负离差。若简单的以离差代数和 的大小来反映该直线是否是最佳拟合直线,则可能出现正、负离差的相互抵消使离差的代数和变小,甚至出现完全抵消的情况,即:,这时的拟合直线并非没有偏差。(x1 1,y1 1)(x2 2,y2 2)(x4 4,y4 4)(x3 3,y3 3)ei i (x5 5,y5 5)ei iei i图 拟合直线方程原理一、直线趋势外推法一、直线趋势外推法第69页/共105页(1)最小二乘法原理最小二乘法原理(Least Square Method)在Q中,描述了直线方程yt t=a+bx与n个观察点的接近程度。误差的大小随直线的位置变化而变化。即误差误差的值会随着的值会随着 a a和和b b 不同而变化不同而变化。即是 a和b的二元函数。第70页/共105页 为了使误差最小,即Q为最小值;可分别对a,b求偏导,并令其为0.则有:注意:在确定直线方程时,时间序列为奇数时,取中间数(n+1/2)的编号为0,那么x的编号就构成了以0中心,的正、负数对称的编号。例如,当n=9时,9+1/2=5,那么就可以编成-4,-3,-2,-1,0,1,2,3,4,这时由于x=0,可简化计算。(2)(4)(5)(3)第71页/共105页(6)(7)2 2、拟合直线方程的步骤、拟合直线方程的步骤(1)绘制散点图(2)列表计算求待定系数所需的数据(3)确定待定系数a、b,建立预测模型(4)用拟合直线方程求预测值第72页/共105页 某家用电器厂1994年2004年利润数据资料如表4-14所示,试预测2005、2006年利润各为多少?年份19941995199619971998199920002001200220032004销售额2003003504005006306307007508509501020解:解:(1)画散点图并观察各个点变化趋势是否可用直线方程来拟合。(2)列表计算求待定系数所需要的数据资料,由于时间序列为11个,即n+1/2=11+1/2=6。故以1990年为中点编号:-5,-4,-3,-2,-1,0,1,2,3,4,5。1994 1995 1996 1997 1998 1999 12001000 800 600 400 200图 直线绘制图表 某家用电器厂1985年1995年利润及拟合直线方程法计算表 单位:万元线性外推趋势预测法举例中心中心第73页/共105页表的以左边x=0,yt t=6650,x=110;xyt t=9100.表的右边以0,1,10对自变量x 进行编号,并求得:x=55,x=385;xyt t=42350(3)确定待定系数,建立预测模型 按表的左边x编号,有:a=yt t/n=6650/11=604.3 b=xy/x=9100/110=82.7 故左边预测的直线方程为:按表右边的x编号方法有:第74页/共105页年份利润yi ixxxyt t 左边左边左边左边 xxxyt t 右边右边右边右边1994200-525-1000191.0191.0000191.0191.01995300-416-2000273.7273.711300273.7273.71996350-39-1050356.4356.424700356.4356.41997400-24-800439.1439.1391200439.1439.11998500-11-500521.8521.84162000521.8521.819991999630000604.5604.55253150604.5604.5200070011700687.2687.26364200687.2687.22001750241500769.9769.97495250769.9769.92002850392550852.6852.68646800852.6852.620039504163800935.3935.39818550935.3935.32004102052551001018.01018.010100102001018.01018.06650011091005538542350 表 某家用电器厂1994年1904年利润及拟合直线方程法计算表 单位:万元第75页/共105页(4)用拟合直线方程求预测值 分别按左、右边直线方程 进行预测结果相同,故拟合直线有效。见表3 3、特点、特点(1)拟合直线方程的一阶差分为一常数一阶差分为一常数,即:(2)直线外推法直线外推法只适用时间序列呈直线趋势时间序列呈直线趋势预测。(3)无论远、近的数据不考虑权重。(4)用最小二乘法最小二乘法拟合直线方程消除了不规则的影响,使内插值和外推值内插值和外推值都落在拟合的直线上。第76页/共105页原理原理原理原理 拟合直线方程根据最小二乘法原理,