时间序列分析方法1.ppt
《时间序列分析方法1.ppt》由会员分享,可在线阅读,更多相关《时间序列分析方法1.ppt(107页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、11六月2023时间序列分析方法时间序列分析方法1教学大纲教学大纲时间序列的基本概念时间序列的基本概念时间序列数据的数值标度时间序列数据的数值标度时间序列的分解时间序列的分解时间序列的实例时间序列的实例时间序列的基本概念时间序列的基本概念什么是数据什么是数据数据是一种信息,这种信息如以量的标志显现出来,数据是一种信息,这种信息如以量的标志显现出来,就称其为数据。数据是一定条件下客体在量的方面的就称其为数据。数据是一定条件下客体在量的方面的综合表现。在开始一项研究工作时,最基本的工作之综合表现。在开始一项研究工作时,最基本的工作之一,就是收集数据。一,就是收集数据。数据按其本义来说是定量的(计数
2、或计量)的。但在数据按其本义来说是定量的(计数或计量)的。但在实际应用中,它们可以是定量的,也可以是定性的,实际应用中,它们可以是定量的,也可以是定性的,或者是两者的结合。随着人类认识客体技术的提高与或者是两者的结合。随着人类认识客体技术的提高与认识层次的深化,数据的外延还在不断的扩大。认识层次的深化,数据的外延还在不断的扩大。样本数据样本数据 常用的样本数据有三类:常用的样本数据有三类:时间序列数据时间序列数据(Time series dataTime series data),是一批按照时,是一批按照时间先后顺序排列的统计数据间先后顺序排列的统计数据截截面面数数据据(Cross Cross
3、 section section datadata),是是一一批批发发生生在在同同一时间截面上的数据一时间截面上的数据 虚虚拟拟变变量量数数据据(Dummy Dummy variable variable datadata),也也称称为为二二进进制制数数据据,一一般般取取0 0或或1 1。虚虚拟拟变变量量经经常常被被用用在在计计量量经经济济学模型中,以表征政策、条件等因素学模型中,以表征政策、条件等因素时间序列数据时间序列数据时间序列数据又俗称为纵向数据。同一现象在不同时间时间序列数据又俗称为纵向数据。同一现象在不同时间上的相继观察值排列而成的数列上的相继观察值排列而成的数列形式上由现象所属的
4、时间和现象在不同时间上的观察值形式上由现象所属的时间和现象在不同时间上的观察值两部分组成两部分组成时间序列的时间是变化的。常用的时间间隔有:年、季时间序列的时间是变化的。常用的时间间隔有:年、季度、月、周、日度、月、周、日时间序列数据通常存在季节变动和序列相关时间序列数据通常存在季节变动和序列相关自相关自相关(误差的协方差不等于(误差的协方差不等于0 0,即前期误差与后期误差之间,即前期误差与后期误差之间存在相关)存在相关)采纳时间序列数据的注意事项采纳时间序列数据的注意事项样本区间内经济行为的一致性,例如样本区间内经济行为的一致性,例如8080年代后期以来年代后期以来为供大于求(居民收入和出
5、口额),为供大于求(居民收入和出口额),8080年代中期以前年代中期以前为供不应求(资本、劳动等)为供不应求(资本、劳动等)样本点之间数据具有可比性,价值形态出现的数据往样本点之间数据具有可比性,价值形态出现的数据往往是不可比的,应当消除物价因素的影响往是不可比的,应当消除物价因素的影响样本观察值过于集中,不能反映经济变量间的结构关样本观察值过于集中,不能反映经济变量间的结构关系,应增大观测区间系,应增大观测区间时间序列误差项间往往存在序列相关(自相关)时间序列误差项间往往存在序列相关(自相关)截面数据截面数据截面数据又俗称横向数据,是一批发生在同一时间截截面数据又俗称横向数据,是一批发生在同
6、一时间截面上的调查数据。研究某个时点上的变化情况。例如,面上的调查数据。研究某个时点上的变化情况。例如,工业普查数据、人口普查数据、家计调查数据等。工业普查数据、人口普查数据、家计调查数据等。截面数据的时间是凝固的。截面数据的时间是凝固的。截面数据中大多存在异方差,必须引起注意。截面数据中大多存在异方差,必须引起注意。采纳截面数据的注意事项采纳截面数据的注意事项样本点间的同质性(样本与母体的一致性),截面数据很样本点间的同质性(样本与母体的一致性),截面数据很难用于总量估计。难用于总量估计。截面数据一般存在误差项的异方差截面数据一般存在误差项的异方差虚拟变量数据的定义虚拟变量数据的定义虚拟变量
7、是只取虚拟变量是只取1 1或或0 0之一的一个变量,一般用以表示之一的一个变量,一般用以表示定性变量,例如政策变量、条件变量等。定性变量,例如政策变量、条件变量等。虚拟变量组合起来可以表征多种状态。虚拟变量组合起来可以表征多种状态。使用的虚拟变量的个数使用的虚拟变量的个数=欲表征的状态数,欲表征的状态数,3 3种状态只种状态只用用2 2个虚拟变量,若个虚拟变量,若3 3状态采用状态采用3 3个虚拟变量,将造成多个虚拟变量,将造成多重共线。重共线。用虚拟变量表示定性数据用虚拟变量表示定性数据面板数据(面板数据(Panel Data)面板数据是时间序列数据与截面数据的合成体。面板数据是时间序列数据
8、与截面数据的合成体。例如,例如,1978-19991978-1999年我国各省市城镇居民消费结构的调查年我国各省市城镇居民消费结构的调查资料。资料。样本数据的质量样本数据的质量完整性(不能有遗失数据,必要时,采用插值技术补完整性(不能有遗失数据,必要时,采用插值技术补上)上)准确性(准确真实且数据口径方面也符合建模要求)准确性(准确真实且数据口径方面也符合建模要求)可比性(将范围口径和价格口径调整一致)可比性(将范围口径和价格口径调整一致)一致性一致性同质性(样本与母体一致),用同质性(样本与母体一致),用3131个省市个省市的数据作为全国总量模型的数据就违反了一致性的数据作为全国总量模型的数
9、据就违反了一致性完整性完整性指指模模型型中中包包含含的的所所有有变变量量都都必必须须得得到到相相同同容容量量的的样样本本观观测测值值。这这既既是是模模型型参参数数估估计计的的需需要要,也也是是经经济济现现象象本身应该具有的特征本身应该具有的特征“遗遗失失数数据据”的的现现象象是是经经常常发发生生的的,在在中中国国,经经济济体体制制和和核核算算体体系系都都处处于于转转轨轨之之中中。在在出出现现“遗遗失失数数据据”时时,如如果果样样本本容容量量足足够够大大,样样本本点点之之间间的的联联系系并并不不紧紧密密的的情况下,可以将情况下,可以将“遗失数据遗失数据”所在的样本点整个去掉所在的样本点整个去掉如
10、如果果样样本本容容量量有有限限,或或者者样样本本点点之之间间的的联联系系紧紧密密,去去掉掉某某个个样样本本点点会会影影响响模模型型的的估估计计质质量量,则则要要采采取取特特定定的技术将的技术将“遗失数据遗失数据”补上补上准确性准确性准确性有两方面含义:准确性有两方面含义:所所得得到到的的数数据据必必须须准准确确反反映映它它所所描描述述的的经经济济因因素素的的状态,即统计数据或调查数据本身是准确的;状态,即统计数据或调查数据本身是准确的;必必须须是是模模型型研研究究中中所所准准确确需需要要的的,即即满满足足模模型型对对变变量口径的要求;量口径的要求;在在生生产产函函数数模模型型中中,作作为为解解
11、释释变变量量的的资资本本、劳劳动动等等必必须须是是投投入入到到生生产产过过程程中中的的、对对产产出出量量起起作作用用的的那那部部分分生生产产要要素素,以以劳劳动动为为例例,应应该该是是投投入入到到生生产产过过程程中中的的、对对产产出出量量起起作作用用的的那那部部分分劳劳动动者者。于于是是,在在收收集集样样本本数数据据时时,就就应应该该收收集集生生产产性性职职工工人人数数,而而不不能能以以全全体体职职工工人人数数作作为为样样本本数数据据,尽尽管管全全体体职职工工人人数数在在统统计计上上是是很很准准确确的的,但但其中有相当一部分与生产过程无关,不是模型所需要的其中有相当一部分与生产过程无关,不是模
12、型所需要的可比性可比性是通常所说的数据口径问题是通常所说的数据口径问题得得到到的的经经济济统统计计数数据据,一一般般可可比比性性较较差差,其其原原因因在在于于统统计计范范围围口口径径的的变变化化和和价价格格口口径径的的变变化化,必必须须进进行行处处理后才能用于模型参数的估计理后才能用于模型参数的估计计计量量经经济济学学方方法法,是是从从样样本本数数据据中中寻寻找找经经济济活活动动本本身身客客观观存存在在的的规规律律性性,如如果果数数据据是是不不可可比比的的,得得到到的的规规律性就难以反映实际律性就难以反映实际不不同同的的研研究究者者研研究究同同一一个个经经济济现现象象,采采用用同同样样的的变变
13、量量和和数数学学形形式式,选选择择的的样样本本点点也也相相同同,但但可可能能得得到到相相差差甚远的结果。原因在于样本数据的可比性甚远的结果。原因在于样本数据的可比性时间数列的编制原则时间数列的编制原则基本原则是保证基本原则是保证可比性可比性,主要包括:,主要包括:时时 间间 上可上可 比比 总体范围可比总体范围可比计算口径可比计算口径可比经济内容可比经济内容可比一致性一致性指母体与样本的一致性指母体与样本的一致性违反一致性的情况经常会发生违反一致性的情况经常会发生用用企企业业的的数数据据作作为为行行业业生生产产函函数数模模型型的的样样本本数数据据,用用人人均均收收人人与与消消费费的的数数据据作
14、作为为总总量量消消费费函函数数模模型型的的样样本本数数据据,用用3131个个省省份份的的数数据据作作为为全全国国总总量量模模型型的的样本数据,等等。样本数据,等等。时间序列定义时间序列定义一个时间序列时一时间顺序生成的观测值的集合一个时间序列时一时间顺序生成的观测值的集合若该集合是连续的,这层次时间序列为连续型时间序列若该集合是连续的,这层次时间序列为连续型时间序列若该集合是离散的,这层次时间序列为离散型时间序列若该集合是离散的,这层次时间序列为离散型时间序列本课程所讨论的时间序列,是离散型时间序列,其观测值本课程所讨论的时间序列,是离散型时间序列,其观测值按固定时间间隔采样按固定时间间隔采样
15、设设y yt t是时间序列在时刻(或时期)是时间序列在时刻(或时期)t t 的观测值,当在的观测值,当在 t=t=1,2,3,4,5,6,7,n 1,2,3,4,5,6,7,n 采样时,得到时间序列:采样时,得到时间序列:y y1 1,y,y2 2,y,y3 3,y y4 4,y y5 5,y y6 6,y yn n定义定义时间数列时间数列又称为动态数列。又称为动态数列。把反映某一现象发展变化的一系列指标数值把反映某一现象发展变化的一系列指标数值按时间先后顺序排列起来所形成的数列。按时间先后顺序排列起来所形成的数列。两个基本要素:现象所属时间、指标数值。两个基本要素:现象所属时间、指标数值。时
16、间序列的分类时间序列的分类时间序列时间序列平均数序列平均数序列绝对数序列绝对数序列相对数序列相对数序列时期序列时期序列时点序列时点序列时间序列的分类时间序列的分类总量指标数列(绝对数时间数列)总量指标数列(绝对数时间数列)最基本的时间数列;最基本的时间数列;反映现象在不同时间上达到的绝对水平、总规模;反映现象在不同时间上达到的绝对水平、总规模;按指标所反映的时间状况不同分为:按指标所反映的时间状况不同分为:时期数列时期数列现象在不同时段内的活动总量;现象在不同时段内的活动总量;时点数列时点数列现象在不同瞬间时点上的总量。现象在不同瞬间时点上的总量。二者的主要区别在于:时间状况、指标数值的可加性
17、、及二者的主要区别在于:时间状况、指标数值的可加性、及指标数值与时间长短的关系等方面。指标数值与时间长短的关系等方面。相对指标数列(相对数时间序列)相对指标数列(相对数时间序列)平均指标数列(平均数时间序列)平均指标数列(平均数时间序列)时间序列的分类时间序列的分类这两种数列都是由有关总量时间数列派生的;这两种数列都是由有关总量时间数列派生的;反映现象相对水平或平均水平的发展变化过程;反映现象相对水平或平均水平的发展变化过程;不同时间上的指标数值不能相加。不同时间上的指标数值不能相加。时间序列的水平分析指标时间序列的水平分析指标发展水平发展水平平均发展水平平均发展水平增长量增长量平均增长量平均
18、增长量时间数列水平分析时间数列水平分析时间数列水平分析指标时间数列水平分析指标发展水平发展水平现象在不同时间上所达到的水平的数量反映。现象在不同时间上所达到的水平的数量反映。也就是时间数列中的各项指标数值。也就是时间数列中的各项指标数值。按指标表现形式不同分为总量水平、相对水平、平均水按指标表现形式不同分为总量水平、相对水平、平均水平。平。按其在数列中的位置来看,分为最初水平、中间水平和按其在数列中的位置来看,分为最初水平、中间水平和最末水平。最末水平。从在分析中的作用看,分为报告期水平、基期水平从在分析中的作用看,分为报告期水平、基期水平.文字表述:文字表述:“为为”、“(发展、增长(发展、
19、增长)到。)到。”平均发展水平平均发展水平平均发展水平(序时平均数或动态平均数)平均发展水平(序时平均数或动态平均数)现象在不同时间上发展水平的平均数,。现象在不同时间上发展水平的平均数,。说明说明现象在一段时期内所达到的一般水平现象在一段时期内所达到的一般水平。与一般平均数(也可称为静态平均数)的异同与一般平均数(也可称为静态平均数)的异同 :同:同:都是将数量差异抽象化,反映现象的一般水平都是将数量差异抽象化,反映现象的一般水平.异:异:1.1.所平均数值的时间不同。所平均数值的时间不同。2.2.所说明的问题不同。所说明的问题不同。3.3.计算方法也有不同。计算方法也有不同。计算方法:不同
20、类型的时间数列有不同的计算方法。计算方法:不同类型的时间数列有不同的计算方法。总量数列的序时平均数总量数列的序时平均数计算公式:计算公式:计算结果表示:某段时间内平均每期的水平计算结果表示:某段时间内平均每期的水平.例:例:例:例:根据某年各月商品销售收入数据,计算该年的月平均销售收根据某年各月商品销售收入数据,计算该年的月平均销售收根据某年各月商品销售收入数据,计算该年的月平均销售收根据某年各月商品销售收入数据,计算该年的月平均销售收入。入。入。入。时期数列时期数列时期数列时期数列简单算术平均法简单算术平均法简单算术平均法简单算术平均法时点数列时点数列的序时平均数的序时平均数 连续时点数列(
21、已知每天数据,视为连续时点数列)连续时点数列(已知每天数据,视为连续时点数列)连续时点数列(已知每天数据,视为连续时点数列)连续时点数列(已知每天数据,视为连续时点数列)简单算术平均法简单算术平均法简单算术平均法简单算术平均法 不连续时点数列不连续时点数列不连续时点数列不连续时点数列见下页见下页见下页见下页 当时点间隔相等,上式简化为当时点间隔相等,上式简化为当时点间隔相等,上式简化为当时点间隔相等,上式简化为:“:“:“:“首末折半法首末折半法首末折半法首末折半法”先求分段平均数先求分段平均数先求分段平均数先求分段平均数=相邻两点数据的简单算术平均相邻两点数据的简单算术平均相邻两点数据的简单
22、算术平均相邻两点数据的简单算术平均 再求全期总平均数再求全期总平均数再求全期总平均数再求全期总平均数=分段平均数的加权算术平均(权分段平均数的加权算术平均(权分段平均数的加权算术平均(权分段平均数的加权算术平均(权数数数数f=f=f=f=时点间的间隔长度)时点间的间隔长度)时点间的间隔长度)时点间的间隔长度)不连续时点数列计算步骤和公式不连续时点数列计算步骤和公式时间时间1月月1日日5月月31日日8月月31日日12月月31日日人数人数(万人万人)362390416420设设设设某某某某地地地地区区区区1999199919991999年年年年各各各各统统统统计计计计时时时时点点点点的的的的社社社
23、社会会会会劳劳劳劳动动动动者者者者人人人人数数数数如如如如下下下下表表表表,计计计计算算算算全年的平均社会劳动者人数。全年的平均社会劳动者人数。全年的平均社会劳动者人数。全年的平均社会劳动者人数。相对数数列或平均数数列的序时平均数相对数数列或平均数数列的序时平均数 相对数(或平均数)用相对数(或平均数)用相对数(或平均数)用相对数(或平均数)用 y y y y 表示,有表示,有表示,有表示,有 y=x/z y=x/z y=x/z y=x/z,x x x x、z z z z为总量指标。为总量指标。为总量指标。为总量指标。求各期求各期求各期求各期 y y y y 的平均一般的平均一般的平均一般的平
24、均一般不能不能不能不能采用简单算术平均法,即采用简单算术平均法,即采用简单算术平均法,即采用简单算术平均法,即 因为各期数据因为各期数据因为各期数据因为各期数据y y y yt t t t 的对比基础的对比基础的对比基础的对比基础 z z z zt t t t 不同,它们对全期总平不同,它们对全期总平不同,它们对全期总平不同,它们对全期总平均水平的影响作用应轻重有别均水平的影响作用应轻重有别均水平的影响作用应轻重有别均水平的影响作用应轻重有别.计算公式计算公式 分别计算其分子、分母的序时平均数分别计算其分子、分母的序时平均数分别计算其分子、分母的序时平均数分别计算其分子、分母的序时平均数 判断
25、分子和分母是时期指标还是时点指标?判断分子和分母是时期指标还是时点指标?判断分子和分母是时期指标还是时点指标?判断分子和分母是时期指标还是时点指标?对比得对比得对比得对比得 :实例实例计算计算计算计算1986-19991986-19991986-19991986-1999年间:年间:年间:年间:我国第三产业国内生产总值占全部国内生产总值我国第三产业国内生产总值占全部国内生产总值我国第三产业国内生产总值占全部国内生产总值我国第三产业国内生产总值占全部国内生产总值的平均比重的平均比重的平均比重的平均比重 相对数序列的序时平均数(计算结果)相对数序列的序时平均数(计算结果)第三产业国内生产总值的平均
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 时间 序列 分析 方法
限制150内