复旦金融用随机过程31-随机过程.ppt
1随机过程随机过程2n 在概率论与数理统计中的讨论的随机现象,通常有一个或有穷多个随机变量去描述,所考虑到的试验结果,一般地可用于一个或有穷多个数来表示。n 许多随机现象仅研究一个或有求多个随机变量,不能揭示有些随机现象的全部统计规律。因为在研究这些现象时,必须考虑变化过程,它所考虑的实验结果要用一个函数或有穷多个数来表示,随机过程的诞生和发展,就是适应这一客观需要的。n 鞅也是现代金融理论的一个核心工具。引言引言3n 随机过程的定义随机过程的定义n 随机过程的分类随机过程的分类 n 按统计特性是否变化分为平稳随机过程和非平稳随机过程按统计特性是否变化分为平稳随机过程和非平稳随机过程n 按照是否具有记忆性分为纯粹随机过程、按照是否具有记忆性分为纯粹随机过程、Markov过程、独立增量过程过程、独立增量过程n 按照一阶变差是否有限分类:若随机过程按照一阶变差是否有限分类:若随机过程 tt0的一阶变差有限,的一阶变差有限,称为有界变差过程。称为有界变差过程。n 按照二阶矩是否有限分类:若随机过程的均值和方差都有限,称为二按照二阶矩是否有限分类:若随机过程的均值和方差都有限,称为二阶矩过程,例如前面提到的宽平稳过程。阶矩过程,例如前面提到的宽平稳过程。n 按照概率分布特征分类:如按照概率分布特征分类:如Weiner过程,过程,Poission过程等。过程等。n最常见的随机过程或随机模型最常见的随机过程或随机模型 主要内容主要内容4n 概率空间概率空间(,F,Ft t,P)上的一簇在上的一簇在Rn中取值的随中取值的随机变量机变量 t,t 就称为随机过程,其中就称为随机过程,其中 t:Rn,t通通常理解为时间,常理解为时间,为为0,+)或其中的子集,或其中的子集,Ft为为F上的子上的子 代数,且当代数,且当t s时,时,Ft Fs,于是称,于是称Ft t 为为F 中的中的 代数流,代数流,(,F,Ft t,P)也常被称为是带也常被称为是带 代数流代数流的概率空间。若的概率空间。若为为0,+)中的连续区间,即时间参数属中的连续区间,即时间参数属于于0,+)中的连续区间,则称中的连续区间,则称 t,t 是连续时间的随是连续时间的随机过程;若机过程;若t=0,1,2,,则称为离散时间的随机过程。,则称为离散时间的随机过程。n 显然,随机过程的随机性既与时间有关,又与由显然,随机过程的随机性既与时间有关,又与由决定的决定的不确定性有关。另外,我们会经常用到由随机过程不确定性有关。另外,我们会经常用到由随机过程 t产产生的生的代数流,其中,即是由代数流,其中,即是由t时刻以前的时刻以前的 t产生的产生的代代数,也是使得数,也是使得 t可测的最小的可测的最小的代数。代数。随机过程的定义随机过程的定义5n按按统统计计特特性性是是否否变变化化分分为为平平稳稳随随机机过过程程和和非平稳随机过程非平稳随机过程 统计特性不随时间变化而变化的随机过程,称统计特性不随时间变化而变化的随机过程,称为平稳过程,否则,统计特性随时间变化而变化的为平稳过程,否则,统计特性随时间变化而变化的随机过程,称为非平稳过程。随机过程,称为非平稳过程。平稳过程的严格定义为:对于时间平稳过程的严格定义为:对于时间t 的的n个任个任意的时刻意的时刻t1,t2,tn 和任意实数和任意实数C,若随机过程,若随机过程 t t0的分布函数满足的分布函数满足Fn(x1,x2,xn;t1,t2,tn)=Fn(x1,x2,xn;t1+C,t2+C,tn+C),则称为平稳过程。则称为平稳过程。随机过程的分类随机过程的分类平稳随机过程平稳随机过程6 平平稳稳随随机机过过程程在在实实际际应应用用中中有有诸诸多多不不便便,于于是是人人们们又又提提出出了了宽宽平平稳稳随随机机过过程程:若若随随机机过过程程 t t0的的均均值值和和协协方方差差存存在在,且且对对任任意意t 0,s 0,都都有有E t=a,Cov(t,t+s)=R(s),则则称称为为宽宽平平稳稳过过程或二阶平稳过程。程或二阶平稳过程。宽宽平平稳稳的的不不变变性性表表现现在在统统计计平平均均的的一一、二二阶阶矩矩上上,而而平平稳稳过过程程的的不不变变性性表表现现在在统统计计平平均均的的概概率率分分布布上上,所所以以二二者者不不同同,并并且且不不能能由由平平稳稳随随机机过过程程得得到到宽宽平平稳稳随随机机过过程程。二二阶阶矩矩存存在在的的平平稳稳随随机机过过程程一一定定是是宽宽平稳随机过程。平稳随机过程。73.1 3.1 时间序列的平稳性及其检验时间序列的平稳性及其检验一、问题的引出:非平稳变量与经典回归一、问题的引出:非平稳变量与经典回归模型模型二、时间序列数据的平稳性二、时间序列数据的平稳性三、平稳性的单位根检验三、平稳性的单位根检验四、单整、趋势平稳与差分平稳随机过程四、单整、趋势平稳与差分平稳随机过程8一、问题的引出:非平稳变量与经典一、问题的引出:非平稳变量与经典回归模型回归模型9常见的数据类型常见的数据类型到目前为止,经典计量经济模型常用到的数据有:到目前为止,经典计量经济模型常用到的数据有:时间序列数据时间序列数据(time-series data);截面数据截面数据(cross-sectional data)混合截面数据混合截面数据(pooled cross-section data)面板数据面板数据(panel data)时间序列数据是最常见,也是最常用到的数据时间序列数据是最常见,也是最常用到的数据。10经典回归模型与数据的平稳性经典回归模型与数据的平稳性经典回归分析暗含着一个重要假设:经典回归分析暗含着一个重要假设:数据是平稳的。数据是平稳的。数据非平稳数据非平稳,大样本下的统计推断基础大样本下的统计推断基础“一致性一致性”要求要求被破怀。被破怀。经典回归分析的假设之一:解释变量经典回归分析的假设之一:解释变量X是非随机变是非随机变量量放宽该假设:放宽该假设:X是随机变量,则需进一步要求:是随机变量,则需进一步要求:(1)X与随机扰动项与随机扰动项 不相关不相关 Cov(X,)=0依概率收敛:依概率收敛:(2)11 第(2)条是为了满足统计推断中大样本下的“一致性”特性:第(1)条是OLS估计的需要如果如果X是非平稳数据(如表现出向上的趋势),是非平稳数据(如表现出向上的趋势),则(则(2)不成立,回归估计量不满足)不成立,回归估计量不满足“一致性一致性”,基,基于大样本的统计推断也就遇到麻烦。于大样本的统计推断也就遇到麻烦。因此:注意:注意:在双变量模型中:在双变量模型中:12 表现在表现在:两个本来没有任何因果关系的变量,却两个本来没有任何因果关系的变量,却有很高的相关性有很高的相关性(有较高的R2):例如:例如:如果有两列时间序列数据表现出一致的变化趋势(非平稳的),即使它们没有任何有意义的关系,但进行回归也可表现出较高的可决系数。在现实经济生活中在现实经济生活中:情况往往是实际的时间序列数据是非平稳的实际的时间序列数据是非平稳的,而且主要的经济变量如消费、收入、价格往往表现为一致的上升或下降。这样,仍然通过经典的因果关仍然通过经典的因果关系模型进行分析,一般不会得到有意义的结果。系模型进行分析,一般不会得到有意义的结果。数据非平稳,往往导致出现数据非平稳,往往导致出现“虚假回归虚假回归”问题问题13 时间序列分析时间序列分析模型方法模型方法就是在这样的情况下,以通过揭示时间序列自身的变化规律为主线而发以通过揭示时间序列自身的变化规律为主线而发展起来的全新的计量经济学方法论展起来的全新的计量经济学方法论。时间序列分析时间序列分析已组成现代计量经济学的重要内容,并广泛应用于经济分析与预测当中。14二、时间序列数据的平稳性二、时间序列数据的平稳性15 时间序列分析中首先遇到的问题首先遇到的问题是关于时间序列数据的平稳性平稳性问题。假定某个时间序列是由某一随机过程假定某个时间序列是由某一随机过程(stochastic process)生成的,即假定时间序列)生成的,即假定时间序列Xt(t=1,2,)的每一个数值都是从一个概率分)的每一个数值都是从一个概率分布中随机得到,如果满足下列条件:布中随机得到,如果满足下列条件:1)均值)均值E(XE(Xt t)=)=是是与时间与时间t 无关的常数;无关的常数;2)方差)方差Var(XVar(Xt t)=)=2 2是是与时间与时间t 无关的常数;无关的常数;3)协方差)协方差Cov(XCov(Xt t,X,Xt+kt+k)=)=k k 是是只与时期间隔只与时期间隔k有关,有关,与时间与时间t 无关的常数;无关的常数;则称该随机时间序列是平稳的(则称该随机时间序列是平稳的(stationary),而,而该随机过程是一平稳随机过程(该随机过程是一平稳随机过程(stationary stochastic process)。)。16 例例一个最简单的随机时间序列是一具有零均值同方差的独立分布序列:Xt=t ,tN(0,2)例例另一个简单的随机时间列序被称为随随机机游游走走(random walk),该序列由如下随机过程生成:Xt=Xt-1+t这里,t是一个白噪声。该序列常被称为是一个白噪声(白噪声(white noise)。由于Xt具有相同的均值与方差,且协方差为零,由定义,一个白噪声序列是平稳的一个白噪声序列是平稳的。17 为了检验该序列是否具有相同的方差,可假设Xt的初值为X0,则易知 X1=X0+1 X2=X1+2=X0+1+2 X Xt t=X=X0 0+1+2+t 由于X0为常数,t是一个白噪声,因此Var(Xt)=t2 即即Xt的的方方差差与与时时间间t t有有关关而而非非常常数数,它它是是一一非非平平稳稳序序列。列。容易知道该序列有相同的均值均值:E(Xt)=E(Xt-1)18然而,对X取一阶差分一阶差分(first difference):Xt=Xt-Xt-1=t由于t是一个白噪声,则序列Xt是平稳的。后面将会看到后面将会看到:如果一个时间序列是非平稳的,如果一个时间序列是非平稳的,它常常可通过取差分的方法而形成平稳序列它常常可通过取差分的方法而形成平稳序列。事事实实上上,随随机机游游走走过过程程是是下下面面我我们们称称之之为为1 1阶阶自自回回归归AR(1)AR(1)过程的特例过程的特例 X Xt t=X Xt-1t-1+t 不不难难验验证证:1)|1|1时时,该该随随机机过过程程生生成成的的时时间间序序列列是是发发散散的的,表表现现为为持持续续上上升升(1)1)或或持持续续下下降降(-1)1),因此是非平稳的;,因此是非平稳的;19 可以证明可以证明:只有当只有当-1-1 111或或=1=1时,时间序时,时间序列是非平稳的列是非平稳的;对应于(*)式,则是 00或或 =0。24因此,针对式 X Xt t=+X Xt-1t-1+t t 我们关心的检验为:零假设零假设 H0:=0。备择假设备择假设 H1:0 上述检验可通过上述检验可通过OLS法下的法下的t检验完成。检验完成。然而,在零假设(序列非平稳)下,即使在大样本下t统计量也是有偏误的,通常的t 检验无法使用。Dicky和Fuller于1976年提出了这一情形下t统计量服从的分布(这时的t统计量称为 统统计计量量),即DF分布分布(见表)。由于t统计量的向下偏倚性,它呈现围绕小于零值的偏态分布。25 因此,可通过OLS法估计 X Xt t=+X Xt-1t-1+t t 并计算t统计量的值,与DF分布表中给定显著性水平下的临界值比较:如果:如果:t临界值,则拒绝零假设临界值,则拒绝零假设H0:=0,认为时间序列不存在单位根,是平稳的。认为时间序列不存在单位根,是平稳的。26注意:在不同的教科书上有不同的描述,但是注意:在不同的教科书上有不同的描述,但是结果是相同的。结果是相同的。例如:例如:“如果计算得到的如果计算得到的t统计量的绝对值大于统计量的绝对值大于临界值的绝对值,则拒绝临界值的绝对值,则拒绝=0”的假设,原序的假设,原序列不存在单位根,为平稳序列。列不存在单位根,为平稳序列。27 进一步的问题进一步的问题:在上述使用 X Xt t=+X Xt-1t-1+t t对时间序列进行平稳性检验中,实实际际上上假假定定了了时时间间序序列列是是由具有白噪声随机误差项的一阶自回归过程由具有白噪声随机误差项的一阶自回归过程AR(1)生成的生成的。但但在在实实际际检检验验中中,时时间间序序列列可可能能由由更更高高阶阶的的自自回回归归过过程程生生成成的的,或或者者随随机机误误差差项项并并非非是是白白噪噪声声,这样用OLS法法进进 行行 估估 计计 均均 会会 表表 现现 出出 随随 机机 误误 差差 项项 出出 现现 自自 相相 关关(autocorrelation),导致DF检验无效。另另外外,如果时间序列包含有明显的随时间变化的某种趋势(如上升或下降),则也容易导致上述检验中的自自相相关随机误差项问题关随机误差项问题。为了保证DF检验中随机误差项的白噪声特性,Dicky和Fuller对DF检验进行了扩充,形成了ADF(Augment Dickey-Fuller)检验)检验。2 2、ADFADF检验检验28ADF检验是通过下面三个模型完成的:检验是通过下面三个模型完成的:模模型型3 中中的的t是是时时间间变变量量,代表了时间序列随时间变化的某种趋势(如果有的话)。检检验验的的假假设设都都是是:针针对对H1:0,检检验验 H0:=0,即即存存在在一一单单位位根根。模型1与另两模型的差别在于是否包含有常数项和趋势项。29 实际检验时从模型3开始,然后模型2、模型1。何时检验拒绝零假设,即原序列不存在单位根,为平稳序列,何时检验停止。否则,就要继续检验,直到检验完模型1为止。检验原理检验原理与DF检验相同,只是对模型1、2、3进行检验时,有各自相应的临界值。表给出了三个模型所使用的ADF分布临界值表。3031同时估计出上述三个模型的适当形式,然后通过ADF临界值表检验零假设H0:=0。1)只只要要其其中中有有一一个个模模型型的的检检验验结结果果拒拒绝绝了了零零假假设设,就可以认为时间序列是平稳的;就可以认为时间序列是平稳的;2)当当三三个个模模型型的的检检验验结结果果都都不不能能拒拒绝绝零零假假设设时时,则则认为时间序列是非平稳的。认为时间序列是非平稳的。这里所谓模模型型适适当当的的形形式式就是在每个模型中选取适当的滞后差分项,以以使使模模型型的的残残差差项项是是一一个个白白噪噪声声(主要保证不存在自相关)。一个简单的检验过程:一个简单的检验过程:32四、单整、趋势平稳与差分平稳随机四、单整、趋势平稳与差分平稳随机过程过程33 随机游走序列 Xt=Xt-1+t经差分后等价地变形为 Xt=t 由于t是一个白噪声,因此差差分分后后的的序序列列 Xt是平稳的。是平稳的。单整单整34 一般地,如果一个时间序列经过一般地,如果一个时间序列经过d次差分后变成平稳序次差分后变成平稳序列,则称原序列是列,则称原序列是d 阶单整(阶单整(integrated of d)序列,记)序列,记为为I(d)。显然,I(0)代表一平稳时间序列代表一平稳时间序列。现实经济生活中现实经济生活中:1)只有少数经济指标的时间序列表现为平稳的,如利率等只有少数经济指标的时间序列表现为平稳的,如利率等;2)大大多多数数指指标标的的时时间间序序列列是是非非平平稳稳的的,如如一一些些价价格格指指数数常常常常是是2阶阶单单整整的的,以以不不变变价价格格表表示示的的消消费费额额、收收入入等等常常表表现现为为1阶单整。阶单整。大大多多数数非非平平稳稳的的时时间间序序列列一一般般可可通通过过一一次次或或多多次次差差分分的的形形式变为平稳的。式变为平稳的。但但也也有有一一些些时时间间序序列列,无无论论经经过过多多少少次次差差分分,都都不不能能变变为为平稳的。这种序列被称为平稳的。这种序列被称为非单整的(非单整的(non-integrated)。如果一个时间序列经过一次差分变成平稳的,就称原如果一个时间序列经过一次差分变成平稳的,就称原序列是序列是一阶单整(一阶单整(integrated of 1)序列)序列,记为,记为I(1)。35例例3.1.8 中国支出法GDP的单整性。经过试算,发现中中国国支支出出法法GDP是是1阶阶单单整整的的,适当的检验模型为36例例3.1.9 中国人均居民消费与人均国内生产总值的单整性。经过试算,发现中中国国人人均均国国内内生生产产总总值值GDPPC是是2阶阶单单整的整的,适当的检验模型为 同样地,CPC也是也是2阶单整的阶单整的,适当的检验模型为37 趋势平稳与差分平稳随机过程趋势平稳与差分平稳随机过程 前文已指出,一些非平稳的经济时间序列往往表现出共同的变化趋势,而这些序列间本身不一定有直接的关联关系,这时对这些数据进行回归,尽管有较高的R2,但其结果是没有任何实际意义的。这种现象我们称之为虚虚假假回回归归或或伪伪回回归归(spurious regression)。如:用中国的劳动力时间序列数据与美国GDP时间序列作回归,会得到较高的R2,但不能认为两者有直接的关联关系,而只不过它们有共同的趋势罢了,这种回归结果我们认为是虚假的。38为了避免这种虚假回归的产生,通常的做法是引引入入作作为为趋趋势势变变量量的的时时间间,这样包含有时间趋势变量的回归,可以消除这种趋势性的影响。然而这种做法,只有当趋势性变量是确确定定性性的的(deterministic)而非随随机机性性的的(stochastic),才会是有效的。换言之,如如果果一一个个包包含含有有某某种种确确定定性性趋趋势势的的非非平平稳稳时时间间序序列列,可可以以通通过过引引入入表表示示这这一一确确定定性性趋趋势的趋势变量,而将确定性趋势分离出来。势的趋势变量,而将确定性趋势分离出来。391)如果=1,=0,则(*)式成为一一带带位位移移的的随机游走过程随机游走过程:Xt=+Xt-1+t (*)根据的正负,Xt表现出明显的上升或下降趋势。这种趋势称为随机性趋势(随机性趋势(stochastic trend)。2)如果=0,0,则(*)式成为一带时间趋势的随机变化过程:Xt=+t+t (*)根据的正负,Xt表现出明显的上升或下降趋势。这 种 趋 势 称 为 确确 定定 性性 趋趋 势势(deterministic trend)。考虑如下的含有一阶自回归的随机过程:Xt=+t+Xt-1+t (*)其中:t是一白噪声,t为一时间趋势。40 3)如果=1,0,则Xt包含有确定性与随机性确定性与随机性两种趋势。两种趋势。判断一个非平稳的时间序列,它的趋势是随机性的还是确定性的,可通过ADF检验中所用的第3个模型进行。该模型中已引入了表示确定性趋势的时间变量t,即分离出了确定性趋势的影响。因此,(1)如如果果检检验验结结果果表表明明所所给给时时间间序序列列有有单单位位根根,且且时时间间变变量量前前的的参参数数显显著著为为零零,则则该该序序列列显显示出随机性趋势示出随机性趋势;(2)如如果果没没有有单单位位根根,且且时时间间变变量量前前的的参参数数显著地异于零,则该序列显示出确定性趋势。显著地异于零,则该序列显示出确定性趋势。41 随机性趋势可通过差分的方法消除随机性趋势可通过差分的方法消除 如:对式Xt=+Xt-1+t 可通过差分变换为 Xt=+t 该时间序列称为差分平稳过程(差分平稳过程(difference stationary process);42确定性趋势无法通过差分的方法消除,而只能确定性趋势无法通过差分的方法消除,而只能通过除去趋势项消除,通过除去趋势项消除,如:对式Xt=+t+t可通过除去t变换为Xt-t=+t该时间序列是平稳的,因此称为趋势平稳过程趋势平稳过程(trend stationary process)。最后需要说明的是,最后需要说明的是,趋势平稳过程代表了一趋势平稳过程代表了一个时间序列长期稳定的变化过程,因而用于进行个时间序列长期稳定的变化过程,因而用于进行长期预测则是更为可靠的。长期预测则是更为可靠的。