《BAYES多元时间序列分析方法及其应用.pdf》由会员分享,可在线阅读,更多相关《BAYES多元时间序列分析方法及其应用.pdf(6页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、第 1 9卷 第 2 期 2 0 1 O年 4月 系 统 管 J o u r n a 1 o f S y s t e ms V0 l l 1 9 NO 2 Ap r 2 0 1 0 文章 编 号:1 0 0 5-2 5 4 2(2 0 1 0)0 2 0 1 9 1 0 6 B a y e s多元时 间序 列分 析方法及 其应 用 樊 重 俊(上 海理 工 大学 管理 学 院,上 海 2 0 0 0 9 3)【摘 要】在 条件 似 然 函数 意 义 下,讨论 了基 于矩 阵 正 态-Wi s h a r t 分布 的 多元 时 间序 列 B a y e s分析 方 法,得到 了模型参数的后验分
2、布与一步预 测分布。给 出 了分量方程的对应 结果,说明 了模 型阶数 的推断方法。最后,列出了计算步骤,并作为应用,对上海房地产价格指数数据进行预测建模,取得 了较好效果。关键词:B a y e s方法;多元时间序列;经济预测 中图分类号:N 9 4;F 2 0 1 文献标识码:A Ba y e s i a n App r o a c h f o r M u l t i v a r i a t e Ti m e S e r i e s a nd I t s Ap p l i c a t i o n FAN C h o n g-j u n (Bu s i n e s s S c h o o l
3、,Un i v e r s i t y o f S h a n g h a i f o r S c i e n c e a n d Te c h n o l o g y,S h a n g h a i 2 0 0 0 9 3,Ch i n a)Ab s t r a c t Th e r e h a v e b e e n a l o t o f f a v o u r a b l e Ba y e s i a n c o n t r i b u t i o n s t o u n i v a r i a t e t i me s e r i e s a n a l y s i s Thi s
4、pa p e r s t udi e s Ba ye s i a n a p pr o a c h f o r m u l t i v a r i a t e t i me s e r i e s wi t h c o nd i t i o na l l i ke l i ho o d unc t i o n Fi r s t,t h e p os t e r i o r d i s t r i b ut i on s o f mo de l pa r a me t e r s a n d t he o ne s t e p a h e a d pr e d i c t i ve di s t
5、 r i b ut i o n a r e o b t a i ne dSe c o nd,t he r e s u l t s a b ou t r e l a t i ve c o mpo ne nt e qu a t i o ns a r e g i v e n a nd t he i nf e r e nc e me t h od o f mo de l o r de r i s d i s c us s e d Thi r d,t h e a r i t hm e t i c i s de s c r i b e d,a nd a s i t s a pp l i c a t i o
6、 n,t he f o r e c a s t i ng m o d e l o f S h a n g h a i r e a l e s t a t e p r i c e i n d e x i s s e t u p a n d p e r f o r ms we l 1 Ke y wor d s:Ba ye s a n a l y s i s;m u l t i v a r i a t e t i m e s e r i e s;e c on o m i c f or e c a s t i n g 时间序列 B a y e s 分析方法是近几十年发展起来 的系统分析建模技术。关 于
7、一元时间序列 B a y e s分 析方法与应用的讨论文献众多l_】J。多元 时间序列 B a y e s 分析 方 面也 已有 一些 文献 发 表。L i t t e r ma n _ 5 利用多元 自回归模型 的分量方程,在假定随机误差 项 的方 差 已知 的假 设下,进行 B a y e s 分 析,对 国 民生 产总值 等 7个经 济 指 标 进 行 了预 测,取 得 了很 好 的 效果。张思奇等 的做 法与 L i t t e r ma n相 似,也采 用 了随机先 验(又 称 明 尼 苏 达 先 验 或 L i t t e r ma n先 验)分 布,并更 多地 关注 了季 节 因
8、素 的处理。辛贤_ 7 讨论 了多元 B a y e s动态线性模型(MB-收稿 日期:2 0 0 8 1 2 3 0修订 日期:2 0 0 9 0 6 3 0 基金项 目:上海市教 育委 员会重 点科研 项 目(0 6 Z Z 3 4);上海 理 工大学引进人才科研启动经费资助项 目 作者简介:樊重俊(1 9 6 3 一),男,博士后,副教授。研究 方向为 社 会经济系统工程、非线性理论、管理信息系统。E ma i l:c j f a n s h l 6 3 n e t D L M),并以我国猪 肉产量为例,建立 了一个带有卡 尔曼滤波器 的双变量 B a y e s动态模型,运用专家经 验
9、对模型进行主观干预和修正。朱慧明。0 _ 还研究 了模型参数在扩散先验分布下,限制性和非 限制性 向量 自回归模型的 B a y e s 推断理论。先验分布是 B a y e s方法的基础和前提,但并没 有 统 一 的 先 验 分 布 构 造 法,这 种 灵 活 性 也 正 是 B a y e s方法 的魅力所在。为了理论 上方便,讨论常 用的无信息先验分布和共轭先验分布两大类。本 文从 应用 的 角 度,时 间序 列 B a y e s 分 析 方 法 的基本思想是将人们的经验知识作为先验信息结合 到实际模型 中,即综合利用模型信息、数据信息及先 验信息来进行经济 分析 与预测。因此,无信息
10、先验 分布下 的结果 和传 统 的时间序列 分析 方法(例 如 B o x-J e n k i n s 方法)相 比,对经济 问题进行处理的效 果区别不大,只是把点估计扩展为区间估计。因此,本文着重考虑共轭先验分布情形。报 e e 学 a M 理 1 9 2 系 统 管 理 学 报 第1 9 卷 在一 元 时 间序 列 B a y e s 分 析 方 面,朱 慧 明_ 3 基 于 正态一 G a mma 共轭 先验分 布,讨 论 了一 元 自回归 预测模型的 B a y e s 推断方法。樊重俊l_ 4 基于正态一 Ga mma 共轭先验分 布,结合 B o x-J e n k i n s 方
11、 法,对 一元 AR MA 模 型的 B a y e s 推断方 法进 行 了讨 论。在多元时间序列 B a y e s 分析方面,朱慧 明 9 分 析 了 Mi n n e s o t a 共 轭先 验 分 布 的结 构,并 对该 先 验 分 布下多 元 自回归预 测模型 的 B a y e s 推断方 法 进行 了探讨。针对 多元 自回归模 型,采取 矩阵 正态一 Wi s h a r t 分布作为共 轭先验分 布 的研 究与讨 论结 果,目前尚未见诸文献。关于多元模型与分量方程 对应 关系 的讨论 亦未见 到。本文在矩 阵正态一wi s h a r t分布意义下,讨论 B a y e s
12、 多元 自回归 模 型、多 元 模 型 与分 量 方 程 的对 应关系、模型阶数的推断方法。房地产市场是一个 复杂的系统,科学 的分析与预测是有关部门正确决 策的前提。关于房地产市场 的 B a y e s 分析,目前在 国内外均未见文献发表。本文作为应用案例,分析、预测 中房 上海综合 指数。1 基于多元 自回归的 B a y e s 分析 B a y e s 基本思想在于将人们 的经验信息作为已 知条件之一,结合到实际模型中进行预测。这种做 法一方面可以有效克服传统统计方法难以处理的突 发事 件 问题(例如 房地 产 中的宏观调 控),另一方 面,可以综合利用相关经济数据与经验以克服数据量
13、太 少 的 问 题,从 而 提 高 经 济 预 测 效 果。此 处 讨 论 B a y e s 多元 自回归模型。本文 的 探讨 需要 用 到 随机 矩 阵 的一 些 分布,包 括矩阵正态 分布、矩 阵 t 分布、Wi s h a r t 分布 1 0 1 1 。关 于这些分 布 的描述 方 式 各文 献 有 一 定差 异,本 文 做如下描述,以方便共轭分布族 的理论推导。定义 1 设 是 一 个 m r阶 随机 矩 阵,如 果 其密度函数为:f(O lZ,A,w)O C f f 号 l W f 寺 ,1 、e x p 一+t,C a(一 )w(一 )J 其 中:为 正定 矩 阵;W 为 r
14、r正定 矩 阵;I|l 为 mr矩 阵。则 称 随 机 矩 阵 服从 矩 阵 正 态 分 布,并将其记为 ,(,4,)定义 2 设 T是一个 mr阶随机矩阵,如果其 密度函数为:厂(p,A,)。C f 厶 f 寺 f W f 詈 1 H (T-#)W(T-g)f ”则称随机矩阵 T服从矩阵 t 正态分布,并将其记为 T ,(,q)定义 3 设 w 是一个 r r阶随机矩阵,如果其 密 度 函数为:f(W a,A)。C l A l号 1 I e x p 一 丢 tr(A W 其 中:A为 r r 正定矩阵;a为正整数。则称随机矩 阵 w 服从 Wi s h a r t 分布,并将其记为 W W,
15、(a,A一 )另外,多元 t 分布、伽 马分布、F分布的表示方 法 和一 般教科 书一致,此处 不再 罗列。考虑如下 r维 P阶自回归模型:y()一 1 Y(t 一 1)+Y(t 一 声)+g()(1)假 定 P(),一0,1,是 r维 i i d N(0,W)随 机误 差 向量。若 已知 观测 向量 Y(1),Y(2),Y(),记 S,一(y(1),y()S(n-i)一(y(+1),y()则 S 关于 s 的条件似然 函数是 f(S(S ;,w)。C 1 w l exp 一 y 一 Y(t )x w y 一 g(t )。c J w l e x P 一 t r w(s(一 X O)(s()一瑚
16、)(2)其 中:一 x 一 J (一1)Y(n p)J 是 mr 矩 阵,m一 r。当 T 相对于 P较大时(即数据样本量与模型阶 数相比足够大),可以用式(2)近似模型(1)的精确似 然函数。本文的讨论以式(1)、(2)作为出发点。为了理论上方便,考虑式(1)的共轭先验分布 族:矩阵正态一wi s h a r t 分布。o w r 一:,W-h (3)【W (a m,A_。)定理 1 对于模 型(1),在条件似然函数(2)与 共轭先验分布(3)的意义下,模型(1)参数、w 的 边际后验分布、Y(n+1)的一步预测分布依次为如 第2 期 樊重俊:B a y e s多元 时 间序 列 分析 方
17、法及 其 应 用 1 9 3 下的矩阵 t 分布、Wi s h a r t 分布、多元 t 分布:丁删 (,(X X+A),(a+7 一 P r m+1)1(A+S S e),(d+一 P r+1)(4)W(口+P m,(A+S S e)(5)y(+1)t r(L,Q,a+-一 P r m 4-1)(6)式 中,一(X X+4)(X S +厶)(7)S S eS (一 S(+么 一(X S(+)(X+)一 (X S(一 +)L 一(y(),Y(n P+1)Q=E 1+L (X X+z 1)L (a+一 P r+m+1)(A+S S e)(8)证 明 由式(1)(3)组 成 的 B a y e
18、s 多元 自回归 模型 的后 验 分 布 等 价 于下 面 的 B a y e s 多 元 回归 问 题:S()一 X+E,E N(0,I,W )(9)先验分 布 为 N ,一,(1 o)lW W (a m,A )的后验分布,其中,式(9)中的。与 1分别是(一夕)r阶 零 矩 阵 和(n P)(p)阶单 位 矩 阵,式(1 0)中 w 表示 对 w 的条件分布。借用 B a y e s 多元 回归模 型 的结果m 可得 定 理 1。下面基于式(5)(7)对模型(1)的 B a y e s 估计,即后验期望估计结果进行讨论与说明。推论 1 在定理 1的意义下,模型(1)参数 的 后验期望估计是
19、最小二乘估计 与先验均值 的 加权 平 均:一(x x+)一 x x I s+(x x+)一 证明 根据矩阵 t 分布性质,由定理 1中的结 果(4)立即可得模 型(1)参数 的后验期 望估计是 定理 1中的(7)。注意到 的最小二乘估计是:L s一(X X)一 X S()可得推 论 1结果。推论 1表 明,B a y e s估计综合利用 了传统方法 获得的最小二乘估计结果与先验信 息,当无先验信 息可利用时,可以认为是 一0的极 限情 况。由此 可知,在建模时 B a y e s 方法 比传统方法更灵活。推 论 2 在定 理 1的 意义 下,模 型(1)随 机误 差 向量 P()的协方差矩阵
20、 w 的后验期望估计是:W-一(a+Pm r 一 1)1(A+S S e)(1 1)证 明 由定 理 1中的 式(5)知,参 数 w 的 边 际 后验分布为 Wi s h a r t 分 布,根据 Wi s h a r t 分布的逆 矩阵期望性质,结合式(5)可得:W-lE(W)一(d+P一 一 r一 1)(A+S S e)一 推论 2获 证。推论 2同样反映 出 B a y e s估计 中,w 的估计 值综合利用了先验信息与样本数据信息。推论 3 在定 理 1的意 义下,模 型(1)中 Y(n+1)的一 步 预测期 望 估 计 为 L,预 测 误差 的协 方 差 矩 阵为 V 一(d+P r
21、 m+1)(a+一Pr m+1)一2 a一 +L (x x+厶)一 L (1 2)式 中,_ L (x X-t-A)一 L 一 是 L 的后 验 分 布 的 协 方差 矩 阵。证 明 根 据多 元 t 分 布性 质,由定 理 1中式(6)可得 y(+1)的一步 预测 期望 估计 为 L。结 合定 理 1中式(6)、(8)与推论 2中式(1 1)可得推论 3中 式(1 2)。推论 3说明 Y(n+1)的预测误差来 自于模型误 差与模型参数估计误差的叠加。2 多元序 列分量模型的 B a y e s 分析 对于有多个动态经济序列构成 的系统,有时只 关心其 中某个经济序列 的预测问题。并且,多个经
22、 济序列的预测也可采取对各经济序列预测问题分别 建模 方 式。对 分 量模 型 的讨论 很有 必要。假 设:y()一(y(),y()e(f)一(P 1(),e ()记=(,:,p )一(,)以及 卢、s )_ 分 别是、S 一 的第 1 列,r _。、a l 1、S S e 、D 分别 是 w 、A、S S e、Q 的第 1 个对角元素。不失一般性,考虑模型(1)的第 1个分 量方 程:y 1(f):(y(一 1)+Y(t 一)+P 1()1 e 1()N(0,r-)J (1 3)定理 2 对 于分量模 型(1 3),在定理 1的假设 下,、r 的后验分布、y (+1)的一步预测分布依次 1
23、9 4 系 统 管 理 学 报 第1 9 卷 是多元 t 分布、伽马分布、一元 t 分布:卢 t (,(a+Pr m+1)(n 1 1+S Se )(X X+),a+一 P r m+1)(1 4)r I、(a+,z P r )+1,去(口 1 1+S S e“)(1 5)y】(+1)t 1(L,D,a+P r m+1)(1 6)证明从定理 1的式(4)(6),根据矩阵 t 分 布、Wi s h a r t 分布、多元 t 分布的性质可得定理 2式(1 4)(1 6)。不难 证 明式(1 4)(1 6)与下 面的 B a y e s回归 问 题 的解 一致:c(”n-一x p+E 1,E1 N(
24、O,E-D (1 7)先 验分 布为 r N(,(),r r(一罟,口)(1 8)式 中,一 1 a 一(r 一1),n一 1 n 但同时特别值得注意的是 与 a不相等。推论 4 对 于分量模型(1 3),在定理 2的意义 下,随机误差 e ()的方差 r 的后验期望估计是:一=(a+n P r m 一 1)一 (口 l 1+S S e )y (+1)的一步 预测误差 的方差 可分 解为:Vl一 一 +L (X x+z S)一 一 推论 4是上节推论 1 3的对应结果,仅列出了 关键 点。3 模型阶数 的 B a y e s 推断 定理 3 对于分量模型(1 3),在定理 2假设下,令 R=(
25、口+7 z 一 一 r +1)一 (n 1 l+SS e )(X X+)一 对 R进行分块 厂*肛 l R j 其 中:R为mm 正定矩 阵;R 为 r r正定矩阵,则 有:f 一 1(一)(一)F(r,a+一 P r m+1)(1 9)证明根据定理 2中式(1 4),利用多元 t 分布、F分布的性质可得。下面讨论分量方程(1 3)的阶数 P的推断问题。设 一r(户一愚),做分 块:一,卢 一 i f,R f-RR 2u1 n)=;,=A 1 12。其 中,1)、【1)、均是 1阶,R 1、1 是 m m 阶,一 +m。则 卢【1 关 于)一0的条件后验 分布是 1)2)一 0 t (J8(1
26、)一R1 z R 9(2),(+一 P r m+1+m2)(a+n Pr +1+卢(2)R p(2)(R1 1一 Rl 2 R R2 1),(口+一 P r m+1+m2)(2 O)若模型的真实阶数是 P一忌,而不是 P时,先验 分布(1 7)可利用其关于 段。一0的条件分布调整:f r N(一 _ l1 ,()一 1 r r(一 m,a+i :;(z 5 一 _ ll 。)(2 1)下面根据以上的结果讨论分量方程阶数的确定 问题。利用 式(1 4)可有 2种递 推算 法:(1)设 模 型真实 阶数不 大于某 正整 数 Q,取 尼=0,由 一Q一尼时 的后验分布,利用式(1 9)检验 一0是否
27、成立。若成立,则表示此时阶数可以下降。取 忌 一1,P=Q一是,对先验分布利用式(2 1)调整,再 重复上面步骤,直到阶数不能下降为止。(2)当:0已被检 验成 立 时,直 接使 用 式(2 O)进行 下一 步检 验。对 于这 2种算 法,具有:若模 型 阶数 是 Q一是,已 知资料是 Y(k+1),y(),先验分布是式(2 1),则)的后验分布是式(2 0)。这说 明算法(2)与(1)相 比,虽然计算效率较快,但数据利用率要低一些。在数据量少时,建议采用算法(1)。模型(1)阶数的推断,可以对各分量方程分别进 行,也可利用式(4)实现。关于分量方程维数 r的确 定,可类似处理,此处均不予赘述
28、。4 应用 实例 经济系统往往处于变化之中,可利用建立经济 预测模型的历史数 据则通常不很充分。如何利用 第2 期 樊重俊:B a y e s多元 时 间序 列分析 方 法及其 应 用 B a y e s 思想,借助相关经验或数据提高预测能力,是 一个有 意义 的课 题。此处 基 于一个 应用 案 例讨论 应 用思路与计算方法。运用价格指数进行房地产市场总体分析,在我 国已有 多年经 验。定量 地研 究价 格 指数 的运 行轨迹 并做 出准确 的描 述 和 预测,对 于研 究 房 地 产 市 场具 有极其重要的作用。此处应用本文方法中关于分量 方程(1 3)对 中房 上 海 综 合 指 数 与
29、 上 海 二 手 房 指 数 2 0 0 4 0 1 2 0 0 8 1 0的数据进行预测建模。首先考虑到数据的平稳化问题,取环 比上涨率,然后做 归 一 化 处 理后 进 行 建 模 与 预 测。利 用 北 京 2 0 0 5 1 0 2 0 0 8 1 0的中房综合指数与二手房指数来 确定上 海模 型 的先验 分 布。基于式(1 3)给出预测建模的计算步骤如下(鉴 于篇幅,此处只给出计算思路与关键计算结果):(1)样本数据。假 设 Y (t)为 中房综 合指数,y。()为 二 手 房 指 数。Y()一(y (t),Y。()。此 时,维数 r 一2,阶数 P待定,上海数据样本容量 一 5 8
30、,北京数据样本容量 一3 7。观测数据可表示为:厂 y(p)y(1)xI;I L Y(一1)Y(n 一 )_ y (+1)5 一I;l Y ()j (2)参数估计。y1()一(y(一 1)+Y(t 一 户)+P 1()中 的最s J -乘估计为:一(x x)1 X s 的后验期望估计是最小二乘估计与先验均值 n 的加 权平 均:一(x x+)一 x x L s+(x x+)一 (1 当无先验可用时,可取 一0。(3)预测模型。基于 L 一(y(),Y(n P+1),Y1(+1)的预测值为 L。(4)模型 阶数。利 用 上 海 数 据,取 一0,即 无 先 验。递推 检验 获得 模 型阶数 P一
31、3。(5)先验确定。利用北京数据,按照(1)、(2)计 算获得北京模型参数 的后验分布。此 时,取 一0,即无先验。北京模型计算关键结果:=s一 1 4 6 4 2 0 02 0 9 0 6 84 7 0 03 4 1 O 29 4 3 一O 0 21 3 (2 2)(6)模 型构 架。以北 京 数 据 建 模 结 果(即 北京 模型参数 的后验分布)作为上海模 型参数 的先验分 布,对上海数据进行建模。计算关键结果:P L S=。1 96 5 4 0 2 2 0 9 一1 3 2 7 4 0 2 3 0 4 O 3 O 5 2 0 O6 O 1 一(x X+)X x+(X X+)一 =。1
32、46 4 2 0 0 2 0 9 0 6 84 7 0 0 3 4 1 0 2 9 4 3 一O O 21 3 1 9 6 5 8 0 2 0 0 8 1 2 3 O 2 一O 2 3 0 1 O 3 0 4 5 O 06 0 3 其 中,即取北 京数 据计 算所 得 的结果 式(2 2)。(7)预测结果。按照(3)计 算获得 中房上海 综 合 指数 的预 测 值 见 表 1。为 了 比较,在 表 1中 同 时 列 出 了 自回归 模 型的 预测结 果。表 1 中房 上海综合指数预 测结果 从表 1可 以看 出,2 0 0 8 0 9 1 1的预测误差率 分别为:0 1 5 、0 2 0 、0
33、 5 0 。比较说明,B a y e s 模 型效 果较 好。本文在此只给出了应用思路。对如何更有效的 通过选取先验分布来提高预测效果,以及本文方法 与其他预测方法的较全面比较,另撰文讨论。5 结 语 本文探讨多元时间序列 的 B a y e s 分析方法。但 由于多元 时 间序 列模 型 的参 数 成 为 矩 阵形 式,一 元 结果 向多元结果的推广就复杂 了很多,需要研究的 1 9 6 系 统 管 理 学 报 第1 9 卷 、船 文 誊 在线消费者品牌选择 习惯持续性效应分离 陈 洁 ,杨升 荣。,郑尊信。(1 上海交通大学 安泰经济与管理学院,上海 2 0 0 0 5 2;2 深圳大学 经济学院,深i J l I 5 1 8 0 6 O)摘 要:通过构建随机过程模型,对国内某网上商城的消费者实际消费面板数据进 行 了分析,分解 出在线 消费者的 习惯持 续效应,从 而可以剖析在线渠道下消费者品牌 选择 的习惯持 续行为机理。研 究发 现:在线渠道下 消费者 存在 习惯持 续效应,习惯持 续可 以通过随机过程模 型进行有效地 分离并识别;习惯持 续效应对消 费者 的品牌 选 择有显著影响,因此应该尽可能培养消费者的购买习惯;在形成习惯持续效应的同时应注重提升消费者对产品 的 内在 偏 好。
限制150内