一类隐马尔可夫模型的若干极限性质-精品文档资料整理.pdf
第27卷 第5期2006年9月江 苏 大 学 学 报(自 然 科 学 版)Journal of Jiangsu University(Natural Science Edition)Vol . 27No. 5Sep. 2006一类隐马尔可夫模型的若干极限性质杨卫国,吴小太,王 豹(江苏大学 理学院,江苏 镇江212013)摘要:假定隐藏的马尔可夫链为非齐次,研究隐非齐次马尔可夫模型的一些强极限定理.首先在引理中得出了隐非齐次马尔可夫模型的一些性质,从而导出了隐非齐次马尔可夫模型的三元函数一类平均值的强极限定理.作为定理的推论,得到了隐非齐次马尔可夫模型状态出现频率的一类强极限定理.隐马尔可夫模型可应用于弱相依随机变量的建模上,也可用作研究发音过程、 神经生理学与生物遗传等方面的工具.关键词:隐马尔可夫模型;隐非齐次马尔可夫模型;马氏链;强极限定理;频率中图分类号: O211. 6 文献标识码: A 文章编号: 1671 - 7775 (2006) 05 - 0467 - 04Some li m it properties of a class ofhidden nonhomogeneousMarkov modelsYANG W ei2guo, WU Xiao2tai, WANG Bao(Faculty of Science, Jiangsu University, Zhenjiang, Jiangsu 212013, China)Abstract: The strong limit theorem of hidden nonhomogeneousMarkovmodel is studied when the hiddenchains are nonhomogeneousMarkov chains . At first some properties on nonhomogeneousMarkov modelsare obtained in the lemma, then a limit theorem for the average of the three variables function of hiddennonhomogeneousMarkov model is given. As corollaries, several strong limit theorems about occurred fre2quency of states for hidden nonhomogeneous Markov model are obtained. Hidden Markov models havebeen widely used formodeling sequences ofweakly dependent random variables, with applications in assuch as speech processing, neurophysiology and biology .Key words: hiddenMarkov model; hidden nonhomogeneousMarkov model; Markov chain;strong li mit theorem ; frequency如果Xn, n0为一非齐次马尔可夫链,取值于有限集S = 1,2, N ,其初始分布为(q(1) ,q(2) , q(N ) ) ,转移矩阵为Pn= (an( i, j) )NN,i, jS, n1,此处的an( i, j)= P (Xn= j| Xn-1=i) ,称Xn, n0为状态链.假定Xn, n0是不能被观测到的,而能观测到的是另一个取值于有限集T = 1,2,M 的随机变量序列 Yn, n0,称 Yn, n0为观察链.如果存在矩阵B= (bil)NM( iS, lT)满足P (X0= x0, Y0= y0, Xn= xn, Yn= yn)=q(x0) bx0y0a1(x0, x1)an(xn-1, xn) bxnyn(1)则称(Xn, Yn, n0)为一个隐马尔可夫模型1.由于隐藏的马尔可夫链是非齐次的,文中不妨称之为隐非齐次马尔可夫模型.隐马尔可夫模型在近几十年广泛应用于弱相依随机变量的建模上,被用作研究发音过程、 神经生理学与生物遗传等方面问题的工具,在理论方面收稿日期:2005-12-07基金项目:国家自然科学基金资助项目(10571076)作者简介:杨卫国(1957- ) ,男,辽宁海城人,教授,博士生导师(wgyangujs . edu. cn) ,主要从事概率极限的理论研究.吴小太(1982 - ) ,男,安徽安庆人,硕士研究生(aawxt163. com) ,主要从事马氏链的理论研究.Leroox2与Bickel and Ratof3分别给出了隐马尔可夫模型在大数定律与中心极限定理方面的一些性质.在实际应用中经常遇到马尔可夫链为非齐次的情形4,5,所以研究隐非齐次马尔可夫模型的性质具有十分重要的意义6-9.作者研究了非齐次马尔可夫模型(Xn, Yn, n0)的一些强极限定理.首先给出隐非齐次马尔可夫模型的三元函数一类平均值的极限定理.作为推论,得到了隐非齐次马尔可夫模型(Xn, Yn, n0)状态出现频率的一类强极限定理.证明主要结论前先给出三个引理.引理1隐马尔可夫模型的条件(1)成立的充要条件为P (Yn= l | Xn= i, Yn-1= yn-1, Xn-1= xn-1,Y0= y0, X0= x0)= P (Yn= l | Xn= i)= bil(2)P (Xn+1= j| Xn= i, Yn= yn, Xn-1= xn-1,Y0= y0, X0= x0)= P (Xn+1= j | Xn= i)=an+1( i, j) , i, jS, lT(3)证明 充分性显然.必要性,仅对式(2)给出证明,式(3)可以同样进行,由式(1)易得P (Yn= l | Xn= i, Yn-1= yn-1, Xn-1=xn-1, Y0= y0, X0= x0)= bil故只要证P (Yn= l | Xn= i)= bil(4)下面仅对最简单的情况给出证明.P (Y1= y | X1= x1)=6hT6kSP (Y1= y, X1= x1, Y0= h, X0= k)6hT6kSP (X1= x1, Y0= h, X0= k)(5)由初等代数中分式的性质与式(1)、 式(5)即有P (Y1= y1| X1= x1)= bx1y1同理可得式(4).引理2(参见文献6)设Xn, nN 是鞅差序列,若 an, nN 为递增趋向于无穷的数列,又6n =1a-2nEX2n,则limn1an6ni =1Xi=0a. s .引理3设(Xn, Yn, n0)是如上定义的隐非齐次马尔可夫模型, f (x, y, z)为定义在SST上的实值函数,令Fn=(Xm, Ym,0mn) ,则有Ef(Xk-1, Xk, Yk) | Fk-1 =Ef(Xk-1, Xk, Yk) | Xk-1, k1a. s .(6)证明 由式(1)有P (Xk-1= xk-1, Xk= xk, Yk= yk| X0= x0, Y0=y0, Xk= xk-1, Yk= yk-1)=P (X0= x0, Y0= y0, Xk= xk, Yk= yk)P (X0= x0, Y0= y0, Xk-1= xk-1, Yk-1= yk-1)=ak(xk-1, xk) bxkyk(7)由引理1有P (Xk-1= xk-1, Xk= xk, Yk= yk| Xk-1= xk-1)=P (Xk-1= xk-1, Xk= xk, Yk= yk)P (Xk-1= xk-1, Xk= xk)P (Xk-1= xk-1, Xk= xk)P (Xk-1= xk-1)= ak(xk-1, xk) bxkyk(8)再由式(7) ,式(8)有Ef (Xk-1, Xk, Yk) | Fk-1 =6xk6ykf (xk-1, xk, yk) P (Xk= xk, Yk= yk| X0,Y0, Xk-1, Yk-1) |xk-1=Xk-1=6xk6ykf (xk-1, xk, yk) P (Xk= xk,Yk= yk| Xk-1) |xk-1=Xk-1=Ef (Xk-1, Xk, Yk) | Xk-1(9)定理 设(Xn, Yn, n0)是如上定义的隐非齐次马尔可夫模型, f (x, y, z)为定义在SST上的实值函数, an, n1是趋向于无穷的一个增序列,如果6n =1a-2nEf2(Xn-1, Xn, Yn) +(10)则limn1an6nk =1 f(Xk-1, Xk, Yk) -Ef (Xk-1, Xk, Yk) | Xk-1=0a. s .(11)证明 令Zk= f (Xk-1, Xk, Yk) -Ef (Xk-1, Xk, Yk) | Xk-1, k1(12)假定Fn如引理3的定义,下证 Zk, k1是一个鞅差序列,因为E f(Xk-1, Xk, Yk) | Xk-1为Fk-1可测的,故E Efk(Xk-1, Xk, Yk) | Xk-1 | Fk-1=Efk(Xk-1, Xk, Yk) | Xk-1a. s .(13)由式(6) ,式(12)与式(13) ,有EZk| Fk-1 =0,a. s .k1(14)故序列 Zk, k1是一个鞅差序列.864 江 苏 大 学 学 报(自 然 科 学 版)第27卷易知Ef2(Xk-1, Xk, Yk) =E (Ef2(Xk-1, Xk, Yk) | Xk-1)a. s .(15)由条件期望的Jensen不等式,有E (Ef (Xk-1, Xk, Yk) | Xk-1)2E (Ef2(Xk-1, Xk, Yk) | Xk-1)=Ef2(Xk-1, Xk, Yk) (16)故由式(10)与式(16)有6n =1a-2nE (Ef (Xn-1, Xn, Yn) | Xn-1)26n =1a-2nEf2(Xn-1, Xn, Yn) (17)由式(10) ,式(12)与式(17) ,有6n =1a-2nEZ2n +(18)由式(18)与引理2,有limn1an6nk =1Zk=0a. s .(19)由式(12)与式(19) ,即得式(11).注意到Ef (Xk-1, Xk, Yk) | Xk-1 =6Nj=16Ml =1f (Xk-1, j, l) ak(Xk-1, j) bjl,则式(11)也可以表示为limn1an6nk =1 f (Xk-1, Xk, Yk) -6Nj=16Ml =1f (Xk-1, j, l) ak(Xk-1, j) bjl=0a. s .(20)推论1设(Xn, Yn, n0)是如上定义的隐非齐次马尔可夫模型, f (x, y, z)为定义在SST上的实值函数,则limn1n(1+) /26nk =1 f (Xk-1, Xk, Yk) -6Nj=16Ml =1f (Xk-1, j, l) ak(Xk-1, j) bjl=0a. s .(21)证明 因为Ef2(Xk-1, Xk, Yk)maxi, jS, lTf2( i, j, l) , k1故有6n =1Ef2(Xn-1, Xn, Yn)n1+maxi, jS, lTf2( i, j, l)6n =11n1+由定理1与式(20) ,即得式(21).对iS,令i(. )为Kronecker函数i( j)=1,j = i0,ji(22)推论2设(Xn, Yn, n0)是如上定义的隐非齐次马尔可夫模型, jS, lT,并令Sn( j, l,)为序偶序列(X0, Y0) , (Xn-1, Yn-1)中序偶( j, l)的个数,即Sn( j, l,)=6nk =1j(Xk-1)l(Yk-1)(23)则limn1n(1+) /2Sn(j, l,) -6nk =1ak(Xk-1, j) bjl=0a. s .(24)证明 在推论1中令f(x, y, z)=j(y)l(z) ,x, yS, zT,有6nk =1 f (Xk-1, Xk, Yk) -6Nu =16Mv =1f (Xk-1, u, v) ak(Xk-1, u) buv=6nk =1j(Xk)l(Yk) -6Nu =16Mv =1j(u)l(v) ak(Xk-1, u) buv=Sn( j, l,) +j(Xn)l(Yn) -j(X0)l(Y0) -6nk =1ak(Xk-1, j) bjl(25)由推论1与式(25) ,即得式(24).推论3设(Xn, Yn, n0)是如上定义的隐非齐次马尔可夫模型, lT,并令Tn( l,)为序列Y0() , Y1() , Yn-1()中l出现的个数,即Tn( l,)=6nk =1l(Yk-1() )(26)则limn1n(1+) /2Tn(l,) -6nk =16Nj=1ak(Xk-1, j) bjl=0 a. s .(27)证明 在推论1中令f(x, y, z)=l(z) , x, yS, zT,有6nk =1 f (Xk-1, Xk, Yk) -6Nj=16Mv =1f (Xk-1, j, v) ak(Xk-1, j) bjv=6nk =1l(Yk) -6Nj=16Mv =1l(v) ak(Xk-1, j) bjv=Tn( l,) +l(Yn) -l(Y0) -6nk =16Nj=1ak(Xk-1, j) bjl(28)由推论1与式(28) ,即得式(27).推论4设(Xn, Yn, n0)是如上定义的隐非964第5期 杨卫国等:一类隐马尔可夫模型的若干极限性质齐次马尔可夫模型, i, jS, lT,并令Sn( i, j, l,)是序列(X0, X1, Y1) , (Xn-1, Xn, Yn)中出现( i, j,l)的个数,即Sn( i, j, l,)=6nk =1i(Xk-1)j(Xk)l(Yk)(29)则limn1n(1+) /2Sn( i, j, l,) -6nk =1i(Xk-1) ak( i, j) bjl =0a. s .(30) 证 明 在 推 论1中 令f (x, y, z)=i(x)j(y)l(z) , x, yS, zT,有6nk =1 f (Xk-1, Xk, Yk) -6Nu =16Mv =1f (Xk-1, u, v) ak(Xk-1, u) buv=6nk =1i(Xk-1)j(Xk)l(Yk) -6Nu =16Mv =1i(Xk-1)j(u)l(v) ak(Xk-1, u) buv=Sn( i, j, l,) -6nk =1i(Xk-1) ak( i, j) bjl(31)由推论1与式(31) ,即得式(30).参考文献( References) 1 龚光鲁,钱敏平.应用随机过程教程M .北京:清华大学出版社, 2004: 249. 2 Brian GLeroux . Maximum2likelihood esti mation for hid2denMarkov models J .Stochastic Processes and theirAppl, 1992, 40: 127 - 143. 3 PeterJ Bickel, YaacovRitov, Tobias Ryden. As mptoticnormality of the maximum2likelihood estimator for gene2ral hidden Markov modelsJ .The Annals of Statistics,1998, 26(4) : 1614 - 1635. 4 LacruzB, Lasala P, LekuonaA. Dynamic graphicalmo2dels and nonhomogeneous hidden Markov models J .Stat Proba Letts,2000, 49: 377 - 385. 5 BatesB C, Charles S P, Hughes J P.Stochastic down2scaling of numerical climatemodel simulationsJ .Envi2ronmentalM odelling & Software, 1998, 13: 325 - 331. 6 汪嘉冈.现代概率论基础M .上海:复旦大学出版社, 1988: 164 - 166. 7 刘 文,杨卫国.关于非齐次马氏信源的渐近分割性J .应用概率统计, 1997, 13(4) : 359 - 366.L I U Wen, YANG Wei2guo. Asymptoticequipartitionproperty for nonhomogeneousMarkov infor mation sourceJ .Applied Probability and Statistics, 1997, 13 (4) : 359- 366.( in Chinese) 8 杨卫国,李 芳,王小胜.一类非齐次马氏链的收敛速度 J .江苏大学学报:自然科学版, 2005, 26(2) : 137 - 139.YANGWei2guo, L I Fang, WANG Xiao2sheng .Rate ofconvergence of certain nonhomogeneous Markov chainsJ .Journal of Jiangsu University:Natural Science Edi2tion, 2005, 26(2) : 137 - 139. ( in Chinese) 9 杨卫国,黄辉林,马 越.奇偶树上马氏链场的强大数定律 J ,江苏大学学报:自然科学版, 2005, 26(3) : 244 - 247.YANGWei2guo, HUANG Hui2lin, MA Yue. Strong lawof large numbers forMarkov chain fields on an even2oddtreeJ .Journal of Jiangsu University: Natural ScienceEdition, 2005, 26(3) : 244 - 247. ( in Chinese)(责任编辑 徐红星)074 江 苏 大 学 学 报(自 然 科 学 版)第27卷