2022年隐马尔可夫模型及其最新应用与发展 .pdf
《2022年隐马尔可夫模型及其最新应用与发展 .pdf》由会员分享,可在线阅读,更多相关《2022年隐马尔可夫模型及其最新应用与发展 .pdf(6页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、2010 年 第 19 卷 第 7 期计 算 机 系 统 应 用Special Issue 专论综述255隐马尔可夫模型及其最新应用与发展朱明郭春生(杭州电子科技大学通信工程学院浙江 杭州 310018) 摘要: 隐马尔可夫模型是序列数据处理和统计学习的一种重要概率模型,已被成功应用于许多工程任务中。首先介绍了隐马尔可夫模型的基本原理,接着综述了其在人的行为分析、网络安全和信息抽取中的最新应用。最后对最近提出来的无限状态隐马尔可夫模型的原理及最新发展进行了总结。关键词:隐马尔可夫模型 ;行为分析 ;网络安全 ;信息抽取 ;无限状态隐马尔可夫模型Hidden Markov Model and I
2、ts latest Application and Progress ZHU Ming, GUO Chun-Sheng (College of Communication Engineering, Hangzhou Dianzi University, Hangzhou 310018, China) Abstract: Hidden Markov Model (HMM) is an important probabilistic model of sequential data processing and statistical study. It has already been succ
3、essfully applied in many projects in practice. Firstly, this paper introduces the basic principles of the Hidden Markov Model, and then gives a review to its latest application in the human activity analysis, network security and information extraction. Finally it summarizes the theory and latest pr
4、ogress of the recently proposed infinite Hidden Markov Model (iHMM). Keywords: HMM ;activity analysis;network security;information extraction;iHMM 1 引言隐马尔可夫模型(Hidden Markov Model, HMM)作为一种统计分析模型,创立于20 世纪 70 年代,80 年代得到了传播和发展并成功应用于声学信号的建模中, 到目前为止, 它仍然被认为是实现快速精确语音识别系统最成功的方法。作为信号处理的一个重要方向,HMM 广泛应用于图像处理,
5、模式识别,语音人工合成和生物信号处理等领域的研究中,并取得了诸多重要的成果1。近年来,很多研究者把 HMM 应用于计算机视觉、 金融市场的波动性分析和经济预算等新兴领域中,因此,结合实际应用,进一步研究各种新型 HMM 及其性质,具有重要的意义。文章首先介绍了 HMM 的基本理论,接着对其在人的行为分析、网络安全和信息抽取中的最新应用进行了综述。针对经典 HMM 应用中存在的两大问题, 近年来提出了无限 状 态 隐 马 尔 可 夫 模 型 (infinite Hidden Markov Model ,iHMM),文章的最后对其基本理论及最新发展进行了总结。 收稿时间 :2009-10-25;收
6、到修改稿时间 :2009-12-06 2 HMM的基本原理及结构2.1 HMM的基本原理HMM由两个随机过程组成,其中一个是状态转移序列,它是一个单纯的马尔可夫过程;另一个是与状态对应的观测序列, 如图 1 为一状态数为 3 的 HMM示意图,其中为状态序列,它们之间的转移是一个马尔可夫过程,为各状态下对应的观测值。在实际问题中,我们只能看到观测值,而不能直接看到状态,只能是通过观测序列去推断状态的存在及转移特征,即模型的状态掩盖在观测序列之中,因而称之为“隐”Markov 模型。图 1 状态数为 3 的 HMM 示意图设模型的状态数目为,可观测到的符号数目为,名师资料总结 - - -精品资料
7、欢迎下载 - - - - - - - - - - - - - - - - - - 名师精心整理 - - - - - - - 第 1 页,共 6 页 - - - - - - - - - 计 算 机 系 统 应 用 2010 年 第 19 卷 第 7 期256 专论综述 Special Issue则可用三元组来表示一个HMM2, 其中为状态转移概率矩阵,为给定状态下的观测值概率矩阵或观测概率密度函数,为初始状态概率分布矢量。可以用盒子与彩球模型来描述一个HMM3: 设某人在 3 个装有红白两种颜色的球的盒子中任取一个盒子,然后在此盒中每次抽取一个球,连续地在同一盒中按下面给定的方式抽取次,各盒中球
8、的内容和抽取方式如表 1:表 1 各盒中球的内容和抽取方式现在如果某人用上述方法得到了一个观测序列(红,红,红,红,白 )(即 T=5) ,但并不告诉我们球出自哪个盒子。但我们通过概率计算,可以知道从第一盒中抽出样本 (红,红,红,红,白)的概率要比从其它两盒中抽出该样本的概率大得多,从而推断球出自盒1。 此例中的不同盒的抽取方式可以抽象为不同的状态编码方式,这正启示了用HMM 作为序列数据建模与分类的粗略梗概。2.2 在应用中需要解决的三个基本问题(1)学习问题。就是从大量的已知观测序列出发,估计模型参数组,须用动态规化的方法解决该问题,常用的为 Baum-Welch算法,也叫 EM 算法。
9、(2)分类问题。即对于一个特定的观测序列,要计算其在已知模型下出现的概率, 常用前向变量法求解。(3)解码问题。从一段观测序列及已知模型出发,估计状态序列的最佳值,可用Viterbi算法计算。通过解决以上全部或部分问题,可以实现很多复杂的工程任务。如通过解决前两个问题,HMM可方便地应用于模式识别中,可再用上述的盒子与彩球模型来描述这一过程:各盒中球的内容和球的抽取方式可以抽象为不同的模式,在上例中即有3 种模式,在一般的模式识别过程中,开始并不知道各盒中球的内容和球的抽取方式,但我们可以通过大量的已知出自各盒的观测样本来推断各盒中球的内容和球的抽取方式,并用 3 个 HMM 来分别表示,即H
10、MM 的学习问题;而在识别阶段,得到的未知观测序列,已知它由3 个学习好的 HMM 之一所得,通过计算其在各HMM下出现的概率,可以知道其最有可能出自哪个盒子,从而完成对模式的识别,因此,识别阶段就是一个HMM 的分类问题。3 HMM的最新应用HMM 作为序列数据处理和统计学习的一种重要概率模型,具有建模简单,物理意义明确等优点,且已经有很多成熟的算法,是一种精确的匹配时变数据的技术,已经广泛应用于如语音识别、生物信号分析、模式(如人脸,步态,表情等)识别、故障诊断等的研究中,并取得了丰硕的成果,文章将不再对HMM 在这些方面的应用进行赘述。而是对HMM 在人的行为分析、网络安全和信息抽取中的
11、最新应用进行综述。3.1 HMM在人的行为分析中的应用人的行为分析在视频会议、 人机交互、 智能监控、基于行为的视频检索以及医疗诊断等方面有着广泛的应用前景和潜在的经济价值,是当前计算机视觉领域的一个研究热点。它要解决的问题是根据来自摄像机的原始图像数据,通过提取图像中的运动目标,并计算其速度、轨迹、灰度等特征信息来识别人体的动作,并结合上下境信息,来分析人体动作的目的,理解其要传递的语义信息。行为分析首先对人的运动模式进行分析与描述,然后根据描述进行行为识别。行为识别可以看作是时变序列数据的分类问题,即将未知序列与经过学习得到的代表典型行为的已知序列进行匹配。HMM 的结构可以很好地和这一匹
12、配过程相对应,如人跑步和行走可看作为 HMM 的两状态,而速度可以当作是状态下的一观测值,通过观测值速度的大小可以判断人处在何种状态 (跑步或行走 )下。Yamato等人4于 1992年首次将 HMM 引入到人的行为分析中,开始了行为分析的各种状态空间算法研究。该文利用二维小区域块人运动的网格特征(速度、色彩、纹理等 )作为观测序列进行行为的学习和识别;学习是利用Baum-Welch算法来优化各行为HMM的参数,识别是通过判断未知图像序列在各HMM 下前向变量的概率计算结果来完成,实验结果表明,HMM建模能较好地对网球比赛中不同运动员的不同动作 (正反手拦网,正反手击球,大力扣球,发球等)进行
13、分类识别。根据不同环境下人行为的特征, 很多文献对 HMM 结构进行了扩展,大部分通过利用HMM 的分层结构名师资料总结 - - -精品资料欢迎下载 - - - - - - - - - - - - - - - - - - 名师精心整理 - - - - - - - 第 2 页,共 6 页 - - - - - - - - - 2010 年 第 19 卷 第 7 期计 算 机 系 统 应 用Special Issue 专论综述257来建模行为的不同层次。 Bregler 等人5跟据人体动力学系统中行为的层次性提出了一个综合性的网络来识别人的运动,识别过程分为三个阶段,在低级和中级处理阶段,通过检测与
14、跟踪提取运动特征(速度,轨迹等) 并匹配为动力学中的简单运动; 高级阶段,HMM被用来建模由这些简单运动组合而成的复杂行为,识别是通过判断行为在各HMM 下后验概率的计算结果来确定,实验结果表明,该分层HMM 能准确地识别出人正常行走和滑动行走等差别很小的行为。在行为分析中,训练数据为大量的图像系列,并且对于每一类行为都要建立一个HMM ,学习时所需的运算量是巨大的。针对这个问题,很多文献提出了改进的学习方法。如李和平等人6提出了一种半监督学习的行为建模方法,实验结果表明,该方法能够在小样本的情况下快速地通过较小的运算量学习好HMM ,进而更实时地检测人的异常行为。对行为分析的研究已有近40
15、年的历史,但只有最近 10 年才成为研究的热点, HMM 的优良特性使之成为行为分析的有力工具。总体而言,行为分析的研究仍处在初级阶段,还有很多问题需要解决。3.2 HMM在网络安全中的应用随着计算机技术的飞速发展,信息网络已经成为社会发展的重要保证,网络安全越来越受到关注。在网络安全研究中,入侵检测是其中重要的一个方面,是对入侵行为进行处理以保证网络安全的前提与基础。传统的入侵检测方法是Forrest等人7提出的时延嵌入序列 (TIDE)方法。Warrender等人8在 1999 年首次在入侵检测中引入 HMM , 随后, HMM 被广泛地应用到入侵检测中,并逐渐展现了其优越性。HMM应用于
16、入侵检测,主要是基于这样两个现象:(1) 在正常操作时,程序执行的系统调用是局部稳定的; (2 )当入侵发生时, 程序将会执行大量的异常系统调用。检测通常分为两步,首先利用正常操作程序执行的系统调用作为观测序列来学习 HMM 参数,建立正常操作 HMM ,即 HMM 的学习问题;然后将未知程序执行的系统调用观测序列输入到该正常操作HMM 中,即 HMM 的分类问题,当计算出的前向变量概率低于一定值时,则认为该程序执行的调用不符合正常操作HMM ,进而判断入侵的发生。闫在国内,巧等人9的研究具有重要的参考价值,她通过实验证明: (1)HMM方法建立的库比TIDE 方法建立的库要小,检测时速度更快
17、(2)HMM方法在学习数据不充分时也能得到近似完备的正常轮廓数据库(3)HMM方法的检测精度比TIDE 方法更高。然而,HMM学习和工作中所需要的计算量很大,检测效率和实时性较差,这在一定程序上限制了它在实际系统中的应用。针对这个问题,邬书跃10等人提出了一种运算量较小的序列匹配算法来学习HMM ,利用状态序列出现的概率对被监测用户的操作进行分类,实验表明,该方法在保证高检测准确度下同时具有较高的效率。陶龙明11等人将 HMM 用于检测隐蔽性强、持续时间长且分步完成的复杂网络攻击(如网络钓鱼攻击、大规模 DDOS 攻击等),该文通过关联分析不同网络监视器的报警事件,产生用于HMM 模型学习及检
18、测的报警序列,实验结果表明,HMM不仅能较好地检测出这些复杂的网络攻击,而且还能对它们进行分类。在网络安全领域, HMM除了应用于入侵检测,还应用于数据库异常检测12、Web 用户异常访问13等的检测中。3.3 HMM在信息抽取中的应用WWW 的广泛应用使得 Internet成为了信息的海洋,信息抽取 (Information Extraction, IE)是处理海量文本信息的重要环节,旨在帮助人们从海量联机文本中快速、准确地抽取自己真正需要的信息,抽取出来的信息以一定的方式存储在数据库中,为情报分析和检测、比价购物、自动文摘、文本分类等各种应用提供服务。信息抽取中目标信息在网页、文章等中的具
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 2022年隐马尔可夫模型及其最新应用与发展 2022 年隐马尔可夫 模型 及其 最新 应用 发展
限制150内