2022年隐马尔可夫总结 .pdf
《2022年隐马尔可夫总结 .pdf》由会员分享,可在线阅读,更多相关《2022年隐马尔可夫总结 .pdf(16页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、隐马尔可夫 Hidden Markov Model, HMM 一、马尔可夫过程Markov Process 1、马尔可夫过程介绍马尔可夫过程(Markov Process),它因俄罗斯数学家安德烈马尔可夫而得名,代表数学中具有 马尔可夫性质的离散随机过程。 该过程中, 每个状态的转移只依赖于之前的n个状态,这个过程被称为1 个 n 阶的模型, 其中 n 是影响转移状态的数目。最简单的马尔科夫过程就是一阶过程,每一个状态的转移只依赖于其之前的那一个状态。马尔可夫链是随机变量X1, , Xn的一个数列。这些变量的范围,即他们所有可能取值的集合,被称为“状态空间”,而 Xn的值则是在时间n 的状态。
2、如果Xn+1对于过去状态的条件概率分布仅是Xn的一个函数,则这里 x 为过程中的某个状态。上面这个恒等式可以被看作是马尔可夫性质。2、马尔可夫过程举例以下图展示了天气这个例子中所有可能的一阶转移:注意一个含有N 个状态 的一阶过程有N2个状态转移。每一个转移的概率叫做状态转移概率(state transition probability) ,即从一个状态转移到另一个状态的概率。这所有的N2个概率可以用一个状态转移矩阵 来表示,其表示形式如下:对该矩阵有如下约束条件:精选学习资料 - - - - - - - - - 名师归纳总结 - - - - - - -第 1 页,共 16 页下面就是海藻例子
3、的状态转移矩阵:这个矩阵表示, 如果昨天是晴天, 那么今天有50%的可能是晴天, 37.5%的概率是阴天,12.5%的概率会下雨,很明显,矩阵中每一行的和都是1。为了初始化这样一个系统,我们需要一个初始的概率向量:这个向量表示第一天是晴天。3、一阶马尔可夫过程定义如上述马尔可夫过程例子可知,我们为一阶马尔可夫过程定义了以下三个部分:状态 :晴天、阴天和下雨;初始向量 :定义系统在时间为0的时候的状态的概率;状态转移矩阵:每种天气转换的概率;所有的能被这样描述的系统都是一个马尔可夫过程。二、隐马尔可夫过程HMM 1、隐马尔可夫模型介绍隐马尔可夫模型(HMM) 是一个输出符号序列统计模型,具有T
4、个状态 X1,X2.Xt-1,它按一定的周期从一个状态转移到另一个状态,每次转移时,输出一个符号观测值。转移到哪一个状态, 转移时输出什么符号,分别由状态转移概率和转移时输出概率来决定。因为只能观测到输出符号的序列,而不能观测到状态转移序列即模型的观测序列是通过哪个状态路径是不知道的所以称为隐马尔可夫模型。2、隐马尔可夫过程举例下面是一个简单的例子。气象学上, 可通过年轮的宽窄了解各年的气候状况,利用年轮上的信息可推测出几千年来的气候变迁情况。年轮宽表示那年光照充足,风调雨顺; 假设年轮较窄,则表示那年温度低、雨量少,气候恶劣。为了简单起见,我们只考虑冷(code),热精选学习资料 - - -
5、 - - - - - - 名师归纳总结 - - - - - - -第 2 页,共 16 页(hot)两种温度。根据现代的气象知识可以知道,“冷”的一年跟着下一年为热的概率为,为冷的概率为; “热”的一年跟着下一年为热的概率为,为冷的概率为。可以简单的归纳为下面规律:我们将树的年轮简单分为小(small),中(middle), 大(large)三种,或者分别写成S,M,L 。根据现代的气象知识可以知道,热的一年树木年轮为“小”, “中” , “大”的概率分别为;冷的一年树木年轮为“小” , “中”, “大”的概率分别为。因此,冷(C),热 (H) 对年轮的影响可以简单归纳为下面规律:在这个系统中
6、, 状态序列是每年的温度H 或者 C。 因为下一年的温度只与上一年有关,所以从一个状态(温度 )转移到下一个状态(温度 )可以看成是一个一阶Markov process。因为无法观测过去的温度,状态序列也被称为隐藏状态。尽管我们不能观测过去的状态(温度 )序列,但是可以通过树的年轮给我们提供的信息预测温度。我们的目标就是充分利用可观测的年轮序列,来预测那些年的温度序列情况Markov 过程 。从上面规律可以得到,状态转移矩阵A:混淆矩阵(confusion matrix)B:假设初始状态矩阵, (如本例中是初始状态矩阵是最开始产生Hot 和 Cold 天气的概率 )这样可以得到天气与树年轮的概
7、率图模型精选学习资料 - - - - - - - - - 名师归纳总结 - - - - - - -第 3 页,共 16 页图中最开始产生Hot 天气的概率为由初始状态矩阵PI 决定 ,Hot 天气产生树年轮Small 的概率为, Hot 状态产生Hot 状态的概率为,接着Hot 产生 Middle 的概率为以此类推。因此可以得到隐藏天气序列HHCC 产生树木年轮序列为SMSL 的概率。使用这种方法我们就可以计算产生SMSL 序列存在的所有天气序列的概率。比较可得 P(CCCH) 的概率为,是最大的。结论:假设树木年轮序列为SMSL ,则最可能状态序列Markov process是 CCCH ;
8、精选学习资料 - - - - - - - - - 名师归纳总结 - - - - - - -第 4 页,共 16 页产生树木年轮序列为SMSL 的概率为0.009629 所有可能相加 。3、HMM 的三个重要假设以下图显示了天气的例子中隐藏的状态和可以观察到的状态之间的关系。我们假设隐藏的状态是一个简单的一阶马尔可夫过程,并且他们两两之间都可以相互转换。对 HMM 来说,有如下三个重要假设,尽管这些假设是不现实的。假设 1: 马尔可夫假设状态构成一阶马尔可夫链假设 2: 不动性假设状态与具体时间无关假设 3: 输出独立性假设输出仅与当前状态有关4、HMM 的基本元素一个 HMM 可用一个5 元组
9、 N, M, , A,B 表示,其中:N 表示隐藏状态的数量,我们要么知道确切的值,要么猜测该值;M 表示可观测状态的数量,可以通过训练集获得;= i 为初始状态概率;A=aij 为隐藏状态的转移矩阵Pr(xt(i) | xt-1(j)B=bik 表示某个时刻因隐藏状态而导致可观察状态的概率,即混淆矩阵, Pr(ot(i) | xt(j) 。在状态转移矩阵和混淆矩阵中的每个概率都是时间无关的,即当系统演化时,这些矩阵并不随时间改变。对于一个N 和 M 固定的 HMM 来说,用 = , A, B 表示 HMM 参数。三、 HMM的三个基本问题1、问题 1识别问题1.1 问题描述给定模型 = ,
10、A, B 和观测序列O= O0, O1, , OT-1 ,如何快速有效的找到P(O|)?精选学习资料 - - - - - - - - - 名师归纳总结 - - - - - - -第 5 页,共 16 页解释: 假设我们已经有一个特定的隐马尔科夫模型和一个可观察状态序列集。我们也许想知道在所有可能的隐藏状态序列下,给定的可观察状态序列的概率。问题 1 可以归纳为:举例: 如小节的例子中,已知模型,观测序列O=SMSL ,求产生SMSL 年轮序列的概率。1.2 解决方案1.2.1 蛮力算法假设用图表示可以得到如下:其中:然而,这种直接的计算的方法(蛮力算法 )一般是不可行的,实际情况中,我们不可能
11、知道每一种可能的路径,而且这种计算的计算量也是十分惊人的,到达大约数量级。如,当精选学习资料 - - - - - - - - - 名师归纳总结 - - - - - - -第 6 页,共 16 页HMM 的状态数为5,观测序列长度为100 时,计算量到达,是完全无法接受的。因此需要更有效的算法,这就是Baum 等人提出的前向-后向算法。前向算法 (a-pass )前向算法即按输出观察值序列的时间,从前向后递推计算输出概率。首先说明以下符号的定义:由上面的符号的定义,则at(i)可由下面递推公式计算得到:解释:精选学习资料 - - - - - - - - - 名师归纳总结 - - - - - -
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 2022年隐马尔可夫总结 2022 年隐马尔可夫 总结
限制150内