连续型隐马尔可夫模型.pdf
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_05.gif)
《连续型隐马尔可夫模型.pdf》由会员分享,可在线阅读,更多相关《连续型隐马尔可夫模型.pdf(5页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、收稿日期:1997204203.第一作者:男,34岁,讲师.3 国家自然科学基金、国家教育委员会博士点基金、广东省自然科学基金资助课题.连 续 型 隐 马 尔 可 夫 模 型(HMM)参 数 与 语 音 识 别3李四信韦岗(华南理工大学电子与通信工程系,广州510641)摘要提出了一种新的连续型隐马尔可夫模型(HMM)的概率密度函数,并导出了一系列的参数寻优迭代公式,与常用的概率密度函数相比,它的运算量较小,且不易产生计算时的上溢与下溢问题,把它用于HMM语音识别,效果较好.关键词连续型隐马尔可夫模型(HMM);特征矢量;观察矢量序列中图分类号TN 912.3影响隐马尔可夫模型(HMM)语音识
2、别率的原因是多方面的,其中,用有关资料中的特征观察矢量的连续概率密度函数,如高斯型混合密度函数,容易产生计算值的上溢或下溢问题,影响了识别率1,3,5.本文针对此问题进行了讨论,提出了新的连续型隐马尔可夫模型(HMM)的概率密度函数.根据线性预测编码(L PC)分析,对每帧语音采样数据,按照“最小均方误差”准测,求得一组最佳预测系数,由此组数据构成的矢量能较好地反映该帧语音信号的特征,同一个词,特定人不同时刻的发音,其L PC最佳预测系数图形具有一定的相似性,可以认为,同一个词,特定人不同时刻的发音,其同一特性的变化服从正态分布.图1语音识别结构设HMM的N个状态为S0,S1,SN-1,初始状
3、态概率分布为:=0,1,N-1,状态转移概率分布为A=(aij),其中 i为起始时刻取第i状态的概率,aij为由第i状态转移到第j状态的概率,在Si状态下输出特征矢量o的概率服从正态分布,对M个待识别的语音,每第32卷第1期华中师范大学学报(自然科学版)Vol.32 No.11998年3月JOURNAL OF CEN TRAL CH I NA NORMAL UN I V ERSITY(N at.Sci.)M ar.1998 1994-2007 China Academic Journal Electronic Publishing House.All rights reserved.http:
4、/一个都建立一个HMM模型参数(i)(i=0,1,2,M-1),有关详细内容见文献2.本文使用的模型识别原理如图1.1 HMM概率密度函数的选择与迭代计算公式的推导取信号采样率为8 kHz,8 Bit量化,取得语音信号数据序列,加汉明窗:w(n)=0.54-0.46cos(2n?191),n=0,1,2,191,0,n为其它数时,图2汉明窗取24 m s为一帧,共192个样本点,对它进行三分划分,取中间64个样本点,帧移为8 m s,帧重叠为64个样本点,对中间64个样本点求16维的自相关矢量,并进行整体归一化处理,再求12维的L PC倒谱系数矢量,构成特征矢量序列ot.设在第i状态下输出矢量
5、o的概率密度函数服从方差为单位阵的正态分布:pi(o)=1(2)D?2exp-12(o-i)(o-i),其中 i为矢量o的加权中值矢量,D为观察矢量o的维数,“”为矢量o-i的转置.于是连续HMM的参数为:=(,A,i).如果表征语音信号的特征矢量序列为o=(o0,o1,oT-1),记q=q0q1qT-1为N个状态S0,S1,SN-1的可重复排列,那么,在 下产生特征矢量序列O的概率为:p(O)=qq0aq0q1aqT-2qT-1pq0(o0)pq1(o1)pqT-1(oT-1)=1(2)-D T?2qq0aq0q1aqT-2qT-1exp-12T-1i=0(oi-qi)(oi-qi).上式中
6、,T一般取值在35至85之间,D一般取值在8至16之间,而和式中每一项的乘积因子都小于1,上式的第一个因子是一个接近于0.0的数,由此可见,此因子很容易引起概率值的下限溢出.为了防止下溢,记p3(O)=(2)D T?2p(O),于是,求P(O)的极大值就转化为求p3(O)的极大值.为了简化起见,仍把p3(O)记为p(O),并且,把上面的概率密度函数改写成:pi(o)=exp-12(o-i)(o-i),可以证明,这样处理,除了概率值放大(2)D T?2倍以外,HMM参数 保持不变,限于篇幅略去其证明,于是有:p(O)=qq0aq0q1aqT-2qT-1exp-12T-1i=0(oi-qi)(oi
7、-qi).记44华中师范大学学报(自然科学版)第32卷 1994-2007 China Academic Journal Electronic Publishing House.All rights reserved.http:/p(O,q)=q0aq0q1aqT-2qT-1exp-12T-1i=0(oi-qi)(oi-qi),考虑辅助函数:Q()=qp(O,q)lnp(O,q),其中:=(,A,i)为待求参数,=(,A,i)为已知初始参数.则Q()=qp(O,q)lnq0+T-1t=0lnaqt-1qt-12T-1t=0(ot-qt)(ot-qt),约束条件为:N-1i=0i=1,N-1j=
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 连续 型隐马尔可夫 模型
![提示](https://www.taowenge.com/images/bang_tan.gif)
限制150内