LPC语音信号处理第3.6章.ppt
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_05.gif)
《LPC语音信号处理第3.6章.ppt》由会员分享,可在线阅读,更多相关《LPC语音信号处理第3.6章.ppt(30页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、3.63.6语音信号的线性预测分析语音信号的线性预测分析3.73.7基间周期估计基间周期估计 (单独单独)3.83.8共振峰估计共振峰估计3.6 3.6 语音信号的线性预测分析语音信号的线性预测分析v线性预测分析线性预测分析的基本思想是:由于语音样点之间存的基本思想是:由于语音样点之间存在相关性,所以可以用过去的样点值来预测现在或在相关性,所以可以用过去的样点值来预测现在或未来的样点值,即一个语音的抽样能够用过去若干未来的样点值,即一个语音的抽样能够用过去若干个语音抽样或它们的线性组合来逼近。个语音抽样或它们的线性组合来逼近。v通过使实际语音抽样和线性预测抽样之间的误差在通过使实际语音抽样和线
2、性预测抽样之间的误差在某个准则下达到最小值来决定唯一的一组预测系数。某个准则下达到最小值来决定唯一的一组预测系数。而这组预测系数就反映了语音信号的特性,可以作而这组预测系数就反映了语音信号的特性,可以作为语音信号特征参数用于语音识别、语音合成等。为语音信号特征参数用于语音识别、语音合成等。线性预分析的基本原理线性预分析的基本原理v线性预测分析的基本思想是:用过去线性预测分析的基本思想是:用过去p p个样点值来预测现在个样点值来预测现在或未来的样点值:或未来的样点值:v预测误差预测误差(n)(n)为:为:v这样就可以通过在某个准则下使预测误差这样就可以通过在某个准则下使预测误差(n)(n)达到最
3、小值达到最小值的方法来决定惟一的一组线性预测系数的方法来决定惟一的一组线性预测系数a ai i(i=1i=1,2 2,p p)。)。线性预分析的基本原理线性预分析的基本原理v图图3-53-5的模型系统函数的模型系统函数H(z)H(z)可以写成有理分式的形式:可以写成有理分式的形式:v采用全极点模型,传输函数为:采用全极点模型,传输函数为:v线性预测器线性预测器:v式中式中a ai i称为线性预测系数。从而,称为线性预测系数。从而,p p阶线性预测器的系统函数阶线性预测器的系统函数具有如下形式:具有如下形式:v预测误差为:预测误差为:v线性预测分析要解决的问题是:给定语音序列线性预测分析要解决的
4、问题是:给定语音序列(显然,鉴于显然,鉴于语音信号的时变特性,语音信号的时变特性,LPCLPC分析必须按帧进行分析必须按帧进行),使预测误差,使预测误差在某个准则下最小,求预测系数的最佳估值在某个准则下最小,求预测系数的最佳估值a ai i,这个准则通这个准则通常采用常采用最小均方误差准则最小均方误差准则。v下面推导线性预测方程。把某一帧内的下面推导线性预测方程。把某一帧内的短时平均预测误差短时平均预测误差定定义为:义为:v为使为使EE2 2(n)(n)最小,对最小,对a aj j求偏导,并令其为零,有:求偏导,并令其为零,有:v采用最佳预测系数时,预测误差采用最佳预测系数时,预测误差(n)(
5、n)与过去的语音样点正与过去的语音样点正交。由于语音信号的短时平稳性,要分帧处理交。由于语音信号的短时平稳性,要分帧处理(10-30ms),(10-30ms),对对于一帧从于一帧从n n时刻开窗选取的时刻开窗选取的N N个样点的语音段个样点的语音段S Sn n,记记n n(j,i)(j,i)为为v则有:则有:线性预测方程组的求解线性预测方程组的求解v对于语音段对于语音段S Sn n,它的自相关函数为:它的自相关函数为:v因此,可以定义因此,可以定义n n(j,i)(j,i)为为v因此有:因此有:线性预测方程组的求解线性预测方程组的求解v把上式展开写成矩阵形式:把上式展开写成矩阵形式:v这种方程
6、叫这种方程叫Yule-WslkerYule-Wslker方程方程,方程左边的矩阵称为,方程左边的矩阵称为托普利托普利兹兹(Toeplitz)(Toeplitz)矩阵矩阵,它是以主对角线对称的、而且其沿着主,它是以主对角线对称的、而且其沿着主对角线平行方向的各轴向的元素值都相等。这种对角线平行方向的各轴向的元素值都相等。这种Yule-Yule-WslkerWslker方程可用方程可用莱文逊莱文逊-杜宾杜宾(LevinsonDurbin)(LevinsonDurbin)递推算法递推算法来高效地求解。下面介绍来高效地求解。下面介绍DurbinDurbin快速递推算法。快速递推算法。线性预测方程组的求
7、解线性预测方程组的求解v完整的递推过程为:完整的递推过程为:if ip go to(1)if ip go to(1)LPC特征案例v在本次实验中分别对h u t ao 这四个提取LPC特征v采样率为16000Hz,单声道.v帧长为32ms,帧移为16msv使用自相关法求解LPC特征5.LPC特征提取-hLPC系数为:-0.8202-0.4106 0.0765 -0.4185 0.3262 0.2405 0.2874 0.1080 -0.4481 0.3147 -0.1685-0.0854h的波形5.LPC特征提取-uLPC系数为:-2.0420 1.4623 -0.4832 -0.3253 0
8、.5238 -0.0108 -0.0508 0.0054 -0.1332 0.1888 -0.1692 0.0549u的波形5.LPC特征提取-tLPC系数为:-1.0772 0.5986 -0.2074 -0.1201 -0.2620 0.1746 0.1952 -0.3134 0.1175 0.1708 -0.2086 -0.0512t的波形5.LPC特征提取-aoLPC系数为:-2.0912 1.9318 -1.3574 0.7663 -0.2111 -0.1302 0.4606 -0.3900 0.2447 -0.2715 0.1442 -0.0027ao的波形 LPCLPC谱估计和谱
9、估计和LPCLPC复倒谱复倒谱1.LPC1.LPC谱估计谱估计v当求出一组预测器系数后,就可以得到语音产生模型的频率当求出一组预测器系数后,就可以得到语音产生模型的频率响应,即:响应,即:v因此在共振峰频率上其频率响应特性会出现峰值。所以线性因此在共振峰频率上其频率响应特性会出现峰值。所以线性预测分析法又可以看做是一种短时谱估计法。其频率响应预测分析法又可以看做是一种短时谱估计法。其频率响应H H(e(ejj)即称为即称为LPCLPC谱谱。LPCLPC谱估计和谱估计和LPCLPC复倒谱复倒谱1.LPC1.LPC谱估计谱估计vLPCLPC谱估计具有一个特点:在信号能量较大的区域即接近谱谱估计具有
10、一个特点:在信号能量较大的区域即接近谱的峰值处,的峰值处,LPCLPC谱和信号谱很接近;而在信号能量较低的区谱和信号谱很接近;而在信号能量较低的区域即接近谱的谷底处,则相差比较大。这个特点对于呈现谐域即接近谱的谷底处,则相差比较大。这个特点对于呈现谐波结构的浊音语音谱来说,就是在谐波成分处波结构的浊音语音谱来说,就是在谐波成分处LPCLPC谱匹配信谱匹配信号谱的效果要远比谐波之间好得多。号谱的效果要远比谐波之间好得多。LPCLPC谱估计的这一特点谱估计的这一特点实际上来自均方误差最小准则。实际上来自均方误差最小准则。v从以上讨论我们知道如果从以上讨论我们知道如果p p选得很大,可以使选得很大,
11、可以使|H(e|H(ejj)|)|精确精确地匹配于地匹配于|S(e|S(ejj)|)|,而且极零模型也可以用全极点模型来代,而且极零模型也可以用全极点模型来代替,但却增加了计算量和存储量,且替,但却增加了计算量和存储量,且p p增加到一定程度以后,增加到一定程度以后,预测平方误差的改善就很不明显了,因此在语音信号处理中,预测平方误差的改善就很不明显了,因此在语音信号处理中,p p一般选在一般选在8 81414之间。之间。LPCLPC谱估计和谱估计和LPCLPC复倒谱复倒谱2 2LPCLPC复倒谱复倒谱vLPCLPC系数是线性预测分析的基本参数,可以把这些系数变换系数是线性预测分析的基本参数,可
12、以把这些系数变换为其他参数,以得到语音的其他替代表示方单。为其他参数,以得到语音的其他替代表示方单。LPCLPC系数可系数可以表示整个以表示整个LPCLPC系统冲激响应的复倒谱。系统冲激响应的复倒谱。v按上式求得的复倒谱按上式求得的复倒谱h h(n)(n)称之为称之为LPCLPC复倒谱。复倒谱。vLPCLPC复倒谱由于利用了线性预测中声道系统函数复倒谱由于利用了线性预测中声道系统函数H(z)H(z)的最小的最小相位特性,避免了相位卷绕问题;且相位特性,避免了相位卷绕问题;且LPCLPC复倒谱的运算量小,复倒谱的运算量小,它仅是用它仅是用FFTFFT求复倒谱时运算量的一半;又因为当求复倒谱时运算
13、量的一半;又因为当p p时,时,语音信号的短时复频谱语音信号的短时复频谱S(eS(ejj)满足满足|S(e|S(ejj)|=|H(e)|=|H(ejj)|)|,因,因而可以认为而可以认为h h(n)(n)包含了语音信号频谱包络信息,即可近似包含了语音信号频谱包络信息,即可近似把把h h(n)(n)当作当作s(n)s(n)的短时复倒谱的短时复倒谱s s(n)(n),来分别估计出语音短,来分别估计出语音短时谱包络和声门激励参数。在实时语音识别中也经常采用时谱包络和声门激励参数。在实时语音识别中也经常采用LPCLPC复倒谱作为特征矢量。复倒谱作为特征矢量。v对以上所介绍的进行总结可知,为了估计语音信
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- LPC 语音 信号 处理 3.6
![提示](https://www.taowenge.com/images/bang_tan.gif)
限制150内