语音信号处理第6讲.优秀PPT.ppt
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_05.gif)
《语音信号处理第6讲.优秀PPT.ppt》由会员分享,可在线阅读,更多相关《语音信号处理第6讲.优秀PPT.ppt(41页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、5.1 概述5.2端点检测5.3基音周期估计5.4共振峰估计语音信号是一种短时平稳信号时变,困难且携带包含语义、个人特征等有用信息特征参数应当能够比较精确地表达语音信号的特征,具有精确性和唯一性,是语音识别的基础20世纪40年头,提出的语谱图,对语音信号有很强的描述实力,形成最早的语音特征后来,人们发觉利用语音信号的时域特征可以从语音波形中提取反映语音特性的参数,如短时幅度,短时帧平均能量,短时帧过零率,短时自相关系数、平均幅度差函数等不仅能减小模板数目,运算量和存储量,还能消退冗余信息语音信号分帧提取,每帧构成一个矢量,即语音信号特征是一个矢量序列端点检测:一段语音信号中精确地找出语音信号的
2、起始点和结束点目的:把有效的语音信号好无用的噪声信号分别在语音识别,语音增加,语音编码,回声抵消等系统中应用广泛语音端点检测方法分类(1)基于阈值的方法:依据语音信号和噪声信号的不同特征,提取每一段语音信号的特征并与设定的阈值进行比较(2)基于模式识别的方法,须要估计语音信号和噪声信号的模型参数来进行比较,鉴于模式识别方法自身困难度高,运算量大,很难应用到实时语音信号中端点检测本质上是依据语音和噪声的相同参数所表现出的不同特征来进行区分。传统的短时能量和过零率相结合的语音端点检测算法,短时过零率来检测清音,用短时能量来检测浊音,两者相协作实现了信号信噪比较大状况下的端点检测(以短时能量检测为主
3、,短时过零率检测为辅)短时能量法(已讲)可以较好地区分出浊音和静音短时过零率(已讲)对于清音,其能量较小,会因为低于能量门限而被误判为静音,短时过零率可以区分静音和清音双门限法:基于短时能量(高门限)和过零率(低门限)的双门限端点检测算法(当低门限被超过时,有可能是噪声引起的,未必是语音的起先,当高门限被超过并在接下来的时间段内始终超过低门限时,意味着语音信号的起先)双门限法步骤:(1)计算短时能量(高门限)和过零率(低门限)(2)选取一个较高的门限 ,语音信号的能量包络大部分都在此门限之上,进行一次初判,语音起止点位于该门限与短时能量包络交点所对应的时间间隔之外(3)依据噪声能量,确定一个较
4、低的门限 并从初判起点往左,从初判终点往右搜寻,分别找到能零比曲线 第一次与门限 ,相交的两个点,两点之间段就是用双门限方法所判定的语音段(4)以短时平均过零率为准,从低门限点往左右搜寻,找到短时平均过零率低于某阈值的两点,为语音的起止点注:门限值要通过多次试验来确定自相关法:(1)短时自相关(已讲)(2)由于两种信号的自相关函数存在极大的差异,可以利用这种差别来提取语音端点。依据噪声的状况,设置两个阈值 和 ,当相关函数最大值大于 时,便判定是语音;当相关函数最大值大于或小于 时,则判定为语音信号的端点。谱熵法熵表示信息的有序程度,语音的熵和噪声的熵存在较大的差异,可以体现语音和噪声在整个信
5、号段中的分布概率谱熵语音端点检测方法是通过检测谱的平坦程度,达到语音端点检测的目的。谱熵定义:设语音信号时域波形为 ,加窗分帧处理后得到的第n帧语音信号为 ,其FFT表示为 ,k表示为第k条谱线。该语音帧在频域中的短时能量为:某一谱线k的能量谱为则每个频率重量的归一化谱概率密度函数为该语音帧的短时谱熵为:基于谱熵的端点检测:基于谱熵语音端点检测方法是通过检测谱的平坦程度,来进行语音端点检测的,为了更好地进行语音端点检测,接受语音信号的短时功率谱构造语音信息谱熵,从而对语音段和噪声段进行区分。检测思路:对语音信号进行分帧加窗,取FFT的点数计算每一帧的谱能量计算出每一帧中每个样本点的概率密度函数
6、计算出每一帧的谱熵值设置判决门限依据各帧的谱熵值进行端点检测比例法(1)能零比的端点检测在噪声状况下,信号的短时能量和短时过零率会发生确定变更,严峻时会影响端点检测。如右图所示,语音信号的说话区间能量是向上凸起的,而过零率相反,是下凹的,这说明说话区间能量值大,过零率小,噪声区间能量值小,过零率大,从而可以检测语音端点比例法(1)能零比的端点检测为此,提出改进式能量 ,a为常数,适当的取值有助于区分噪声和清音进行限幅之后的过零率故能零比表示为 ,b为较小的常数,用于防止分母为零(2)能熵比的端点检测谱熵值类似于过零率,能熵比的表示为对数频谱距离法(自学)基音:一般的声音都是由发音体发出的一系列
7、频率、振幅各不相同的振动复合而成的。这些振动中有一个频率最低的振动,由它发出的音就是基音,其余为泛音。基音周期是指声带振动频率的倒数。基音周期是语音信号最重要的参数之一,它描述了语音激励源的一个重要特征。基音周期信息在多个领域有着广泛的应用,如:语音识别、说话人识别、语音分析与综合以及低码率语音编码、发音系统疾病诊断、听觉残障者的语言指导等。由于汉语是一种有调语言,基音的变更模式称为声调,它携带着特别重要的具有辨意作用的信息,有区分意义的功能,所以,基音的提取和估计对汉语更是一个特别重要的问题。基音检测的主要困难在于:声门激励信号并不是一个完整周期的序列,在语音的头、尾部并不具有声带振动那样的
8、周期性,有些清音和浊音的过度帧是很难精确地推断是周期还是非周期性的;在很多状况下,清音语音和低电平浊音语音段之间的过渡段是特别微小的,确定它是极其困难的;从语音信号中去除声道影响,干脆取出仅和声带振动有关的激励信号的信息并不简洁,例如声道的共振峰有时会严峻影响激励信号的谐波结构。这种影响在发音器官快速动作而共振峰也快速变更时,对对基音检测是最具危害性的。尽管基音检测有很多困难,但因为它的重要性,基音的检测提取始终是一个探讨的课题。为此提出了各种各样的基音检测算法,如自相关函数(ACF)法、峰值提取算法(PPA)、平均幅度差函数(AMDF)法、并行处理技术、倒谱法、简化逆滤波法(SIFT)谱图法
9、、小波法这一节将介绍几种常用的基音提取方法。语音信号是非平稳的信号,所以对信号的处理都运用短时自相关函数。短时自相关函数是在信号的第N个样本点旁边用短时窗截取一段信号,做自相关计算所得的结果m表示窗函数是从第m点起先加入 自相关法自相关法语音信号语音信号s(m)s(m)经窗长为经窗长为N N的窗口截取为一段加窗语音信的窗口截取为一段加窗语音信号号Sn(m)Sn(m)后,定义后,定义Sn(m)Sn(m)的自相关函数的自相关函数(ACF),Rn(k)(ACF),Rn(k)(亦亦即语音信号即语音信号s(m)s(m)的短时自相关函数的短时自相关函数)为:为:Rn(k)Rn(k)不为零的范围为是不为零的
10、范围为是k=(-N+1)k=(-N+1)(N1)(N1),且为偶函,且为偶函数。由数。由4 4章的分析可知,浊音信号的自相关函数在基章的分析可知,浊音信号的自相关函数在基音周期的整数倍位置上出现峰值;而清音的自相关函音周期的整数倍位置上出现峰值;而清音的自相关函数没有明显的峰值出现。因此检测是否有峰值就可推数没有明显的峰值出现。因此检测是否有峰值就可推断是清音或浊音,检测峰值的位置就可提取基音周期断是清音或浊音,检测峰值的位置就可提取基音周期值。值。clcclear all x=wavread(C:UsersDesktopbearings.wav);figure(1);stem(x,.);n=
11、160;%取20ms的声音片段,即160个样点 for m=1:length(x)/n;%对每一帧求短时自相关函数 for k=1:n;Rm(k)=0;for i=(k+1):n;Rm(k)=Rm(k)+x(i+(m-1)*n)*x(i-k+(m-1)*n);end end p=Rm(10:n);%防止误判,去掉前边10个数值较大的点 Rmax,N(m)=max(p);%读取第一个自相关函数的最大值 end%补回前边去掉的10个点 N=N+10;T=N/8;%计算出对应的周期 figure(2);stem(T,.);axis(0 length(T)0 10);xlabel(帧数(n);ylab
12、el(周期(ms);title(各帧基音周期);平均幅度差函数法(平均幅度差函数法(AMDFAMDF)语音信号的短时平均幅度差函数语音信号的短时平均幅度差函数(AMDF)Fn(k)(AMDF)Fn(k)定义为:定义为:与短时自相关函数一样,对周期性的浊音语音,与短时自相关函数一样,对周期性的浊音语音,Fn(k)Fn(k)也呈现与浊音语音周期相一样的周期特性,不过不同也呈现与浊音语音周期相一样的周期特性,不过不同的是的是Fn(k)Fn(k)在周期的各个整数倍点上具有谷值特性而在周期的各个整数倍点上具有谷值特性而不是峰值特性不是峰值特性因而通过因而通过Fn(k)Fn(k)的计算同样可以来确定基音周
13、期。而对的计算同样可以来确定基音周期。而对于清音语音信号,于清音语音信号,Fn(k)Fn(k)却没有这种周期特性。利用却没有这种周期特性。利用Fn(k)Fn(k)的这种特性,可以判定一段语音是浊音还是清的这种特性,可以判定一段语音是浊音还是清音,并估计出浊音语音的基音周期。音,并估计出浊音语音的基音周期。但是,短时平均幅度差函数来估计基音周期时,要求窗但是,短时平均幅度差函数来估计基音周期时,要求窗长取得足够长。可以接受长取得足够长。可以接受LPCLPC逆滤波和中心削波处理逆滤波和中心削波处理等方法来削减输入语音中声道特性或共振峰的影响,等方法来削减输入语音中声道特性或共振峰的影响,供应基音周
14、期估计效果供应基音周期估计效果 无论是利用自相关函数还是平均幅度差函数,语音帧应无论是利用自相关函数还是平均幅度差函数,语音帧应运用矩形窗运用矩形窗窗长的选择要合适,一般认为窗长至少应当大于两个基窗长的选择要合适,一般认为窗长至少应当大于两个基音周期,而为了改善估计结果,窗长应选的更长一些,音周期,而为了改善估计结果,窗长应选的更长一些,是帧信号包含足够多个语音周期是帧信号包含足够多个语音周期平均幅度差的计算无需乘法运算,其计算困难度较小,平均幅度差的计算无需乘法运算,其计算困难度较小,且基音周期点处的平均幅度差的谷点锐度比自相关函且基音周期点处的平均幅度差的谷点锐度比自相关函数的峰点锐度更尖
15、锐,估值精度更高(缘由:平均幅数的峰点锐度更尖锐,估值精度更高(缘由:平均幅度差与语音信号幅度的快速变更比较敏感,影响估计度差与语音信号幅度的快速变更比较敏感,影响估计的精度)的精度)倒谱(倒谱(CEPCEP)法)法倒谱法是传统的基音周期检测算法之一,它利用语音信倒谱法是传统的基音周期检测算法之一,它利用语音信号的倒频谱特征,检测出表征声门激励周期的基音信号的倒频谱特征,检测出表征声门激励周期的基音信息。息。缘由:浊音语音的复倒谱中存在峰值,其出现时间等于缘由:浊音语音的复倒谱中存在峰值,其出现时间等于基因周期;而清音语音段的复倒谱则不出现这种峰值。基因周期;而清音语音段的复倒谱则不出现这种峰
16、值。利用这一性质可以进行清利用这一性质可以进行清/浊音推断并估计浊音的基浊音推断并估计浊音的基音周期。音周期。步骤:步骤:计算复倒谱计算复倒谱解卷解卷提取出声门激励信息,在预期的基音周期旁边找寻峰值提取出声门激励信息,在预期的基音周期旁边找寻峰值假如峰值超过了预先设定的门限,则语音断定为浊音,假如峰值超过了预先设定的门限,则语音断定为浊音,而峰的位置就是基音周期的估值而峰的位置就是基音周期的估值假如不存在超出门限的峰值,则语音断定为清音假如不存在超出门限的峰值,则语音断定为清音假如计算的是依靠于时间的复倒谱,则可估计出激励源假如计算的是依靠于时间的复倒谱,则可估计出激励源模型及基音周期随时间的
17、变更模型及基音周期随时间的变更 倒谱(倒谱(CEPCEP)法)法如前面所述,语音如前面所述,语音s(n)s(n)是由声门脉冲激励是由声门脉冲激励e(n)e(n)经声道响经声道响应应v(n)v(n)滤波而得。即:滤波而得。即:s(n)=e(n)*v(n)s(n)=e(n)*v(n)设三者的倒谱分别为设三者的倒谱分别为 及及 ,则有:,则有:可见,倒谱域中基音信息与声道信息可以认为是相对分可见,倒谱域中基音信息与声道信息可以认为是相对分别的。实行简洁的倒滤波方法可以分别并复原出别的。实行简洁的倒滤波方法可以分别并复原出e(n)e(n)和和v(n)v(n),依据激励,依据激励e(n)e(n)及其倒谱
18、的特征可以求出基音及其倒谱的特征可以求出基音周期。周期。估计基音周期时,没有必要对语音波形完全解卷,所以估计基音周期时,没有必要对语音波形完全解卷,所以用倒谱用倒谱c(n)c(n)就完全可以,这样可以从困难的相位计算就完全可以,这样可以从困难的相位计算中解脱出来;中解脱出来;对于人耳而言,对语音信号的相位不很敏感,可以假定对于人耳而言,对语音信号的相位不很敏感,可以假定输入语音信号是最小相位序列,这样可由最小相位信输入语音信号是最小相位序列,这样可由最小相位信号法计算号法计算c(n)c(n)倒谱(倒谱(CEPCEP)法)法反应信息的倒谱峰,在过渡音和含噪语音中将会变得不反应信息的倒谱峰,在过渡
19、音和含噪语音中将会变得不清晰甚至完全消逝。其缘由当然主要是因为过渡音中清晰甚至完全消逝。其缘由当然主要是因为过渡音中周期激励信号能量降低和类噪激励信号干扰或含噪语周期激励信号能量降低和类噪激励信号干扰或含噪语音中的噪声干扰所致。音中的噪声干扰所致。对于一帧典型的浊音语音的倒谱,其倒谱域中基音信息对于一帧典型的浊音语音的倒谱,其倒谱域中基音信息与声道信息并不是完全分别的,在周期激励信号能量与声道信息并不是完全分别的,在周期激励信号能量较低的状况下,声道响应较低的状况下,声道响应(特殊是其共振峰特殊是其共振峰)对基音倒对基音倒谱峰的影响就不行忽视。谱峰的影响就不行忽视。假如设法除去语音信号中的声道
20、响应信息,对类噪激励假如设法除去语音信号中的声道响应信息,对类噪激励和噪声加以适当抑制,倒谱基音检测算法的检测结果和噪声加以适当抑制,倒谱基音检测算法的检测结果将有所改善,特殊对过渡语音的检测结果将有明显改将有所改善,特殊对过渡语音的检测结果将有明显改善。善。倒谱(倒谱(CEPCEP)法)法除去语音信号中的声道响应信息可以接受除去语音信号中的声道响应信息可以接受LPCLPC方法,此方法,此时语音信号可以表示为:时语音信号可以表示为:在预料分析之后,可构成逆滤波器在预料分析之后,可构成逆滤波器A(z)A(z)原始语音原始语音 逆滤波器逆滤波器A(z)A(z)进行逆滤波进行逆滤波 获得预料余获得预
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 语音 信号 处理 优秀 PPT
![提示](https://www.taowenge.com/images/bang_tan.gif)
限制150内