3第四章短时傅里叶变换解析.ppt
《3第四章短时傅里叶变换解析.ppt》由会员分享,可在线阅读,更多相关《3第四章短时傅里叶变换解析.ppt(70页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、4.1 概述1n语音的生成模型由线性系统组成,系统输出的傅里叶频谱反映了激励与声道频率响应特性。n语音信号的频谱具有非常明显的语音声学意义,可以获得某些重要的语音特征,如共振峰频率和带宽等。n话音波是一个非平稳过程,标准傅里叶变换不能用来直接表示语音信号。n由于语音信号的特性是随时间缓慢变化的,因而可以假设它在一短段时间内保持不变。短时分析应用于频域分析就是短时傅里叶变换,即有限长度的傅里叶变换。n短时傅里叶变换可以精确地恢复语音波形。短时傅里叶变换最重要的应用是语音分析-合成系统。2短时幅度谱的计算过程短时幅度谱的计算过程4.2.1 短时(加窗)傅立叶变换的定义34.2.1 短时傅立叶变换-
2、定义n定义:短时傅立叶变换也叫短时谱(加窗的方式)n短时谱的特点:1)时变性:既是角频率的函数又是时间n的函数2)周期性:是关于的周期函数,周期为24n短时傅里叶变换是窗选语音信号的标准傅里叶变换。下标n区别于标准的傅里叶变换。w(n-m)是窗口函数序列。不同的窗口函数序列,将得到不同的傅里叶变换的结果。n短时傅里叶变换有两个自变量:n和,所以它既是关于时间n的离散函数,又是关于角频率的连续函数。n与离散时间序列傅里叶变换和连续傅里叶变换的关系一样,若令2k/N,则得离散频率的短时傅里叶变换,它实际上是在频域的取样。4.2.1 短时傅立叶变换-定义5这两个公式都有两种解释:当n固定不变时,它们
3、是序列w(n-m)x(m)(-m)的标准傅里叶变换或标准的离散时间序列的傅里叶变换。此时与标准傅里叶变换具有相同的性质,而Xn(k)与标准的离散傅里叶变换具有相同的特性。当或k固定时,和Xn(k)看做是时间n的函数。它们是信号序列和窗口函数序列的卷积,此时窗口的作用相当于一个滤波器。4.2.1 短时傅立叶变换-定义64.2.1 短时傅立叶变换-定义n频率分辨率f、取样周期T、加窗宽度N三者关系:n窗形状对短时傅立叶变换的影响 矩形窗主瓣窄,衰减慢;汉明窗主瓣宽,衰减快;n窗宽对短时频谱的影响 窗宽长频率分辨率高,能看到频谱快变化;窗宽短频率分辨率低,看不到频谱的快变化;74.2.2 短时傅立叶
4、变换-标准傅里叶变换的解释(n固定,的函数)n短时傅里叶变换可写为n当n取不同值时窗w(n-m)沿着x(m)序列滑动,所以w(n-m)是一个“滑动的”窗口。n由于窗口是有限长度的,满足绝对可和条件,所以这个变换是存在的。与序列的傅里叶变换相同,短时傅里叶变换随着作周期变化,周期为2。84.2.2 短时傅立叶变换-标准傅里叶变换的解释9n根据功率谱定义,可以写出短时功率谱与短时傅里叶变换之间的关系n式中*表示复共轭运算。同时功率谱是短时自相关函数 的傅里叶变换。n下面将短时傅里叶变换写为另一种形式。设信号序列和窗口序列的标准傅里叶变换为 均存在。当n取固定值时,w(n-m)的傅里叶变换为 4.2
5、.2 短时傅立叶变换-标准傅里叶变换的解释10如果 被看成是w(n-m)x(m)序列的标准傅里叶变换,同时假设x(m)及w(m)的标准傅里叶变换存在,为:当n固定时,序列w(n-m)的傅里叶变换为:4.2.2 短时傅立叶变换-标准傅里叶变换的解释11n根据傅里叶变换的频域卷积定理,有4.2.2 短时傅立叶变换-标准傅里叶变换的解释语音信号x(n)的标准傅里叶变换移动窗口的标准傅里叶变换短时傅里叶变换12写成卷积积分形式:将改换为-后,可以写成:可见,为了使 能够充分地表现 的特性,要求对于 来说,必须是一个冲激脉冲。13n用波形乘以窗函数,不仅为了在窗口边缘两端不引起急剧变化,使波形缓慢降为零
6、,而且还相当于对信号谱与窗函数的傅里叶变换进行卷积,采样。n为此窗函数应具有如下特性:窗函数应具有如下特性:q 频率分辨率高,即主瓣狭窄、尖锐;(矩形窗)(矩形窗)q 通过卷积,在其他频率成分产生的频谱泄漏少,即旁瓣衰减大。(海明窗)(海明窗)q这两个要求实际上相互矛盾,不能同时满足。n窗口宽度N、取样周期T和频率分辨率f之间存在下列关系f1/NT n可见二者是矛盾的。q窗口宽度频率分辨率 时间分辨率q窗口宽度频率分辨率 时间分辨率4.2.2 短时傅立叶变换-标准傅里叶变换的解释14n第一个零点位置为第一个零点位置为2k/N,显然它与窗口宽度成反比。,显然它与窗口宽度成反比。q矩形窗矩形窗,虽
7、然频率分辨率很高,但由于第一旁瓣的衰减只有13.2dB,所以不适合用于频谱成分动态范围很宽的语音分析中。q海明窗海明窗在频率范围中的分辨率较高,而且由于旁瓣的衰减大于42dB,具有频谱泄漏少的优点,频谱中高频分量弱、波动小,因而得到较平滑的谱。q汉宁窗汉宁窗是高次旁瓣低,第一旁瓣衰减只有30dB。n对语音波形乘以海明窗,压缩了接近窗两端的部分波形,等效于用作分析的区间缩短40%左右,因此,频率分辨率下降40%左右。所以,即使在基音周期性明显的浊音频谱分析中,乘以合适的窗函数,也能抑制基音周期与分析区间的相对相位关系的变动影响,从而得到稳定的频谱。因为乘以窗函数将导致分帧区间缩短,所以为跟踪随时
8、间变化的频谱,要求相邻帧之间一部分区域重叠。4.2.2 短时傅立叶变换-标准傅里叶变换的解释154.2.2 短时傅立叶变换-标准傅里叶变换的解释总结:n以上分析可知,窗傅立叶变换W(ej)很重要。为使Xn(ej)忠实再现X(ej)的特性,W(ej)相对于X(ej)来说必须是一个冲激函数。nN越大,W(ej)的主瓣越窄,则Xn(ej)越接近于X(ej)。n当N时,Xn(ej)X(ej)。n但是N值太大时,信号的分帧已失去了意义。尤其是N值大于语音的音素长度时,Xn(ej)已不能反映该语音音素的频谱了。因此,应折衷选择窗宽N。16n其中图(a)是海明窗的窗选信号,图(b)是其对数功率谱;图(c)是
9、矩形窗下的窗选信号,图(d)是其对数功率谱。n从图(a)可以明显看出时间波形的周期性,此周期性同样在图(b)中表现出来。图中基频及其谐波在频谱中表现为等频率间隔的窄峰。图(b)中的频谱大约在300400Hz附近有较强的第一共振峰,而约在2000Hz附近有一个对应于第二、三共振峰的宽峰。此外,还能在3 800Hz附近看到第四个共振峰。最后,由于声门脉冲谱的高频衰减特性,频谱在高频部分表现出下降的趋势。给出了N500时(取样率10 kHz,窗持续时间50 ms)时直角窗及海明窗下浊音语音的频谱。4.2.2 短时傅立叶变换-标准傅里叶变换的解释17n图4-3给出了N50的比较结果(窗口持续时间为5m
10、s)。n由于窗口很短,因而时间序列(图(a)和(c)及信号频谱(图(b)和(d)均不能反映信号的周期性。n与图4-2相反,图4-3只大约在400、1400及2200Hz 频率上有少量较宽的峰值。它们与窗内语音段的前三个共振峰相对应。比较图4-3(b)及(d)的频谱后,再次表明矩形窗可以得到较高的频率分辨率。4.2.2 短时傅立叶变换-标准傅里叶变换的解释18结论结论:n窗口宽度与短时傅里叶变换特性之间的关系窗口宽度与短时傅里叶变换特性之间的关系n用窄窗可得到好的时间分辨率用窄窗可得到好的时间分辨率n用宽窗可以得到好的频率分辨率。用宽窗可以得到好的频率分辨率。n但由于采用窗的目的是要限制分析的时
11、间以使其但由于采用窗的目的是要限制分析的时间以使其中波形的特性相对稳定没有显著变化,因而要折中波形的特性相对稳定没有显著变化,因而要折衷考虑。衷考虑。4.2.2 短时傅立叶变换-标准傅里叶变换的解释19nw(n)-一个滤波器的单位函数响应n -该滤波器的输出nx(n)-滤波器的输入n过程:调制+滤波4.2.3 短时傅立叶变换-滤波器的解释一(固定,n变化)图4-4 短时傅里叶变换滤波器解释的第一种形式(a)复数运算20 w(n)w(nw(n)是窄带低通滤波器是窄带低通滤波器 将将x(nx(n)的频谱向左搬移的频谱向左搬移了了 ,或等效将,或等效将 频率上频率上的频谱搬移到了零频率处。的频谱搬移
12、到了零频率处。因此为使输出端有:因此为使输出端有:w(nw(n)是是窄带窄带低通滤波器低通滤波器21224.2.3 短时傅立叶变换-滤波器的解释二(分解为实虚部)图4-4 短时傅里叶变换滤波器解释的第一种形式(b)只有实数运算23n令m=n-m 4.2.3 短时傅立叶变换-滤波器的解释三24n 为窄带低通滤波器。第一种形式为低通滤波器;n由于第二种形式中的滤波器单位函数响应为 ,所以它为带通滤波器。4.2.3 短时傅立叶变换-滤波器的解释25n如果将w(n)的滤波运算除外,短时傅里叶变换实际上是信号对复数频率的幅度调制。q第一种形式是在输入端进行调制,x(n)乘以 相当于将x(n)的频谱从移到
13、零频处;而w(n)(直角窗或海明窗等)为窄带低通滤波器。q后一种形式是在输出端进行调制,此时先对信号进行带通滤波,滤波器的单位函数响应为w(n),而调制后输出的是短时谱中心频率为的数值。4.2.3 短时傅立叶变换-滤波器的解释26n 恢复出x(n)的过程称为短时傅里叶反变换,是由短时谱合成语音信号的问题n由于 是n和的二维函数,因而必须对在所涉及的两个变量,即时域及频域内进行取样,取样率的选取应保证 不产生混叠失真,从而能够恢复原始语音信号x(n)。4.3 短时傅立叶变换的取样率27n当当为固定值时为固定值时,是一个单位函数响应为w(n)的低通滤波器的输出。设低通滤波器的带宽为BHz,则 具有
14、与窗相同的带宽。根据取样定理,的取样率至少为2B才不致混叠。n低通滤波器的带宽由w(n)的傅里叶变换 的第一个零点位置01决定,因而B值取决于窗的形状与长度。4.3 短时傅立叶变换的取样率-时间取样率284.3 短时傅立叶变换的取样率-时间取样率n正弦序列的表达式为 q幅值A、初相的含义与模拟正弦信号相同q正弦序列的数字角频率0的含义与一般模拟信号模拟角频率0的概念不同。q离散信号定义的时间为kTs,显然有0=0 Ts,模拟角频率0的单位是rad/s,q数字角频0的单位为rad/s s=rad。0表示相邻两个样值间弧度的变化量。q书上的0用直接表示29n以直角窗和海明窗为例,其第一个零点位置分
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 第四 章短时 傅里叶变换 解析
限制150内