语音信号的频域分析优秀PPT.ppt





《语音信号的频域分析优秀PPT.ppt》由会员分享,可在线阅读,更多相关《语音信号的频域分析优秀PPT.ppt(36页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、第5章语音信号的频域分析5.2基于滤波器组的频域分析 5.1概述5.4STFT 的实现5.3短时 Fourier 变换(STFT)的定义和性质5.5短时 Fourier 谱的取样5.6语音的短时合成技术5.7基于 FFT 的短时 Fourier 分析5.8频域基音检测5.9语音信号的时-频表示(略)第第5 5章语音信号的频域分析章语音信号的频域分析5.15.1概述概述 语音感知与语谱特性关系亲密,人对语谱特性更语音感知与语谱特性关系亲密,人对语谱特性更敏感。敏感。幅频谱特性相像的两段语音,感知相像。幅频谱特性相像的两段语音,感知相像。语谱具有语言声学意义,反应了重要的语语谱具有语言声学意义,反
2、应了重要的语音特征;音特征;如共振峰频率、带宽等。如共振峰频率、带宽等。进行语音频谱分析是相识和处理语音信号的重要进行语音频谱分析是相识和处理语音信号的重要方法。方法。Fourier Fourier 分析是有效手段,是语音的重要分析工分析是有效手段,是语音的重要分析工具。具。语音是非平稳信号,源于发声器官的物理运动过语音是非平稳信号,源于发声器官的物理运动过程。程。在短时间段(如在短时间段(如10 30 ms10 30 ms)内可认为是)内可认为是平稳的;平稳的;用时间依靠处理方法分析处理。用时间依靠处理方法分析处理。第 5 章 语 音 信 号 的 频 域 分 析 5.1 概 述同 济 大 学
3、 电 子 与 信 息 工 程 学 院 -2-赵 晓 群 教 授短时短时 Fourier Fourier 分析(时间依靠分析(时间依靠 Fourier Fourier 变换):变换):用稳态分析处理非平稳信号的一种方法用稳态分析处理非平稳信号的一种方法语音的频域分析:包括语音信号的频谱、功率谱、倒频谱、语音的频域分析:包括语音信号的频谱、功率谱、倒频谱、频谱包络等,频谱包络等,常用频域分析方法:带通滤波器组法、常用频域分析方法:带通滤波器组法、Fourier Fourier 变换法、变换法、同态分析、线性预料法等。同态分析、线性预料法等。本章:带通滤波器组法、本章:带通滤波器组法、Fourier
4、 Fourier 变换法、频域基音检测、变换法、频域基音检测、时时-频表示频表示同 济 大 学 电 子 与 信 息 工 程 学 院 -3-赵 晓 群 教 授第 5 章 语 音 信 号 的 频 域 分 析 5.1 概 述第第5 5章语音信号的频域分析章语音信号的频域分析5.25.2基于滤波器组的频域分析基于滤波器组的频域分析 最早的频谱分析:滤波器组来实现。最早的频谱分析:滤波器组来实现。特点:简洁、实时性好、受外界影响小。特点:简洁、实时性好、受外界影响小。常用模拟滤波器实现,也可用数字滤波器实现。常用模拟滤波器实现,也可用数字滤波器实现。宽带带通滤波器:平坦特性,可粗略求取宽带带通滤波器:平
5、坦特性,可粗略求取语音频谱,辨别率较低,相当于短时处理时窄语音频谱,辨别率较低,相当于短时处理时窄窗状况。窗状况。窄带带通滤波器:频率辨别率较高,窄带带通滤波器:频率辨别率较高,相当于短时处理时宽窗较宽的状况。相当于短时处理时宽窗较宽的状况。图图5.15.1:滤波器组法频谱分析原理图。:滤波器组法频谱分析原理图。图图5.1滤波器组法频率分析原理图滤波器组法频率分析原理图f1f2fn x1(t)x(t)x2(t)xn(t)同 济 大 学 电 子 与 信 息 工 程 学 院 -4-赵 晓 群 教 授第5章语音信号的频域分析 5.2基于滤波器组的频域分析第第5 5章语音信号的频域分析章语音信号的频域
6、分析5.35.3短时短时 Fourier Fourier 变换变换(STFT)(STFT)的定义和性质的定义和性质 5.3.1 5.3.1STFT STFT 的定义的定义语音序列是时变的。语音序列是时变的。分段方法:加一个沿时间轴滑动的窗函数;分段方法:加一个沿时间轴滑动的窗函数;通常窗的宽度有限;通常窗的宽度有限;对应于不同的对应于不同的 n n 值,窗处于不同位置;值,窗处于不同位置;窗函数对语音信号的每个样本进行加权。窗函数对语音信号的每个样本进行加权。图图5.25.2:移动窗函数选取语音段的示意图:移动窗函数选取语音段的示意图 图中运用的是非矩形窗,图中运用的是非矩形窗,时刻时刻 n
7、n 位于窗的中心位于窗的中心 同 济 大 学 电 子 与 信 息 工 程 学 院 -5-赵 晓 群 教 授图图5.2用移动窗选取语音段示意图用移动窗选取语音段示意图第5章语音信号的频域分析 5.3短时 Fourier 变换(STFT)的定义和性质 x(m)的短时 Fourier 变换(STFT)Xn(ej)的定义:式中,w(n)是窗函数。为位于 n 处的窗口视察到的窗选语音短段的 Fourier 变换;n 取不同值时,取出不同的语音短段;Xn(ej)是频率 和时间 n 的函数;有时-频性。要求:STFT 存在,则对全部 n 值,确定确定可和。因窗宽有限,或无限冲激响应窗函数,其有效宽度有限,故
8、满足确定可和。同 济 大 学 电 子 与 信 息 工 程 学 院 -6-赵 晓 群 教 授第5章语音信号的频域分析 5.3短时 Fourier 变换(STFT)的定义和性质 依据依据 STFT,复原原语音信号,复原原语音信号 x(m)的方法:的方法:式式 的逆变换为:的逆变换为:若若w(0)0,由上式得:,由上式得:精确地复原原信号的唯一约束条件是精确地复原原信号的唯一约束条件是 w(0)0。同 济 大 学 电 子 与 信 息 工 程 学 院 -7-赵 晓 群 教 授第5章语音信号的频域分析 5.3短时 Fourier 变换(STFT)的定义和性质 由由STFT的谱的谱 Xn(ej)求解求解
9、x(m)的的 Fourier 变换变换 X(ej)方法。方法。假设假设 x(m)和和 w(m)的的 Fourier 变换都存在,即:变换都存在,即:因因 Xn(ej)是是 x(m)w(n-m)的的 Fourier 变换,变换,则则 Xn(ej)是是 X(ej)与与 ejnW(e-j)的卷积,即的卷积,即 为使为使 Xn(ej)精确代替精确代替 X(ej),移动窗的,移动窗的 W(ej)应是冲激函应是冲激函数;即要求移动窗无限宽。数;即要求移动窗无限宽。同 济 大 学 电 子 与 信 息 工 程 学 院 -8-赵 晓 群 教 授第5章语音信号的频域分析 5.3短时 Fourier 变换(STFT
10、)的定义和性质 留意:由于语音是时变的,故其留意:由于语音是时变的,故其 Fourier Fourier 变换可能不存在。变换可能不存在。通常,通常,窗函数是有限时宽,故窗选语音段可看成从无限长的基窗函数是有限时宽,故窗选语音段可看成从无限长的基本性质持续不变的平稳信号中截取出来的;本性质持续不变的平稳信号中截取出来的;对于爆破音等暂态音,则可看成在窗外取值为零。对于爆破音等暂态音,则可看成在窗外取值为零。若把若把X(ej)X(ej)看成是基本性质在窗外持续不变或窗外取值为零看成是基本性质在窗外持续不变或窗外取值为零的某个平稳信号的的某个平稳信号的 Fourier Fourier 变换,则式变
11、换,则式 就是有意义的。就是有意义的。观点:观点:STFT STFT 是平稳信号的是平稳信号的 Fourier Fourier 变换经加窗平滑的结果。变换经加窗平滑的结果。同 济 大 学 电 子 与 信 息 工 程 学 院 -9-赵 晓 群 教 授第5章语音信号的频域分析 5.3短时 Fourier 变换(STFT)的定义和性质 5.3.2窗函数及窗宽对窗函数及窗宽对STFT的影响的影响图图5.3a:元音:元音 i 的波形和短时频谱图。的波形和短时频谱图。元音元音 i 的基音周期大约是的基音周期大约是 13 ms;短时频谱图有两种变更:短时频谱图有两种变更:快变更:周期性激励引起,快变更:周期
12、性激励引起,基音频率的各次谐波;基音频率的各次谐波;慢变更:声道共振特性引起,慢变更:声道共振特性引起,各共振峰的频率和带宽。各共振峰的频率和带宽。两个频谱图间的差别:两个频谱图间的差别:矩形窗时:谐波各峰较尖锐,矩形窗时:谐波各峰较尖锐,谱图较裂开(类似于噪声),谱图较裂开(类似于噪声),主瓣较窄(较高频率辨别率);主瓣较窄(较高频率辨别率);旁瓣较高,旁瓣较高,“泄漏泄漏”严峻;严峻;Hamming 窗时:短时频谱平滑些。窗时:短时频谱平滑些。短时谱分析,短时谱分析,Hamming 窗较普遍。窗较普遍。同 济 大 学 电 子 与 信 息 工 程 学 院 -1 0-赵 晓 群 教 授第5章语
13、音信号的频域分析 5.3短时 Fourier 变换(STFT)的定义和性质 图图5.3a元音元音i的波形和短时频谱图的波形和短时频谱图(10 kHz取样取样,窗长窗长256)分析窗宽对短时频谱的影响:分析窗宽对短时频谱的影响:图图5.4(a):元音:元音 i 的波形和短时频谱图。的波形和短时频谱图。窗宽窗宽 6.4 ms,元音,元音 i 的基音周期大约是的基音周期大约是 13 ms;窗选语音段长不到一个基音周期,窗选语音段长不到一个基音周期,丢失了基音周期的信息;丢失了基音周期的信息;频的快变更(谐波频率)消逝。频的快变更(谐波频率)消逝。频的慢变更(较宽的峰)保留,频的慢变更(较宽的峰)保留
14、,是声道的共振特性。是声道的共振特性。矩形窗比矩形窗比 Hamming 时,时,呈现较多的细致结构,呈现较多的细致结构,由于矩形窗比由于矩形窗比 Hamming 窗窗 具有更高的频率辨别率。具有更高的频率辨别率。同 济 大 学 电 子 与 信 息 工 程 学 院 -1 1-赵 晓 群 教 授第5章语音信号的频域分析 5.3短时 Fourier 变换(STFT)的定义和性质 图图5.4a元音元音i的波形和短时频谱图的波形和短时频谱图(10 kHz取样取样,窗长64)图图5.3,5.4(b):清辅音:清辅音 j 短时频谱图。短时频谱图。图图5.3(b):窗较长,频率辨别率高,很多快变更,:窗较长,
15、频率辨别率高,很多快变更,反映了激励源的白噪声特性反映了激励源的白噪声特性随机起伏。随机起伏。矩形窗时,快变更尤为突出。矩形窗时,快变更尤为突出。仍旧看出声道滤波器的共振特性。仍旧看出声道滤波器的共振特性。同 济 大 学 电 子 与 信 息 工 程 学 院 -1 2-赵 晓 群 教 授第5章语音信号的频域分析 5.3短时 Fourier 变换(STFT)的定义和性质 图图5.3b清音清音j的波形和短时频谱图的波形和短时频谱图(10 kHz取样取样,窗长窗长256)图图5.4b清音清音j的波形和短时频谱图的波形和短时频谱图(10 kHz取样取样,窗长窗长64)5.3.3结论结论长窗具有较高的频率
16、辨别率,较低的时间辨别率;长窗具有较高的频率辨别率,较低的时间辨别率;短窗具有较低的频率辨别率,较高的时间辨别率;短窗具有较低的频率辨别率,较高的时间辨别率;窗宽的选择需折衷考虑;窗宽的选择需折衷考虑;语音的基音周期值范围很大,窗宽选择应考虑该因素。语音的基音周期值范围很大,窗宽选择应考虑该因素。矩形窗和矩形窗和 Hamming 窗的频谱特性都具有低通的性质。窗的频谱特性都具有低通的性质。截止频率处都较尖锐,截止频率处都较尖锐,当通带较窄时(窗较宽),频谱能很好靠近短时语音谱。窗越当通带较窄时(窗较宽),频谱能很好靠近短时语音谱。窗越宽靠近效果越好。宽靠近效果越好。同 济 大 学 电 子 与
17、信 息 工 程 学 院 -1 3-赵 晓 群 教 授第5章语音信号的频域分析 5.3短时 Fourier 变换(STFT)的定义和性质 第第5 5章语音信号的频域分析章语音信号的频域分析5.45.4STFTSTFT的实现的实现 STFT STFT的定义:的定义:将窗函数的位置参数将窗函数的位置参数 n n 看成是参变量,看成是参变量,给定给定 n n,是连续变量,是连续变量 的函数,为语音段的的函数,为语音段的标准标准Fourier Fourier 变换变换 从不同角度来说明从不同角度来说明 STFT STFT,可得不同的实现方法。,可得不同的实现方法。线性滤波的角度:线性滤波的角度:为参变量
18、,给定为参变量,给定 时,时,是是 n n 的函数。的函数。重写定义式:重写定义式:表明:表明:卷积实现,卷积实现,w(n)w(n)与与 x(n)e-jn x(n)e-jn,序列序列 x(n)e-jn x(n)e-jn 通过冲激响应通过冲激响应为为 w(n)w(n)的线性滤波器的输出的线性滤波器的输出 此时,此时,看成是固定值。看成是固定值。图图5.55.5:STFT STFT 的线性滤波实现的线性滤波实现同 济 大 学 电 子 与 信 息 工 程 学 院 -1 4-赵 晓 群 教 授第 5章 语 音 信 号 的 频 域 分 析 5.4S T F T 的 实 现图图5.5STFT的线性滤波实现
19、的线性滤波实现w(n)x(n)e-jnXn(ejn)图图5.5:STFT 的的线性滤波线性滤波实现实现图图5.6:图图5.5方案的方案的实数运算实数运算 图图5.6方案原理方案原理:设设:则可计算:则可计算:同 济 大 学 电 子 与 信 息 工 程 学 院 -1 5-赵 晓 群 教 授第 5章 语 音 信 号 的 频 域 分 析 5.4S T F T 的 实 现图图5.5STFT的线性滤波实现的线性滤波实现w(n)x(n)e-jnXn(ej)图图5.6STFT分析用线性滤波实现分析用线性滤波实现 cosn an()x(n)bn()sinnw(n)w(n)令令 ,代入式,代入式 将将 用用 m
20、 表示,得:表示,得:上式可用上式可用图图5.7方案实现;方案实现;图图5.8:图图5.7方案的方案的实数运算实数运算(推导略)同 济 大 学 电 子 与 信 息 工 程 学 院 -1 6-赵 晓 群 教 授第 5章 语 音 信 号 的 频 域 分 析 5.4S T F T 的 实 现图图5.7STFT分析线性滤器的另一种形式分析线性滤器的另一种形式 w(n)ejnx(n)e-jnXn(ej)图图5.8用实数实现图用实数实现图5.7的方框图的方框图 x(n)sinnw(n)sinnw(n)cosn cosncosn an()bn()可推得:可推得:须要计算须要计算Xn(ej)时,用图时,用图5
21、.8实现简洁;实现简洁;须要计算须要计算 an()、bn()时,用图时,用图5.6实现较简洁。实现较简洁。线性滤波实现线性滤波实现 STFT 的主要优点:的主要优点:利用了成熟的线性滤波器的成果,实现方法特别简洁。利用了成熟的线性滤波器的成果,实现方法特别简洁。线性滤波分有限冲激响应的和无限冲激响应的、因果的和线性滤波分有限冲激响应的和无限冲激响应的、因果的和非因果的线性滤波方法,非因果的线性滤波方法,相应地,相应地,STFT 或时变频谱分析也可分成有限窗宽和无限或时变频谱分析也可分成有限窗宽和无限窗宽、因果窗和非因果窗等类型。窗宽、因果窗和非因果窗等类型。同 济 大 学 电 子 与 信 息
22、工 程 学 院 -1 7-赵 晓 群 教 授第 5章 语 音 信 号 的 频 域 分 析 5.4S T F T 的 实 现第第5 5章语音信号的频域分析章语音信号的频域分析5.55.5短时短时 Fourier Fourier 谱的取样谱的取样STFT STFT 谱:一维时变信号的二维时谱:一维时变信号的二维时-频表示,频表示,n n 和和 的函数。的函数。采样定理:以不低于其最高频率两倍的取样频率采样定理:以不低于其最高频率两倍的取样频率取样,取样,由样本精确复原出原由样本精确复原出原始信号。始信号。STFT STFT 的取样:是一个更困难的问题。的取样:是一个更困难的问题。在时在时-频变量频
23、变量 n n 和和 上同时进行,并保证上同时进行,并保证不产生混叠失真。不产生混叠失真。同 济 大 学 电 子 与 信 息 工 程 学 院 -1 8-赵 晓 群 教 授第 5章 语 音 信 号 的 频 域 分 析 5.5 短 时 Fourier 谱 的 取 样 时域取样时域取样 STFT线性滤波实现线性滤波实现:图图5.5示。示。w(n):窄带低通滤波器窄带低通滤波器,带宽带宽为为 B。则:则:Xn(ej)的的带宽带宽也为也为 B。在时域内,在时域内,以以 2B 速率速率对对 Xn(ej)取样取样,不产生不产生混叠失真。混叠失真。Hamming 窗时:窗时:w(n)的带宽的带宽 B=2fs/N
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 语音 信号 分析 优秀 PPT

限制150内