《数字语音处理》实验指导书.doc





《《数字语音处理》实验指导书.doc》由会员分享,可在线阅读,更多相关《《数字语音处理》实验指导书.doc(18页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、数字语音处理实验指导书学校:中国地质大学 院系:机械与电子工程学院专业:电子信息工程编制:电信教研室版本:2005目录前言单元1 MATLAB练习单元2 综合分析实验附录1 MATLAB软件简介附录2 MATLAB基本使用方法附录3 wavread函数附录4 specgram函数参考文献单元1 MATLAB练习实验目的l 了解信号谱分析特点,掌握各种窗函数功率谱的异同及其对短时信号谱分析的作用。l 明确短时傅立叶变换与声谱图的关系,理解其对语音信号的时频分析作用。l 学习音频文件的基本操作方法。l 学习用MATLAB实现基本的语音信号处理,提高自学和动手能力,培养学习兴趣。实验原理1、 离散频
2、谱、幅度谱和功率谱离散频谱是信号序列的离散傅立叶变换,常用快速傅立叶变换(FFT)计算。离散频谱描述的是信号在频率采样点上的幅度和相位值,包括幅度-频率关系和相位频率关系,幅度谱就是前者。功率谱是幅度平方频率关系。由于语音的对数听觉效应,幅度谱和功率谱常用对数形式表达,单位为分贝。对数幅度谱=10lg幅度谱,对数功率谱=10lg幅度谱2=20 lg幅度谱。由此可见,对数幅度谱与对数功率谱在谱形上是相似的,只不过谱的幅度方向相差一倍。对于窗序列的离散频谱、幅度谱和功率谱,结论也是类似的。2、 短时傅立叶变换和声谱图短时傅立叶变换的实质,是在时间和频率上同时对信号序列进行分解,使得信号被分解成若干
3、个时段和频段上的分量(即分信号)。根据微分原理,若每个时段和频段都很小,对具体某个时段和频段上的分信号进行抽样,无论具体的抽样时点和频点如何选取,抽样值都不会有大的差异,因而一个分信号可以仅用一个该分信号的抽样值来表示。短时傅立叶变换的值X(n, k)实际上就是n时段和k频段上信号分量的幅度和相位抽样,这个抽样值大体代表了n时段和k频段上信号分量的幅度范围和相位范围。n和k的含义见下表。表1数字参数与模拟参数的对应关系数字时间模拟时间(s)数字频率模拟频率(HZ)nt = n/fsKf=kfs/L注:L窗序列长度 fs信号采样频率 应用在语音处理方面,声谱图就是语音信号的短时傅立叶变换,其图形
4、化显示往往只表示各个时段和频段上的分信号幅度抽样值。3、WAVE文件的基本操作WAVE是Windows操作系统支持的一种标准的数字波形音频文件格式。通常我们用麦克风和Windows 录音机采集到计算中的声音就是WAVE格式的,WAVE文件后缀为.wav,多采用PCM格式或ADPCM格式,支持单声道或多声道数字音频数据采集和回放。与MP3等其它格式相比,WAVE格式尽管压缩比不好,却非常直观(除文件头外,实际上就是所有通道的采样数据按时间顺序交错排列),适合于数据量不大的音频录放(例如Windows提示音)。因此,对WAVE文件进行读取、保存、剪辑、播放等基本操作相对容易些。软件基础较好,有志于
5、开发自己的音频应用的读者可到网上下载WAVE等文件的存储格式。实验器材l 多媒体计算机l 预装Windows 98/2000/XP操作系统l 预装MATLAB6.5软件l 预装“数字语言处理实验”软件包l 自带移动存储实验内容1、输入并运行以下MATLAB代码:%(1)信号波形和对数功率谱示例% 波形:100样点,抽样频率Fs=8kHz,信号频率f=2kHzx=sin(2*pi*(0:99)*2000/8000);% 频谱:是波形的快速傅立叶变换X=fft(x);% 对数功率谱:功率谱取10lg或幅度谱取20lgP=20*log10(abs(X);% 绘制波形和对数功率谱(注意观察25和75处
6、的尖峰)figure(1);plot(x);title(信号的波形);figure(2);plot(P);title(信号的对数功率谱);%(2)窗函数的对数幅度谱示例% 避免对0取对数floor=0.1;% 图1:矩形窗W_rec=10*log10(abs(fft(boxcar(512),1024)+floor); figure(1); plot(W_rec(1:end/2);title(矩形窗的对数幅度谱);% 图2:海明窗W_hamming=10*log10(abs(fft(hamming(512),1024)+floor);figure(2);plot(W_hamming(1:end/
7、2); title(海明窗的对数幅度谱);% 图3:汉宁窗 W_hanning=10*log10(abs(fft(hanning(512),1024)+floor); figure(3); plot(W_hanning(1:end/2);title(汉宁窗的对数幅度谱);2、编程绘制以下窗序列的对数幅度谱:(1)指数窗(2)矩形窗(3)海明窗(4)汉宁窗选N=512,用MATLAB编程绘制以上窗序列的幅度谱。3、编程读取WAVE文件并显示声谱图(取1024点汉宁窗)提示:主要涉及的M函数有figure、plot、wavread、specgram等,理解如何使用它们。 4、 编程实现对WAVE文
8、件的剪辑、保存和播放提示:主要涉及的M函数wavread、wavwrite、wavplay等,使用MATLAB帮助系统了解其用法。报告要求1、包括实验名称、实验目的、实验内容标题。2、在相应内容标题下:(1) 拷贝内容1的各个图形,标出谱零点。(2) 写出内容2的程序清单,说明几种窗函数谱的不同特点和对短时谱分析性能的影响。(3) 写出内容3的程序清单,拷贝声谱图图形,说明此声谱图形的物理意义。(4) 写出内容4的程序清单,说明你的程序是如何使用M函数实现WAVE文件的剪辑、保存和播放的。单元2 综合分析实验实验目的1、 掌握利用短时自相关检测基音周期的原理,了解基音检测在清音段、谐音段、纯音
9、段及其混杂信号段的适用情况。2、 掌握短时傅立叶变换的实现原理,理解并掌握数字频率与模拟频率间的对应关系,理解SFT对语音信号的时频分析作用。3、 初步了解线性预测的特点。实验原理1、 短时自相关基音检测设信号采样序列长度为M:x(m)|0mM,采样周期为fs矩形窗序列长度为N:w(m)|0mn,NM则短时自相关为:其有效计算区间为:l 因此,对于矩形窗而言,短时自相关Rn(k)相当于取序列段x(m)|n-Nmn作自相关计算,最大值为Rn(0)。l 若所取序列段具有周期性,则Rn(k)将在k 为序列段周期Tn 时取得次大值Rnmax,因而取得Rnmax时的k值即为所取序列段周期:当Rn(k)=
10、 Rnmax时, Tn=kTs=k/fs。l 若Rnmax与Rn(0)相比相差太大,则表明所取序列段没有相关性,为清音帧。2、 短时傅立叶变换(1) SFT的傅立叶解释 X(m)w(n-m) w(m) x(m) 0 n-N 窗选时间段 n m 注:SFT是窗选信号段的离散傅立叶变换,它反映窗选信号段的离散频谱; SFT系数Xn(ejk)是n-N n时段信号在数字角频率k处的频谱抽样,含有该单频分量的幅度 和相位信息,该单频分量用以反映所在频段的频谱特征。图1SFT的傅立叶解释(2) SFT的滤波器解释W(n) X(n) Xn(ejk) e-jkn 窗选信号频谱 频率窗 移频- f 0 B f
11、f+B注:Xn(ejk)是数字信号X(n)被载波e-jkn调制移频后经过数字低通滤波器W(n)的输出。 设k对应的模拟频率为f(HZ),低通滤波器通频带为0B(HZ) 则只有频率范围在ff+B(HZ)的信号分量能通过低通滤波器。 因此Xn(ejk)是频率范围在ff+B(HZ)內的信号频谱抽样。图2SFT的傅立叶解释(3)数字信号与模拟信号的参数对应关系对于矩形窗而言,数字参数与模拟参数存在以下对应关系:表1数字参数与模拟参数的对应关系数字时间模拟时间(s)数字频率模拟频率(HZ)数字角频率模拟角频率(rad/s)nt=n/fskf=kfs/Lk=2k/L=2kfs/L注:L窗序列长度 fs信号
12、采样频率 (4)时频分辨率关系l 对于矩形窗,时间窗宽度=L/fs;频率窗宽度B=fs/L;时频窗面积常数K=B=1。l Xn(ejk)是(n-L)/fsn/fs时段的信号在kB(k+1)B频段的频谱抽样,抽样频率为kB。l Xn(ejk)反映了在上述模拟时段和频段內的信号分量特征,若时间窗宽度越小,则时间分辨率越高,频率分辨率越低;反之,若时间窗宽度越大,则时间分辨率越低,频率分辨率越高。l SFT系数的集合Xn(ejk)是关于数字时间n和数字频率k的二维阵列,n、k的取值为: Xn(ejk) | n = N,3N/2,2N.M-1;k=0,1,2,N-1 。其中M是语音信号的序列长度。3、
13、线性预测(1)线性预测定义用短时窗选取一段信号序列 x ( m ) | 0mN ,利用如下线性预测方程进行预测:其中N是窗序列长度,权系数 ak | 1 k p 是预测器参数(2)预测系数选取原则满足信号序列与其预测值序列间的均方预测误差最小准则。(3)窗长和预测阶数N过大,预测时段超出了语音信号的短时平稳区间,将使预测精度降低;而N过小, 则不能由过少的信号样点得到其变化规律,同样将使预测精度降低。类似地预测阶数 P的选取也应恰当。实验器材l 多媒体计算机l 预装Windows 98/2000/XP操作系统l 预装Visual Basic 6.0软件l 预装Visual C+ 6.0 软件l
14、 预装“2005数字语言处理实验”软件包l 自带移动存储实验内容1、 短时自相关基音检测(1) 打开“2005数字语音处理实验单元2:综合分析实验”文件夹,运行其中的VoiceProcess.exe实验程序,打开Sample.raw采样序列数据文件。(2) 点击“基音检测”菜单项,拷贝基音检测结果;根据基音检测结果并对比波形,指出哪些语段是浊音,哪些语段是清音,哪些语段两者都有,说明理由。2、 短时傅立叶变换(1) 点击“短时傅立叶变换”菜单项,观察SFT系数Xn(ejk)和各时段|Xn(ejk)|短时幅度谱。(2) 选取较短的窗长,在SFT谱值表中记录完整的一帧数据,同时拷贝下相对应的短时幅
15、度谱图形。分析说明:l 短时谱的横、纵坐标分别代表什么。l 短时频谱与短时幅度谱的异同。l 根据所选时段、窗型和窗长,在SFT谱值表中任取一个短时谱谱值,确定其所分析的信号时段(秒)和频段(赫兹)。(3) 选取信号的单频正弦区间,改变窗长,观察并拷贝所显示的2-3个不同短时幅度谱图;注意窗长改变时,短时幅度谱对该单频波的频率分析区间宽度和幅度谱分布规律有何变化,从而理解频率分辨率概念,就此说明窗长改变对频率分辨率的影响。3、 线性预测(1) 点击“线性预测”菜单项,改变各观察时段,根据信号波形和预测波形的对比、以及预测信噪比统计数据,举例说明在信号段具有什么特征时预测准确性较高,何时较低。(2
16、) 选取预测性能较好的一个时间段,改变窗长,观察并记录预测图形和预测信噪比数据,说明窗长的改变对预测准确性有什么影响,想想为什么?报告要求1、包括实验名称、实验目的、实验内容标题。2、在相应内容标题下,写出或拷贝实验内容所要求记录的数据和图形,完成实验内容所要求的分析说明。附录 MATLAB软件简介MATLAB是什么?MATLAB是一套高性能的科学计算可视化软件,它是由操作界面、MATLAB语言、通用函数库、工具箱和帮助系统组成的一个科学计算集成实验环境。在这个环境下,对所要求解的问题,用户只需简单地列出数学表达式,其结果便以数值或图形方式显示出来。 MATLAB有哪些主要特点?l 基于矩阵的
17、运算单元。MATLAB的含义是矩阵实验室,现已发展成线性代数课程的标准工具,其基本计算单元是矩阵,即使是标量运算,也是作为1行1列的矩阵进行的。MATLAB针对矩阵运算做了很多优化,若使用循环语句将矩阵分解成标量进行运算,将在运算效率上比直接进行矩阵运算有显著降低。l 易扩展性。MATLAB函数库是由一系列函数(称为M文件)组成。除通用函数库外,MATLAB还包括了被称为ToolBox(工具箱)的特定学科问题求解工具,工具箱实际上是对MATLAB进行扩展应用的专用函数库。由于用户可自行建立M文件进而构成特定领域的工具箱,工具箱种类和内容都在不断扩充中,现已发展了信号处理、图象处理、控制系统、神
18、经网络、财经等几十种工具箱,使得MATLAB具有广泛的应用领域。l 易学易用。与其它高级语言一样,MATLAB语言有其内定的规则,但其更接近于数学表示,因此其使用更为简便,避免了其它语言如C、FORTRAN中的许多限制,如变量、矩阵无须定义。基于功能齐全的多维向量运算功能、丰富实用的通用和专用函数库,一条MATLAB语句往往可实现相当于几十条甚至几百条C语句才能实现的复杂功能,使得用户无须深入了解算法的具体执行过程和编程技巧,通过简单的编程就可得到结果。演算纸和程序调试相结合,使得验证语句用法和定位错误变得简单。其可视化操作环境、丰富的图形函数和图形用户界面(GUI),便于实现科学计算过程的交
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 数字语音处理 数字 语音 处理 实验 指导书

限制150内