2022年《数字语音处理》实验指导书 .pdf
《2022年《数字语音处理》实验指导书 .pdf》由会员分享,可在线阅读,更多相关《2022年《数字语音处理》实验指导书 .pdf(18页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、数字语音处理实验指导书中国地质大学机械与电子工程学院电信教研室编制 2005 年1 数字语音处理实验指导书学校:中国地质大学院系:机械与电子工程学院专业:电子信息工程编制:电信教研室版本: 2005 名师资料总结 - - -精品资料欢迎下载 - - - - - - - - - - - - - - - - - - 名师精心整理 - - - - - - - 第 1 页,共 18 页 - - - - - - - - - 数字语音处理实验指导书中国地质大学机械与电子工程学院电信教研室编制 2005 年2 目录前言单元 1 MATLAB 练习单元 2 综合分析实验附录 1 MATLAB软件简介附录 2
2、MATLAB基本使用方法附录 3 wavread 函数附录 4 specgram函数参考文献名师资料总结 - - -精品资料欢迎下载 - - - - - - - - - - - - - - - - - - 名师精心整理 - - - - - - - 第 2 页,共 18 页 - - - - - - - - - 数字语音处理实验指导书中国地质大学机械与电子工程学院电信教研室编制 2005 年3 单元 1 MATLAB练习实验目的了解信号谱分析特点,掌握各种窗函数功率谱的异同及其对短时信号谱分析的作用。明确短时傅立叶变换与声谱图的关系,理解其对语音信号的时频分析作用。学习音频文件的基本操作方法。学习
3、用 MA TLAB 实现基本的语音信号处理,提高自学和动手能力,培养学习兴趣。实验原理1、离散频谱、幅度谱和功率谱离散频谱是信号序列的离散傅立叶变换,常用快速傅立叶变换(FFT)计算。离散频谱描述的是信号在频率采样点 上的幅度和相位值,包括幅度 -频率关系和相位频率关系,幅度谱就是前者。功率谱是幅度平方频率关系。由于语音的对数听觉效应,幅度谱和功率谱常用对数形式表达,单位为分贝。对数幅度谱 =10lg 幅度谱,对数功率谱=10lg 幅度谱2=20 lg 幅度谱。由此可见,对数幅度谱与对数功率谱在谱形上是相似的,只不过谱的幅度方向相差一倍。对于窗序列的离散频谱、幅度谱和功率谱,结论也是类似的。2
4、、短时傅立叶变换和声谱图短时傅立叶变换的实质,是在时间和频率上同时对信号序列进行分解,使得信号被分解成若干个时段和频段上的分量(即分信号)。根据微分原理,若每个时段和频段都很小,对具体某个时段和频段上的分信号进行抽样,无论具体的抽样时点和频点如何选取,抽样值都不会有大的差异,因而一个分信号可以仅用一个该分信号的抽样值来表示。短时傅立叶变换的值X(n, k) 实际上就是n时段和 k 频段上信号分量的幅度和相位抽样,这个抽样值大体代表了n 时段和 k 频段上信号分量的幅度范围和相位范围。n 和 k 的含义见下表。表 1 数字参数与模拟参数的对应关系数字时间模拟时间( s)数字频率模拟频率( HZ)
5、n t = n/fs K f=k fs/L 注: L窗序列长度fs信号采样频率应用在语音处理方面,声谱图就是语音信号的短时傅立叶变换,其图形化显示往往只表示各个时段和频段上的分信号幅度抽样值。3、WAVE 文件的基本操作WAVE 是 Windows 操作系统支持的一种标准的数字波形音频文件格式。通常我们用麦克风和 Windows 录音机采集到计算中的声音就是WAVE 格式的, WAVE 文件后缀为 .wav,多采用 PCM 格式或 ADPCM 格式,支持单声道或多声道数字音频数据采集和回放。与 MP3 等其它格式相比,WAVE 格式尽管压缩比不好,却非常直观(除文件头外,实际上就是 所有通道的
6、采样数据按时间顺序 交错排列 ) ,适合于数据量不大的音频录放(例如Windows 提示音)。因此,对WAVE 文件进行读取、保存、剪辑、播放等基本操作相对容易些。软件基础较好,有志于开发自己的音频应用的读者可到网上下载WAVE 等文件的存储格式。名师资料总结 - - -精品资料欢迎下载 - - - - - - - - - - - - - - - - - - 名师精心整理 - - - - - - - 第 3 页,共 18 页 - - - - - - - - - 数字语音处理实验指导书中国地质大学机械与电子工程学院电信教研室编制 2005 年4 实验器材多媒体计算机预装 Windows 98/2
7、000/XP 操作系统预装 MATLAB6.5软件预装“数字语言处理实验”软件包自带移动存储实验内容1、输入并运行以下MATLAB 代码:%(1)信号波形和对数功率谱示例% 波形: 100样点,抽样频率Fs=8kHz,信号频率 f=2kHz x=sin(2*pi*(0:99)*2000/8000); % 频谱 :是波形的快速傅立叶变换X=fft(x); % 对数功率谱 :功率谱取 10lg或幅度谱取 20lg P=20*log10(abs(X); % 绘制波形和对数功率谱(注意观察25和75处的尖峰)figure(1); plot(x); title( 信号的波形 ); figure(2);
8、plot(P); title( 信号的对数功率谱); %(2)窗函数的对数幅度谱示例% 避免对 0取对数floor=0.1; % 图1:矩形窗W_rec=10*log10(abs(fft( boxcar(512),1024)+floor); figure(1); plot(W_rec(1:end/2); title( 矩形窗的对数幅度谱); % 图2:海明窗W_hamming=10*log10(abs(fft(hamming(512),1024)+floor); figure(2); plot(W_hamming(1:end/2); title( 海明窗的对数幅度谱); % 图3:汉宁窗W_h
9、anning=10*log10(abs(fft(hanning(512),1024)+floor); figure(3); plot(W_hanning(1:end/2); title( 汉宁窗的对数幅度谱); 2、编程绘制以下窗序列的对数幅度谱:(1)指数窗(2)矩形窗名师资料总结 - - -精品资料欢迎下载 - - - - - - - - - - - - - - - - - - 名师精心整理 - - - - - - - 第 4 页,共 18 页 - - - - - - - - - 数字语音处理实验指导书中国地质大学机械与电子工程学院电信教研室编制 2005 年5 (3)海明窗(4)汉宁窗选
10、 N=512,用 MATLAB编程绘制以上窗序列的幅度谱。3、编程读取 WAVE 文件并显示声谱图(取1024点汉宁窗)提示:主要涉及的 M函数有 figure、plot、wavread、specgram等,理解如何使用它们。4、 编程实现对 WAVE 文件的剪辑、保存和播放提示:主要涉及的 M函数 wavread、wavwrite 、wavplay 等,使用 MATLAB 帮助系统了解其用法。报告要求1、包括实验名称、实验目的、实验内容标题。2、在相应内容标题下:(1)拷贝内容1 的各个图形,标出谱零点。(2)写出内容2 的程序清单, 说明几种窗函数谱的不同特点和对短时谱分析性能的影响。(3
11、)写出内容3 的程序清单,拷贝声谱图图形,说明此声谱图形的物理意义。(4)写出内容4 的程序清单, 说明你的程序是如何使用M函数实现WAVE 文件的剪辑、 保存和播放的。名师资料总结 - - -精品资料欢迎下载 - - - - - - - - - - - - - - - - - - 名师精心整理 - - - - - - - 第 5 页,共 18 页 - - - - - - - - - 数字语音处理实验指导书中国地质大学机械与电子工程学院电信教研室编制 2005 年6 单元 2 综合分析实验实验目的1、掌握利用短时自相关检测基音周期的原理,了解基音检测在清音段、谐音段、纯音段及其混杂信号段的适用
12、情况。2、掌握短时傅立叶变换的实现原理,理解并掌握数字频率与模拟频率间的对应关系,理解SFT 对语音信号的时频分析作用。3、初步了解线性预测的特点。实验原理1、 短时自相关基音检测设信号采样序列长度为M: x(m)|0 mM ,采样周期为fs 矩形窗序列长度为N:w(m)|0 mn,NM 则短时自相关为:其有效计算区间为:因此,对于矩形窗而言,短时自相关Rn(k)相当于取序列段x(m)|n-N mn 作自相关计算,最大值为Rn(0)。若所取序列段具有周期性,则Rn(k)将在 k 为序列段周期Tn时取得次大值Rnmax,因而取得 Rnmax时的 k 值即为所取序列段周期:当Rn(k)= Rnma
13、x时,Tn=kTs=k/fs 。若 Rnmax与 Rn(0)相比相差太大,则表明所取序列段没有相关性,为清音帧。2、 短时傅立叶变换(1)SFT 的傅立叶解释X(m)w(n-m) w(m) x(m) 0 n-N 窗选时间段n m 注: SFT 是窗选信号段的离散傅立叶变换,它反映窗选信号段的离散频谱;SFT 系数 Xn(ejk)是 n-N n 时段信号在数字角频率k处的频谱抽样,含有该单频分量的幅度和相位信息,该单频分量用以反映所在频段的频谱特征。图 1 SFT 的傅立叶解释mmnkmxmxkmnwkmxmnwmxkR)()()()()()()(knNnmnMnNkmxmxkRNnknmNnN
14、kmnNmnMkmMm),()()(0000)()()()()()(mnwmxDFTemnwmxmxSFTeXmmjjnkk名师资料总结 - - -精品资料欢迎下载 - - - - - - - - - - - - - - - - - - 名师精心整理 - - - - - - - 第 6 页,共 18 页 - - - - - - - - - 数字语音处理实验指导书中国地质大学机械与电子工程学院电信教研室编制 2005 年7 (2)SFT 的滤波器解释(3)数字信号与模拟信号的参数对应关系对于矩形窗而言,数字参数与模拟参数存在以下对应关系:表 1 数字参数与模拟参数的对应关系数字时间模拟时间( s
15、)数字频率模拟频率( HZ)数字角频率模拟角频率( rad/s)n t=n/fs k f=kfs/L k=2 k/L =2kfs/L 注: L窗序列长度fs信号采样频率(4)时频分辨率关系对于 矩形窗 ,时间窗宽度 =L/fs ;频率窗宽度B=fs/L ;时频窗面积常数K= B=1。Xn(ejk)是(n-L)/fsn/fs 时段的信号在kB(k+1)B 频段的频谱抽样,抽样频率为kB。Xn(ejk)反映了在上述模拟时段和频段內的信号分量特征,若时间窗宽度越小 ,则时间分辨率 越高 ,频率分辨率 越低 ;反之,若时间窗宽度越大 ,则时间分辨率越低,频率分辨率越高 。SFT 系数的集合 Xn(ej
16、k)是关于数字时间n 和数字频率k 的二维阵列,n、k 的取值为: Xn(ejk) | n = N,3N/2,2N.M -1;k=0,1,2, N-1 。其中 M 是语音信号的序列长度。3、线性预测(1)线性预测定义用短时窗选取一段信号序列 x ( m ) | 0 mN ,利用如下线性预测方程进行预测:其中 N 是窗序列长度,权系数 ak | 1 k p 是预测器参数X(n) Xn(ejk) e-jkn 窗选信号频谱频率窗移频 - f 0 B f f+B 注: Xn(ejk)是数字信号X(n)被载波e-jkn调制移频后经过数字低通滤波器W(n) 的输出。设k对应的模拟频率为f(HZ) ,低通滤
17、波器通频带为0B(HZ)则只有频率范围在ff+B (HZ )的信号分量能通过低通滤波器。因此 Xn(ejk)是频率范围在ff+B (HZ)內的信号频谱抽样。图 2 SFT 的傅立叶解释)(*)()()()()(nwenxmnwemxmxSFTeXnjmmjjnkkkpkkkmxamx1)()( ?W(n) 名师资料总结 - - -精品资料欢迎下载 - - - - - - - - - - - - - - - - - - 名师精心整理 - - - - - - - 第 7 页,共 18 页 - - - - - - - - - 数字语音处理实验指导书中国地质大学机械与电子工程学院电信教研室编制 200
18、5 年8 (2)预测系数选取原则满足信号序列与其预测值序列间的均方预测误差最小准则。(3)窗长和预测阶数N 过大,预测时段超出了语音信号的短时平稳区间,将使预测精度降低;而N 过小,则不能由过少的信号样点得到其变化规律,同样将使预测精度降低。类似地预测阶数P 的选取也应恰当。实验器材多媒体计算机预装 Windows 98/2000/XP 操作系统预装 Visual Basic 6.0 软件预装 Visual C+ 6.0 软件预装“ 2005 数字语言处理实验”软件包自带移动存储实验内容1、 短时自相关基音检测(1)打开“2005 数字语音处理实验单元2:综合分析实验”文件夹,运行其中的Voi
19、ceProcess.exe实验程序,打开Sample.raw 采样序列数据文件。(2)点击“基音检测”菜单项,拷贝基音检测结果;根据基音检测结果并对比波形,指出哪些语段是浊音,哪些语段是清音,哪些语段两者都有,说明理由。2、 短时傅立叶变换(1)点击“短时傅立叶变换”菜单项,观察SFT 系数Xn(ejk)和各时段 |Xn(ejk)|短时幅度谱。(2)选取较短的窗长,在SFT 谱值表中记录完整的一帧数据,同时拷贝下相对应的短时幅度谱图形。分析说明:短时谱的横、纵坐标分别代表什么。短时频谱与短时幅度谱的异同。根据所选时段、窗型和窗长,在SFT 谱值表中任取一个短时谱谱值,确定其所分析的信号时段(秒
20、)和频段(赫兹)。(3)选取信号的单频正弦区间,改变窗长, 观察并拷贝所显示的2-3 个不同短时幅度谱图;注意窗长改变时,短时幅度谱对该单频波的频率分析区间宽度和幅度谱分布规律有何变化,从而理解频率分辨率概念,就此说明窗长改变对频率分辨率的影响。3、 线性预测(1)点击“线性预测”菜单项,改变各观察时段,根据信号波形和预测波形的对比、以及预测信噪比统计数据,举例说明在信号段具有什么特征时预测准确性较高,何时较低。(2)选取预测性能较好的一个时间段,改变窗长, 观察并记录预测图形和预测信噪比数据,说明窗长的改变对预测准确性有什么影响,想想为什么?报告要求1、包括实验名称、实验目的、实验内容标题。
21、2、在相应内容标题下,写出或拷贝实验内容所要求记录的数据和图形,完成实验内容所要求的分析说明。名师资料总结 - - -精品资料欢迎下载 - - - - - - - - - - - - - - - - - - 名师精心整理 - - - - - - - 第 8 页,共 18 页 - - - - - - - - - 数字语音处理实验指导书中国地质大学机械与电子工程学院电信教研室编制 2005 年9 附录 MATLAB软件简介MATLAB 是什么?MATLAB是一套高性能的科学计算可视化软件,它是由操作界面、MA TLAB 语言、通用函数库、工具箱和帮助系统组成的一个科学计算集成实验环境。在这个环境下
22、,对所要求解的问题,用户只需简单地列出数学表达式,其结果便以数值或图形方式显示出来。MATLAB 有哪些主要特点?基于矩阵的运算单元。MATLAB的含义是矩阵实验室,现已发展成线性代数课程的标准工具,其基本计算单元是矩阵,即使是标量运算,也是作为1 行 1 列的矩阵进行的。MATLAB针对矩阵运算做了很多优化,若使用循环语句将矩阵分解成标量进行运算,将在运算效率上比直接进行矩阵运算有显著降低。易扩展性。 MA TLAB 函数库是由一系列函数(称为M 文件)组成。除通用函数库外,MATLAB还包括了被称为ToolBox (工具箱)的特定学科问题求解工具,工具箱实际上是对 MA TLAB 进行扩展
23、应用的专用函数库。由于用户可自行建立M 文件进而构成特定领域的工具箱, 工具箱种类和内容都在不断扩充中,现已发展了信号处理、图象处理、控制系统、神经网络、财经等几十种工具箱,使得MATLAB具有广泛的应用领域。易学易用。与其它高级语言一样,MATLAB语言有其内定的规则,但其更接近于数学表示,因此其使用更为简便,避免了其它语言如C、FORTRAN 中的许多限制, 如变量、矩阵无须定义。 基于功能齐全的多维向量运算功能、丰富实用的通用和专用函数库,一条 MATLAB 语句往往可实现相当于几十条甚至几百条C 语句才能实现的复杂功能,使得用户无须深入了解算法的具体执行过程和编程技巧,通过简单的编程就
24、可得到结果。演算纸和程序调试相结合,使得验证语句用法和定位错误变得简单。其可视化操作环境、丰富的图形函数和图形用户界面(GUI ) ,便于实现科学计算过程的交互控制和结果的可视化。此外,MATLAB 还提供了内容翔实的帮助系统。MATLAB 能做什么?由于 MATLAB具有如此简单而强大的科学演算和可视化功能,非常适合于多学科领域的算法设计和工程实践的仿真实验。在学习和研究方法上:在当今知识爆炸的时代,任何人不可能穷尽所有的知识;在工程实践中, 人们往往是在确定问题定义和研究方案后,再对涉及的技术细节作深入细致的研究;因此,提出问题和尽可能了解各种可能解法的效果,可以避免研究工作的盲目性,是优
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 数字语音处理 2022年数字语音处理实验指导书 2022 数字 语音 处理 实验 指导书
限制150内