【精编】基于matlab的语音信号分析与处理.pdf
《【精编】基于matlab的语音信号分析与处理.pdf》由会员分享,可在线阅读,更多相关《【精编】基于matlab的语音信号分析与处理.pdf(42页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、基于 matlab 的语音信号分析与处理作者:日期:?基于 mat b 的语音信号分析与处理摘要:滤波器设计在数字信号处理中占有极其重要的地位,FI 数字滤波器和 II滤波器是滤波器设计的重要组成部分。Matlab 功能强大、编程效率高,特别是 Ma lab具有信号分析工具箱,不需具备很强的编程能力,就可以很方便地进行信号分析、处理和设计。基于M TLAB有噪音语音信号处理的设计与实现,综合运用数字信号处理的理论知识对加噪声语音信号进行时域、频域分析和滤波。使用窗函数法来设计F数字滤波器,用巴特沃斯、切比雪夫和双线性变法设计 IIR 数字滤波器,并利用 ATLAB作为辅助工具完成设计中的计算与
2、图形的绘制。关键词:数字滤波器;MAAB;切比雪夫bsrc:Filter designi digtal signal pocessin playsan extemely iportat rol,FIR dgitl itrs a IIR filter isan iprtnt par of fi r desig alb s powerf,programig efcny,Mtlab alo has a pticua igal na istoolx,i net ave strng pgrmg skils cn e sily ga analysis,proessi desin.TLA se n he n
3、ise isue speech si nalproessing esign aimplementtionf dgital sinal pr sin tegtduse ththeoretica know ge of te seec sgnal pusoise,domain,requencydomn analyi a flterg.The coreponding rsus obtained rouh thretialerivaton,and theuse M TLABasa programmingto for c mputeimplemention.Impemente ihe des gnproc
4、ess,usingth widow fuction meho to de gn R digit l fi terswith Buterworth,Cebyhv and lin Refor IR gitlfter dsign ad se of ATLAB as a uppleenary olto cmltthcaculaton and raphic design Drawing.Keyords:diitl fil r;MTAB;Cheysev 语音信号处理是研究用数字信号处理技术和语音学知识对语音信号进行处理的新兴的学科,是目前发展最为迅速的信息科学研究领域的核心技术之一。通过语音传递信息是人类
5、最重要、最有效、最常用和最方便的交换信息形式。Matl b 语言是一种数据分析和处理功能十分强大的计算机应用软件,它可以将声音文件变换为离散的数据文件,然后利用其强大的矩阵运算能力处理数据,如数字滤波、傅里叶变换、时域和频域分析、声音回放以及各种图的呈现等,它的信号处理与分析工具箱为语音信号分析提供了十分丰富的功能函数,利用这些功能函数可以快捷而又方便地完成语音信号的处理和分析以及信号的可视化,使人机交互更加便捷。语音信号处理的概念及现状语音是语言的声学表现,是人类交流信息最自然、最有效、最方便的手段。随着社会文化的进步和科学技术的发展,人类开始进入了信息化时代,用现代手段研究语音处理技术,使
6、人们能更加有效地产生、传输、存储、和获取语音信息,这对于促进社会的发展具有十分重要的意义,因此,语音信号处理正越来越受到人们的关注和广泛的研究。1.语音信号处理的概念语音是人类获取信息的重要来源和利用信息的重要手段。通过语言相互传递信息是人类最重要的基本功能之一。语音是语言的声学表现,是相互传递信息的最重要的手段,是人类最重要、最有效、最常用和最方便的交换信息的形式。1.语音信号处理的现状20 世纪 60 年代中期形成的一系列数字信号处理的理论和算法,如数字滤波器、快速傅立叶变换(T)等是语音信号数字处理的理论和技术基础。随着信息科学技术的飞速发展,语音信号处理取得了重大的进展:进入 70 年
7、代之后,提出了用于语音信号的信息压缩和特征提取的线性预测技术(LP),并已成为语音信号处理最强有力的工具,广泛应用于语音信号的分析、合成及各个应用领域,以及用于输入语音与参考样本之间时间匹配的动态规划方法;8年代初一种新的基于聚类分析的高效数据压缩技术矢量量化(VQ)应用于语音信号处理中;而用隐马尔可夫模型(HM)描述语音信号过程的产生是80 年代语音信号处理技术的重大发展,目前HM已构成了现代语音识别研究的重要基石。近年来人工神经网络(ANN)的研究取得了迅速发展,语音信号处理的各项课题是促进其发展的重要动力之一,同时,它的许多成果也体现在有关语音信号处理的各项技术之中。2语音信号处理的内容
8、和方法.1 语音信号处理的内容用Ma ab对含噪的语音信号同时在时域和频域进行滤波处理和分析,在Mt b应用软件下设计一个简单易用的图形用户界面(UI),来解决一般应用条件下的各种语音信号的处理。主要是通过用带有录音功能的手机或计算机录取一段语音信息,把已录取的语音信息存储为 wav格式文件,用 at ab 读取语音文件,运用数字信号学基本原理实现语音信号的处理,在 t a环境下综合运用信号提取,幅频变换以及傅里叶变换、滤波等技术来进行语音信号处理,能对语音信号进行采集,并对其进行各种处理,达到简单的语音信号处理的目的。2.语音信号处理的方法在图形用户界面(Grapha User nterfa
9、ce,简称,又称图形用户接口)是指采用图形方式显示的计算机操作用户界面。与早期计算机使用的命令行界面相比,图形界面对于用户来说在视觉上更易于接受。的广泛应用是当今计算机发展的重大成就之一,他极大地方便了非专业用户的使用人们从此不再需要死记硬背大量的命令,取而代之的是可以通过窗口、菜单、按键等方式来方便地进行操作。基于 MA LB有噪音语音信号处理的设计与实现,综合运用数字信号处理的理论知识对加噪声语音信号进行时域、频域分析和滤波。通过理论推导得出相应结论,再利用 ATLA 作为编程工具进行计算机实现。在设计实现的过程中,使用窗函数法来设计 I 数字滤波器,用巴特沃斯、切比雪夫和双线性变法设计I
10、 R数字滤波器,并利用 ATAB 作为辅助工具完成设计中的计算与图形的绘制。通过对对所设计滤波器的仿真和频率特性分析,可知利用ALAB 信号处理工具箱可以有效快捷地设计IR 和 IIR 数字滤波器。3.语音信号处理31 原始语音信号采集与处理使用带有录音功能的手机或电脑的声卡设备采集一段语音信号,并将其保存在电脑中,语音信息文件为 *.wav 格式。语音信号的处理主要包括信号的提取、信号的调整、信号的变换和滤波等。通过用户图形界面的输出功能,将处理后的信号的语音进行播放,试听处理后的效果。语音信号采集过程如图3-1 所示。麦克风声卡滤波采样A/D转换Wav声音自带录音机indowsW图 3-1
11、 语音信号采集过程(1)语音信号的时域分析语音信号是一种非平稳的时变信号,它携带着各种信息。在语音编码、语音合成、语音识别和语音增强等语音处理中无一例外需要提取语音中包含的各种信息。语音信号分析的目的就在与方便有效的提取并表示语音信号所携带的信息。语音信号分析可以分为时域和变换域等处理方法,其中时域分析是最简单的方法,直接对语音信号的时域波形进行分析,提取的特征参数主要有语音的短时能量,短时平均过零率,短时自相关函数等。提取:通过图形用户界面上的菜单功能按键采集电脑设备上的一段音频信号,完成音频信号的频率,幅度等信息的提取,并得到该语音信号的波形图。调整:在设计的用户图形界面下对输入的音频信号
12、进行各种变化,如变化幅度、改变频率等操作,以实现对语音信号的调整。()语音信号的频域分析信号的傅立叶表示在信号的分析与处理中起着重要的作用。因为对于线性系统来说,可以很方便地确定其对正弦或复指数和的响应,所以傅立叶分析方法能完善地解决许多信号分析和处理问题。另外,傅立叶表示使信号的某些特性变得更明显,因此,它能更深入地说明信号的各项红物理现象。由于语音信号是随着时间变化的,通常认为,语音是一个受准周期脉冲或随机噪声源激励的线性系统的输出。输出频谱是声道系统频率响应与激励源频谱的乘积。声道系统的频率响应及激励源都是随时间变化的,因此一般标准的傅立叶表示虽然适用于周期及平稳随机信号的表示,但不能直
13、接用于语音信号。由于语音信号可以认为在短时间内,近似不变,因而可以采用短时分析法。变换:在用户图形界面下对采集的语音信号进行For er 等变换,并画出变换前后的频谱图和变换后的倒谱图。滤波:滤除语音信号中的噪音部分,可采用低通滤波、高通滤波、带通滤波和帯阻滤波,并比较各种滤波后的效果。(3)语音信号处理流程图语音信号处理的过程包括语音信号的采集、信息提取、信号调整、信号变换、信号滤波。其中信号调整又包括幅度和频率的任意倍数变化,语音信号处理流程图如图 3-所示。语音信号采集信息提取信号调整信号变换信号滤波效果显示图-2 语音信号处理流程图信号的滤波采用了四种滤波方式,来观察各种滤波性能的优缺
14、点:如图 3-3所示:信号滤波切比雪夫I型低通滤波切比雪夫型高通滤波切比雪夫型带阻滤波椭圆数字带通滤波图 3 语音信号滤波的方式在以上两图中,可以看到整个语音信号处理系统的流程大概分为三步,首先要读入待处理的语音信号,然后进行语音信号的处理,包括信息的提取、幅度和频率的变换以及语音信号的傅里叶变换、滤波等;滤波又包括低通滤波、高通滤波、带通滤波和带阻滤波等方式。最后对处理过的语音信号进行处理后的效果显示。3.语音的录入与打开在 MAT B中,y,fs,bit=wavread(Bip,1 2);用于读取语音,采样值放在向量y 中,fs 表示采样频率(Hz),ts 表示采样位数。N 2表示读取从
15、N1点到点的值(若只有一个的点则表示读取前N点的采样值)。sond(,s,b ts);用于对声音的回放。向量 y 则就代表了一个信号(也即一个复杂的“函数表达式”)也就是说可以像处理一个信号表达式一样处理这个声音信号。3.3 时域信号的 FFT分析FF即为快速傅氏变换,是离散傅氏变换的快速算法,它是根据离散傅氏变换的奇、偶、虚、实等特性,对离散傅立叶变换的算法进行改进获得的。在ATL B的信号处理工具箱中函数T 和 IFFT 用于快速傅立叶变换和逆变换。函数FT 用于序列快速傅立叶变换,其调用格式为 f t(x),其中,x是序列,y 是序列的 FFT,可以为一向量或矩阵,若 x 为一向量,y
16、是 x 的 T且和相同长度;若x 为一矩阵,则 y 是对矩阵的每一列向量进行F。如果长度是 2 的幂次方,函数 fft执行高速基-2FFT 算法,否则 f t 执行一种混合基的离散傅立叶变换算法,计算速度较慢。函数FT 的另一种调用格式为yft(,N),式中,x,y 意义同前,N为正整数。函数执行N点的 FFT,若 x 为向量且长度小于 N,则函数将补零至长度;若向量x 的长度大于 N,则函数截短 x 使之长度为 N;若 x 为矩阵,按相同方法对 x 进行处理。34 数字滤波器设计原理数字滤波器的作用是利用离散时间系统的特性对输入信号波形(或频谱)进行加工处理,或者说利用数字方法按预定的要求对
17、信号进行变换。数字滤波器可以理解为是一个计算程序或算法,将代表输入信号的数字时间序列转化为代表输出信号的数字时间序列,并在转化过程中,使信号按预定的形式变化。数字滤波器有多种分类,根据数字滤波器冲激响应的时域特征,可将数字滤波器分为两种,即无限长冲激响应(IIR)滤波器和有限长冲激响应(FIR)滤波器。从性能上来说,I R 滤波器传输函数的极点可位于单位圆内的任何地方,因此可用较低的阶数获得高的选择性,所用的存贮单元少,所以经济而效率高。但是这个高效率是以相位的非线性为代价的。选择性越好,则相位非线性越严重。相反,IR 滤波器却可以得到严格的线性相位,然而由于 FI滤波器传输函数的极点固定在原
18、点,所以只能用较高的阶数达到高的选择性;对于同样的滤波器设计指标,I 滤波器所要求的阶数可以比I R滤波器高 10倍,结果,成本较高,信号延时也较大;如果按相同的选择性和相同的线性要求来说,则I 滤波器就必须加全通网络进行相位较正,同样要大增加滤波器的节数和复杂性。整体来看,IIR滤波器达到同样效果阶数少,延迟小,但是有稳定性问题,非线性相位;I 滤波器没有稳定性问题,线性相位,但阶数多,延迟大。35 倒谱的概念定义:倒谱定义为信号短时振幅谱的对数傅里叶反变换。特点:具有可近似地分离并能提取出频谱包络信息和细微结构信息的特点用途:提取声道特征信息:提取频谱包络特征,以此作为描述音韵的特征参数而
19、应用于语音识别。提取音源信息:提取基音特征,以此作为描述音韵特征的辅助参数而应用于语音识别。求法:DPTLog I IxDPTDPT峰值检测nx时间窗ABCDlifter倒谱窗EFA:短时信号;B:短时频谱;C:对数频谱;D:倒谱系数;E:对数频谱包络;:基本周期4.语音信号处理实例分析4.1 图形用户界面设计在 MATLAB 主窗口中,选择 File 菜单中的 w菜单项,再选择其中的 GUI命令,就会显示图形用户界面的设计模板。MATL B为UI 设计一共准备了 4 种模板,分别是 ank GU(默认)、UI wth icontro s(带控件对象的 GU模板)、GU wt Axs n en
20、u(带坐标轴与菜单的 I 模板)与 Modal Question Dialog(带模式问话对话框的模板)。设计语音信号处理系统的用户图形操作界面(G)oundProcess,其中菜单主要包括和 Output 三大主要部分,其中 Fle 菜单包括输入(In ut)、保存(ave)和退出(Quit)等功能;rcess 菜单主要包括提取(xtrac)、调整(Extract)、变换(Trnsorm)和滤波(er)菜单,其中调整(Exract)包括幅度调整(Rae)和频率调整(Freque cy),滤波(il er)菜单包含低通滤波(LowpssFlter)、高通滤波(ghpassilter)、带通滤波
21、(BadpassFlter)和帯阻滤波(B stopFil r)等功能菜单。4.2 信号的采集该系统是以一段简短的的语音信号做为分析样本,通过计算机系统将一段“主人,信息收到了”的语音信号保存到到计算机中,并且保存格式为“*.wa”。4.语音信号的处理设计()语音信号的提取在atlab 中使用 Wav ead函数,可得出信号的采样频率为250,并且声音是单声道的。利用 Sound函数可以清晰的听到“主人,信息收到了”的语音。采集数据并画出波形图。其中声音的采样频率Fs=2050H,y 为采样数据,NBITS表示量化阶数。部分程序如下:fn=inp t(Enter W V:,);%获取一个.wa
22、的文件x,s,nb=w vread(n);ms2=foo(*0.00);10=floor(f*.1);ms20=foor(fs*0 02);ms 0f or(*0.03);?t=(0:lengt(x)-1)/fs;%计算样本时刻subl t(,1,1);%确定显示位置pl t(t,x);画波形图leg n(avefor);abel(Time(s);lab l(pitud);运行后弹出语音信号处理系统的操作界面如图4-1:图 4-1 语音信号处理系统的操作界面然后点击 File菜单中的子菜单 nput,回到 Matab 软件的输入界面如图4-2:图-2 输入界面输入要处理的语音信号的名称,便可得
23、到语音语音的波形图如图4-:图 4-3 语音语音的波形图如图中提取的语音的波形图所示,整段音频数据中得声音高低起伏与录入的声音信号基本一致,并且可以观察到其中包含部分高频噪声。()语音信号的调整在语音信号的研究中,经常会对语音信号进行进行多倍频率以及多倍幅度变换调整,日常应用中,这种变换调整也经常要用到。所以在设计中也添加了这种功能,并能够观察调整后的信号的波形图得变化,而且能通过语音处理界面的输出功能试听处理后的语音信号。语音信号的频率调整在设计中,可以将语音信号的采样频率提高或降低,来实现语音信号的调整,得到理想的语音信号。例如将采样频率提高一倍,即可得到语音信号频率为原频率倍新的语音信号
24、。运行Proessdju trequency,得到如图 4-的信号波形图,并试听调整后的效果。图 4-4 频率调整后波形图与原语音信号相比,经过调整后的信号周期变为原来的1,此时的语速明显变快,即实现了信号的 2 倍频功能。语音信号的振幅调整在设计中,可以将语音信号的幅度进行提高或降低操作,来实现语音信号的调整,得到声音音量大小不同的语音信号,例如将原语音信号的幅度提高一倍,得到如下图 4-5 的信号波形图,可以通过UI 操作界面的输出功能试听调整后的效果。图 45 幅度调整后波形图此时听到的调整后声音声调变高,但不是很明显,可以将幅度的变化值设置的比较大,那样的话就可以得到效果相当明显的语音
25、信号了。()语音信号的傅里叶变换倒谱分析是指信号短时振幅谱的对数进行傅里叶反变换。它具有可近似地分离并提取出频谱包络信息和细微结构信息的特点。对语音信号进行频谱分析,在Ma lab 中可以利用函数 fft 对信号行快速傅里叶变换,得到信号的频谱图,并进行倒谱分析,得到倒谱图。傅里叶变换的部分程序如下:xy(401:55050,1);提取原语音信号的一部分=(0:ength()1)/s;%计算样本时刻sup(3,);%确定显示位置pl(t,);%画波形图egd(波形图);xl bel(Tie(s);yla e(Ampitude);Yfft(x,hammig(le th(x);做加窗傅里叶变换fm
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 精编 基于 matlab 语音 信号 分析 处理
限制150内