《毕业设计检测稿.doc》由会员分享,可在线阅读,更多相关《毕业设计检测稿.doc(13页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、【精品文档】如有侵权,请联系网站删除,仅供学习与交流毕业设计检测稿.精品文档.基于MATLAB的语音信号的采集与分析李艳(信息与电气工程学院,通信工程专业,2009级2班,20093615415) 摘 要:语音信号的采集与分析是数字信号处理技术和语音学知识的综合应用。在信息科学研究等领域占有自己的一席之地。本文主要内容是利用PC机录制一段人的语音,通过MATLAB先分析其时域参数和频谱图。再对该语音信号加入噪声。重点是根据加入噪声信号的频谱特性设计合理的数字滤波器,对加入噪声的语音信号进行滤波。并对比原始语音信号和滤波语音信号的时域波形和频谱。 关键词:语音信号;MATLAB;信号采集;信号分
2、析;数字滤波器Collection and Analysis of Speech Signal Based on MatlabLi Yan(Department of Communication Engineering, School of Information and Electrical Engineering)Abstract: The collection and analysis of speech signal is the combination of digital signal processing technology and phonetics. It wins a p
3、lace in the research field of information science. This passage is mainly about to record a speech signal through PC and analyse the time domain parameter identification and frequency spectrum graph of the speech signal with MATLAB. Then , noise is added into this speech signal. The focal point is t
4、o design reasonable digital filter which is based on the frequency spectrum of the speech signal which contains noise and to filter the speech signal which contains noise with the digital filter. Then,the figures of the speech signal which has been filtered are compared with the original speech sign
5、als.Key words: speech signal; MATLAB; signal collection; signal analysis; digital filter1 引言语言是人类特有的交流工具,人们通过语言相互传递信息,交流感情。随着社会的发展,对于进入信息化时代的人们,各种各样的机器参与到人类的生产活动和社会活动中。因此,人们迫切需要改善人和机器之间的关系。随着电子计算机和人工智能的广泛应用,人们发现语言通信是人和机器之间最直接,简洁,有效的通信方式。然而,对语言信号的分析和处理不是孤立的,它是数字信号处理技术和语音学相结合的交叉学科,同时和心理学、语言学、认知科学、计算机科
6、学、模式识别和人工智能等学科也紧密联系。人们对语音信号处理的研究工作,始于1876年贝尔发明了电话,首次用声电,电声转换技术实现了语音信号的远距离传输。此后,语音信号处理都围绕着硬件缓慢进行着。直到20世纪60年代中期,数字滤波器,快速傅里叶变换等数字信号处理技术成为语音信号数字处理技术的理论和技术基础。并且因为电子计算机的发展,由以硬件为中心的研究逐渐转换为以软件为主的处理研究。此后,语音信号的发展步伐不断加快。20世纪70年代出现了动态时间规整技术,并应用到语音识别研究的匹配算法中。20世纪70年代中期线性预测技术被用于语音信号处理,20世纪70年代末,将矢量量化技术应用与语音编码中。20
7、世纪80年代语音信号处理技术产品化出现,这是由于矢量量化、隐马尔科夫模型和人工神经网络被应用于语音信号处理。20世纪90年代,语音信号的采集与分析在实用化方面取得的成就突出,例如,声学语音学统计模型的研究引起人们关注,鲁棒的语音识别,基于语音段的建模方法及隐马尔科夫模型与人工神经网络相结合1。本课题通过PC机录制一段语音信号,运用MATLAB进行仿真分析。先是对语音信号进行时域分析,然后是语音信号的频域分析,利用快速傅里叶变换得到其频谱图,语谱图。最后,对语音信号加入高斯噪声,然后,再滤除噪声。2 MATLAB的介绍 MATLAB的全称是Matrix Laboratory,中文翻译名称是矩阵实
8、验室,MATLAB由美国Mathworks公司出品,用于算法计算、矩阵分析、数值计算、和将数据达到可视化界面的高级技术计算机语言和交互式环境。主要包括MATLAB和Simulink。MATLAB的功能有分析目的数值,计算各种矩阵,将科学数据以各种图形,图表形式展现出来,更在建立非线性动态系统模型和仿真方面拥有自己的优势。在工程设计,科学研究等多方面科学研究领域发挥了强大的作用。MATLAB可以实现函数和数据的图形绘制,算法实现,图形用户界面的创建,矩阵运算,连接其它编程语言的程序等。应用领域有信号处理与通信、图像处理、控制设计、工程设计等。 数字语音信号处理,顾名思义是将数字信号处理与语音学相
9、结合的科学。被应用于现代通信领域中,人与机器之间的信息交流。而MATLAB作为一种拥有强大功能,交互性好的计算数值和图形可视化计算高级语言,能够将信号处理以及数值分析综合在一起。伴随着MATLAB功能越来越强大,其广泛应用于仿真、数字语音信号处理、数字图像处理等领域。直接利用MATLAB信号处理工具箱中的库函数,可以很快捷的对数字化的语音信号进行分析。3语音信号概述3.1语音信号的产生及组成 起初,说话者会在自己的大脑中产生想表达的语言内容,然后将这些内容用其包含的响度,音速序列,基音周期的起伏顺序等表示出来,类似于对这些内容编码。完成信息编码后,说话者用一些专用的神经肌肉发出命令控制自己的声
10、带振动,控制声道的形状以达到发出编码中的声音序列。神经肌肉发出的命令同时还必须控制唇,腭,舌头和掌控气流进入位于鼻腔中的软腭。这些信息以声波的方式在空气中传播,传递到语音收听人的耳中,那么,语音感知的过程开始。听者内耳中的基底膜对听到的语音信号进行复杂的处理分析获取语音的动态频谱,然后,基底膜输出获取的动态频谱经由特殊的神经传感器转换成可以触动听觉神经的信号,在听觉神经上的触动信号,会在大脑更高层的中枢转换成语言编码,由此最终产生人说的话语1。语音信号的的基本组成单位是音素,音素分为清音和浊音。把只有背景噪声而没有任何语音的状态称为无声。严格说,音素分为清音,浊音和无声。3.2语音信号的采集语
11、音信号的采集方式有多种,本课题获取语音信号的途径是利用windows中的录音机程序获取语音。Windows附件中的录音机程序,可以驱动计算机的声卡对语音信号进行初步的采集和播放,通过这个途径获取语音信号十分简捷。不必通过使用MATLAB要编写代码,调用函数才能获得语音信号。当然,通过windows7系统中自带的录音机采集到的语音信号最大时间长度是60秒,而且其文件格式是 .wma格式的,需要转变成 .wav格式的才能利用MATLAB中的wavread函数对其进行获取数据。严格意义上的语音信号是模拟信号,由于计算机是通过二进制记录和处理数据,故录音机采集语音信号的过程,其实是完成将模拟语音信号经
12、过防混叠滤波,采样和量化变为数字语音信号。这样得到的是数字语音信号,即时间离散,幅度离散。预滤波的目的是抑制输入信号中频率超出二分之一采样频率的所有分量和抑制50HZ的电源工频干扰。采样是在一定时间间隔t内对模拟信号X(t)逐点取其降时值。根据奈奎斯特定理,当采样频率fs高于两倍的模拟信号最高频率时,就不会丢失信号的信息,可以用采样后的信号重构原始信号。量化是用量化器将整个信号的幅度值分成若干个有限的区间,落入同一区间的样本点用同一幅度值表示。量化的目的是将信号的连续幅度变成离散幅度。基于个人计算机采集语音信号的过程如下图示声音麦克风声卡滤波采样A/D转换输出文件图3.1 PC机采集语音信号过
13、程4 数字语音信号的时域分析在对语音信号处理之前,需要对语音信号进行分析,获得表示语音信号本质特性的参数,也就是语音信号携带的信息。只要能够获取这些信息,才能够利用这些信息对语音信号进行正确高效的语音合成,语音判别和语音增强等语音处理。而且,对语音信号分析的精确性,会影响语音合成的音质质量,语音识别率的高低。对语音信号的分析采用“短时分析技术”,语音信号是时变信号,而且是非平稳的。但由于人的口腔内的肌肉运动的惯性性运动,可以认为在一定的短时间内(1030ms),这段短时间范围内,语音信号近似不变,其特性基本保持不变,所以语音信号具有短时平稳性。所以对语音信号进行分析之前要对语音信号进行预处理。
14、对语音信号的预处理分为预加重和加窗分帧。预加重就是将语音信号经过高通滤波器,提升高频部分,目的是去除口唇辐射影响2。通过一个传递函数为的一阶FIR高通滤波器,其中是预加重系数,取值范围是0.91.0 。就可提高语音的高频分变率。本课题选取=0.98。以下两幅幅图是高通滤波器幅度频谱图和相位频谱图,语音信号预加重前后的时域波形图和频谱图的对比图。图4.1 高通滤波器的幅频相频特性图4.2 预加重前后语音信号时域频域对比图 由图4.2可以从频域看出语音信号高频部分的幅度被提升,一些预加重前幅度低的地方经过预加重后幅度变高了。前面介绍了语音信号具有短时平稳性,故加窗分帧把语音信号通过可移动的有限长度
15、窗口,分成一段一段的,在一小段范围内分析其特征参数。这样的每一段称为“一帧”。一般每帧的长度定为1030ms。分帧采取的是连续分帧方式,通常选择连续分段,各段部分重叠的方式。如下图所示,这样可以达到帧与帧之间非常平滑的过度,维持信号的连续性。前一段帧与后一段帧的重叠叫帧移,帧移的长度与每一帧的长度一般取做0到1/22。帧长帧移第k帧第k+1帧图4.3 语音信号帧长帧移图采用最多的窗函数有矩形窗和汉明窗。矩形窗,窗函数如下: . (4.1)汉明(Hamming)窗,窗函数如下: . (4.2) 语音信号的首要分析是时域的分析。时域分析是直接对语音信号采样后的序列进行分析,得到的图形就是时域波形。
16、图4.3为本课题研究的语音信号的时域波形图,语音内容为“通信工程“,横轴代表时间,纵轴代表语音信号的幅度。从图中可以看出,语音能量的起伏及语音信号随时间变化过程。图4.4 语音信号时域波形图语音信号的时域特征参数有短时能量,短时过零率,短时自相关函数和短时平均幅度函数等。这些语音信号的最基本的时域特征参数又称为短时时域参数。在语音信号的数字处理中,这些参数各自发挥自己的作用。在计算这些参数,要加入窗函数,而且窗函数的窗长和类型的选取都会影响这些短时时域参数的结果。下面依次以采集到的语音信号作为分析对象,经过预处理后,获取其短时时域参数。4.1 语音信号的短时能量和短时平均幅度由语音信号的时域波
17、形图,可以看出语音信号的能量随时间而变化。而这一短时参数可以区别能量差别十分明显的清音和浊音,所以对短时能量进行分析,用来表达语音信号的这种特征变化情况。语言信号 ,定义时刻语音信号的短时能量是:. (4.3)其中,N为窗长,由式子(4.3)可以认为短时能量是一帧样点值的加权平方和。当令时,式(4.3)可以改写成. (4.4)式(4.4)可理解为:先将语音信号各个样点值平方,然后与冲激响应卷积,也就是通过一个冲激响应为的滤波器。图4.5 语音信号的短时平均能量实现框图 冲激响应的选择,也就是窗函数的选择。窗函数的形状和窗长都直接影响短时能量的计算。若选择幅度恒定的矩形窗,窗长N很长,有离散序列
18、的傅里叶变换可知,这种窗近似为窄带低通滤波器,此时对有平滑作用,短时能量变化不大,不能反映语音信号的时变特性。反过来,窗长N太小,此时对的平滑作用不理性,使得语音信号振幅瞬时变化的许多细节被保留,会看不出振幅包络的变化规律。以下是窗函数是矩形窗时,短时能量,在不同窗长条件下,语音信号短时能量曲线变化情况。图4.6 不同窗长下语音信号短时能量对比图由图可以很明显的证明窗长变化对短时能量的影响,正如前面所叙述的。窗长为100,200,300的短时能量图不够平滑,窗长为500得到的短时能量图慢慢出现一些细节。窗长为700得到的短时能量图就是比较好的。窗长为900得到的短号能量图又过于平滑。这与以上所
19、分析的结果是一致的。 由于短时能量计算时是将信号各个样点值平方,所以对信号电平值十分敏感,在定点实现时容易产生溢出。为了克服这一缺点,可采用语音信号短时平均幅度函数,描述语音信号在幅度上的变化2。. (4.5)可以这样理解式(4.5),先将语音信号取绝对值,然后,对线性滤波。图4.7 语音信号短时幅度实现框图下图是窗函数是矩形窗时,短时平均幅度,在不同窗长条件下,语音信号短时平均幅度函数的变化。由图可以看出窗长N对短时平均幅度的影响与短时能量的分析结果是一致的。图4.8 不同矩形窗长下的语音信号短时平均幅度对比图短时能量和短时平均幅度函数虽然定义不同,但是用途一样,短时能量和短时平均幅度可以作
20、为区分清音和浊音的特征参数,因为,清音能量低于浊音。在信噪比很高的条件下,可以作为有声和无声的依据。还可以用于语音识别中的辅助参数2。4.2 语音信号的短时平均过零率 每帧内语音信号通过零值的次数定义为短时过零率2。对于离散信号,相邻的取样值符号不同,称为过零。对于数字语音信号短时平均过零率定义为: (4.6)为符号函数: (4.7) 为窗函数,在为矩形窗,窗长为N情况下,式(4.6)可变形为: . (4.8)短时平均过零率反应了信号采样点符号变化次数,对于在固定采样频率条件下获取的语音信号,在一定程度上可以反应出频率的信息。由于发浊音和清音时,由于声门波导致的谱的高频跌落,使清音能量集中于高
21、频段,而浊音的能量集中于低频段3kHz以下2。因此,短时平均过零率可以用来初步判断清音和浊音,浊音的过零率低,清音的过零率高。另外,短时平均过零率和短时能量结合起来,可以进行端点检测,也就是判断语音起止点的位置。下图为语音信号时域波形图及短时平均过零率曲线图,计算短时平均过零率选取的窗函数是矩形窗,窗长是500,帧移是250。图4.9 语音信号时域及过零率图4.3 语音信号的短时自相关自相关函数被用于衡量信号自身时间波形的相似性。由于人的发声机理的特点,清音和浊音的波形是不同的。浊音的时间波形呈现一定周期性,清音的时间波形呈现随机噪声特性。所以用短时自相关函数分析语音信号的相似性。语音信号的短
22、时自相关函数为:. (4.9)因为,所以上式可变为:. (4.10)令,代入式(4-10)中,令,则可得 . (4.11)因为当时,为非零值;当时,为非零值,故当时,均为非零值,故式(4.11)可写成. (4.12)下图是语音信号的短时自相关函数曲线。选取的是矩形窗,窗长N=100。图4.10 语音信号的短时自相关函数图5 数字语音信号的频域分析 语音信号的频域分析包含频谱,功率谱,倒频谱等。傅里叶变换法,带通滤波器法,线性预测法是主要的频域分析方法3。本课题主要使用傅里叶变换法分析语音信号频谱。傅里叶分析在线性系统分析和平稳信号稳态特性分析中是十分有用的理论。由语音信号的时域分析可以知道语音
23、信号本质是非平稳信号,但是可以假设语音信号在1030ms的短时间段内是平稳的,所以时域分析确切的说短时分析。在频域分析中,标准的傅里叶变换不可以直接表达语音信号。而是采取短时傅里叶分析方法。对语音信号的频谱分析,得到的频谱为“短时谱”。5.1 语音信号的频谱某一帧的短时傅里叶变换定义:. (5.1)其中,是窗函数。在式(5.1)中短时傅里叶变换有两个变量,离散时间及连续频率,令,得到离散的短时傅里叶变换: 0. (5.2)下图是加窗后语音信号的时域图和频谱图。其中矩形窗窗长N=300,帧移为150。汉明窗窗长为300,帧移为300。图5.1 加窗后语音信号时域图及频谱图5.2 加入噪声及设计滤
24、波器滤波本课题对语音信号分别加入高斯白噪声。高斯白噪声是指功率谱密度是均匀分布,幅度分布服从高斯分布的噪声。本课题使用randn函数产生高斯分布序列,与原始语音通过相加的方法对其进行加噪处理。通过sound函数可以听到语音信号加入噪声前后的区别。加入高斯白噪声的语音可以明显的听到嘶嘶的声音。通过图形可以更直观的分析两种语音的不同。数字滤波器是数字信号分析的重要组成部分,数字滤波器与模拟滤波器相比,数字滤波器的精度与稳定性高,灵活性强。数字滤波器分为无限长单位冲击响应(IIR)数字滤波器和有限长单位冲激响应(FIR)数字滤波器。二者各有自己的优缺点,IIR数字滤波器的优点是可以利用模拟滤波器设计
25、的结果,因为模拟滤波器的设计有大量图表可查,简洁快速。缺点是相位是非线性的。而FIR数字滤波器却可以具有严格的线性相位和任意的幅度特性。由于FIR数字滤波器的单位冲击响应是有限长的,所以滤波器稳定。但是,FIR滤波器的缺点是阶次比IIR数字滤波器高4。本课题设计了IIR数字低通滤波器和FIR数字低通滤波器分别对加噪信号滤波。其中IIR数字滤波器是巴特沃斯低通数字滤波器,FIR低通数字滤波器采用窗函数法设计。 利用模拟滤波器设计IIR数字低通滤波器的方法如下:(1) 给出所设计的数字低通滤波器的性能指标计算相应的模拟低通滤波器的性能指标。(2) 将得到的模拟滤波器的性能指标,利用某种模拟滤波器逼
26、近方法,得到模拟低通滤波器的系统函数。(3) 将模拟原型低通滤波器的系统函数变换成所需的数字低通滤波器的数字低通滤波器的系统函数。图5.2是所设计的巴特沃斯低通数字滤波器的幅频和相频图,低通滤波器的性能指标如下:通带截止频率:,阻带截止频率:。通带波纹系数: ,阻带波纹系数:。抽样频率。图 5.2 巴特沃斯低通数字滤波器幅频和相频图用所设计的巴特沃斯低通数字滤波器对加入白噪声的语音信号滤除噪声后的结果与原始语音信号的对比图如下,同时通过sound函数可以听到滤波后的语音信号几乎没有了噪声,这说明滤波效果还是很好的,但是滤波后的语音信号声音变的低沉,有点发闷,这是因为低通滤波器滤除了高频分量的结
27、果。图5.3 巴特沃斯滤波器滤波前后语音信号时域及频域对比图从图5.3可以看出滤波器滤除了语音信号中夹杂的白噪声,而且滤波前后语音信号的时域图及频谱图几乎一样。窗函数法设计FIR数字滤波器的基本原理是用一定宽度的窗函数截取无限脉冲响应序列获得有限长脉冲响应序列。窗函数法设计FIR数字滤波器的步骤如下:(1)给定所要求的频率响应函数 . (5.3)(2)利用傅里叶逆变换求理想的单位脉冲响应 . (5.4)(3)由过度带宽和阻带最小衰减两个性能指标,确定窗函数形状和窗长N , . (5.5)(4)求所设计的FIR滤波器的单位抽样响应. . (5.6)(5)利用傅里叶变换求 下图是采用kaiser窗
28、设计的FIR低通数字滤波器的幅频和相频特性图,其参数如下:通带截止频率:,阻带起始频率:。通带波纹系数:,阻带波纹系数:。抽样频率:。图5.4 FIR低通数字滤波器的幅频和相频图用所设计的FIR 低通数字滤波器对加入高斯白噪声的语音信号滤除噪声的语音信号的时域波形和频域波形如下图。通过sound函数可以听到滤除噪声后语音稍微还是夹杂着一点噪声,说明采用kaiser窗设计的FIR低通数字滤波器的滤波效果比IIR滤波器滤波效果差点,但是噪声的影响得到了降低。同样加入噪声的语音经过FIR低通滤波器后,声音也变得低,有点发闷。这一点与前面经过IIR低通滤波器的影响是相同的。通过观察滤波前后的时域图和频
29、域图也可以看出滤波的效果达到了基本的要求。因为人的语音主要是频率集中在低频的信号,所以,对加入高斯噪声的语音信号采用低通滤波器滤除噪声是最合适的。但是不足之处是高频分量被低通滤波器滤除,导致语音信号的响度降低。这一点通过回放滤除噪声前后的语音,已得到验证。图5.5 kaiser窗滤波器滤波前后语音信号时域及频域对比图6 语谱图分析 前面已经从时域和频域分析了语音信号。但是,这两种分析方法,仍然具有一定局限性。语音信号的频域分析特性在时域分析里不能很直接的了解到。而且,在频域的分析,频谱只能反映出信号的频率变化,不能看出语音信号随时间的变化关系。语音信号的分析采用短时分析,使短时谱仅可以表现出语
30、音信号的静态频率特性,不能够表现出语音信号的动态频率特性。故出现了语音的时频分析的特性。语谱图就是在时间域和频率域综合分析语音的特性。表示语音信号的频率随时间变化的图形,纵轴用频率表示,横轴用时间表示。在某一固定时刻处,相应点的图形亮度被用来表示频率成分的高低。语谱图最突出的优势是,兼有时域图与频域图的特性,表现出语音频率随时间的变化情况,是动态的频谱3。语谱图的实际用途是判别说话人的声音的本质特性。从语谱图里可以看出,每个地方的黑白度都是不同的,形成各样的纹路,叫做“声纹”。不同的人,声纹也是不同的,就像人的指纹一样是独一无二的。因此,能够采用声纹鉴别不同的发声者3。下图就是本课题所分析的语
31、音信号的语谱。图6.1 语音信号的语谱图7结束语 通过完成本课题最大的感受是锻炼了自己自学的能力。起初,对数字语音信号方面的知识了解的甚少,对MATLAB的了解也如蜻蜓点水,书籍上的代码根本不懂,对整个课题的完成没有基本的思路框架。然后,通过针对自己不懂的地方,查阅与语音信号分析相关书籍和文献,先弄懂基本的语音信号特性参数的定义和基本原理。又查阅有关MATLAB的书籍掌握了MATLAB的基本知识。在利用MATLAB分析语音信号获得所需的特性参数的过程中,是一个理论与实践相结合的过程,同时我也发现将理论运用于实践并不是容易的事。例如,在设计滤波器的过程中,理解滤波器的理论设计步骤不难,但是真正设
32、计滤波器滤除语音中的噪声时,合适的滤波器参数的确定需要多次的修改才能设计出合适的滤波器。在遇到问题的时,有时候一个人的能力是解决不了问题的,要学会和身边的同学合作。通过完成本课题,对语音信号分析方面的知识有了进一步认识,原来关于语音信号的研究不仅有趣而且应用价值很高,同时对MATLAB的运用也得到了提高。会始于MATLAB分析数字信号及设计滤波器。而且复习了之前学过的数字信号处理有关的理论知识。参考文献1韩纪庆.语音信号处理M.北京:清华大学出版社,2004.09.2张雪英.数字语音处理及MATLAB仿真M.北京:电子工业出版社,2010.07.3宋杨洁.基于LabVIEW与MATLAB的语言
33、信号的采集与分析D.武汉:武大理工大学,2012.4程佩青.数字信号处理教程M.北京:清华大学出版社,2007.2.5胡航.语音信号处理M.哈尔滨:哈尔滨工业大学出版社,2000.6薛年喜.MATLAB在数字信号处理中的应用M.北京:清华大学出版社,2003.7刘卫国.MATLAB程序设计与应用(第二版)M.北京:高等教育出版社,2006.7.8刘顺兰,吴杰.数字信号处理(第2版)M.西安:西安电子科技大学出版社,2008.9高西全,丁玉美.数字信号处理(第3版)M.西安:西安电子科技大学出版,2008.10刘敏,魏玲.MATLAB通信仿真与应用M.北京:国防工业出版社,2001.附录致谢 本课题在设计和论文写作过程中,得到了指导老师白艳梅的悉心指导。在论文选题初期,白老师给了我很多建议,在进度安排上,白老师常常督促我,并且嘱咐我论文要做的有深度。遇到不懂的地方,白老师会耐心引导我,正是在白老师的带领下,才得以完成本课题的设计。其次,感谢我的同学给我的帮助。通过完成本课题,我明白了只有不断学习,才能不断进步。
限制150内