毕业设计(论文)-基于ICA算法的混合语音信号分离(29页).doc
《毕业设计(论文)-基于ICA算法的混合语音信号分离(29页).doc》由会员分享,可在线阅读,更多相关《毕业设计(论文)-基于ICA算法的混合语音信号分离(29页).doc(27页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、-毕业设计(论文)-基于ICA算法的混合语音信号分离-第 22 页学校代码: 10128学 号:200811204070 本科毕业设计说明书题 目:基于ICA算法的混合语音信号分离学生姓名:学 院:电力学院系 别:自动化系专 业:自动化(电厂热工过程控制及其自动化方向)班 级:自动化(电)08-1指导教师: 讲师二一二 年 六 月摘 要现阶段对语音识别、医学、生物、通信等领域中的盲源混合语音信号进行分离有着较高的要求。在任意环境下,会普遍遇到从多维信号源提取或分离出某一独立语音信号这种类似于“鸡尾酒会”的问题。这时,就迫切需要一种合理可靠的方法将观测信号分解为若干独立份。由于信号源是不可观测的
2、,并不知道信号源是由哪些独立信号混合而成。正是,由于ICA算法建立在独立统计之上,适用于解决这种分离混合语音的问题。本文参考算法中独立统计的原则。建立信号源的目标函数,对目标函数进行预处理,运用负熵极大化法求出原独立信号向量的预估向量Y。ICA算法中的负熵极大化法具有使分离后的语音快速发散、信息极大化的特点。所以本文选择ICA算法中的负熵极大化法来分离混合语音。这就是使用ICA算法独立统计原则推断混合系统的独立源信号的基本原因。经过对实验仿真图与原独立语音图比较,实验得出如下结论:利用ICA算法处理盲源混合信号,分离后得到的独立语音清晰、准确、算法优化、方便快捷。关键词:独立分量分析;ICA算
3、法;熵极大化法AbstractAt the present stage speech recognition at medicine, biology, communications and other fields for BSS(Blind Source Speech Separation)has an important position. Whatever the environment is,we need deal with something about separate independent voice from the unknow mixed voice. This si
4、tuation is nearly “Cocktail party”.So,we need find a good way to solve this problem. As source is not observed, we dont know the source be made up by which independent signals . ICA algorithm is apply to solve the problem which mixed voice of this separation. This reference algorithm independent sta
5、tistical principles to establish the source of the objective function. Pretreatment of the objective function, the use of negative entropy maximization method to calculate the estimated vector Y of the original independent signal vector. ICA algorithm in a negative entropy maximization method after
6、the separation of voice rapid divergence, the characteristics of information maximization. Therefore negative entropy maximization method in the ICA algorithm to separate the mixed voice. This is the basic reason of the independent source signals using the ICA algorithm independent statistical princ
7、iples to infer hybrid systems.Experimental results show that:using the algorithm of ICA (Independent Component Analysis) process the blind source mixed-signal.We can easy get an independent signal which is very clear, accurate, algorithm optimization and convenient.Keywords:Independent component ana
8、lysis;Algorithm of ICA;Method of negative entropy maximization.目 录引 言1第一章 前 言21.1 ICA算法应用背景21.2 ICA算法的研究现状21.3 ICA算法的发展趋势21.4 研究任务与方向3第二章 ICA算法42.1 ICA算法的提出42.2 ICA算法的原理42.3 独立统计简介52.4 ICA算法的预处理72.5 负熵极大化法9第三章 仿真实验153.1 流程图153.2 仿真实验163.3 结果分析20总 结21参考文献22附 录23谢 辞25引 言在多语音源情况下,要求分离得到独立声音,即仿真人类语音的识别能
9、力,“鸡尾酒会”就是典型的此类问题。现阶段许多有关多源声音处理的领域,对混合语音信号的分离提取都属于重点研究课题。最近几年盲源语音分离技术已经接近成熟。很多项目已经投入使用,例如我国就把这种技术使用在CDMA通讯中,用于改良语音信号传输的清晰度,实践证明可以得到非常理想的效果。通过改进算法和智能化的引入,现阶段已经能做到排除噪声干扰等外界环境因素对分离结果的影响。但是,还是有很多复杂的语音分离环境仅仅通过算法是无法解决的。进而说明虽然人类对盲源语音分离的研究已经迈出关键一步,但这仅仅只是个开始。我们还需要做更多的科学研究,来使技术更成熟,应用领域更广泛。因此,我们还要走很长的路。第一章 前 言
10、1.1 ICA算法应用背景随着社会的进步,科技的发达,人民生活的需求,在很多领域都需要对盲源信号进行分离提纯。因此,为了解决此类问题,我们必须了解混合声音的特性,以便于我们找到合理有效的算法将独立语音声音按要求分离出来。由于ICA算法是基于独立统计基础之上,各个随机变量之间互不相干。基于负熵极大的ICA算法对此类盲源信号分离后的噪声小,与原独立语音信号相比较语音效果非常近似。正是由于这种对症下药的特点,面对盲源信号等分离问题,ICA算法是最合理的选择。1.2 ICA算法的研究现状上世纪90年代,国外学者利用大量数学算法和模型,例如:递归神经网络模型、独立分量算法、中心归一法等处理多个独立源混合
11、信号的分离。各国学者通过大量的科学验证,ICA算法是处理盲源混合语音最有效的方法。本世纪以来,为了方便处理各个领域盲信号分离问题,许多种优化算法应运而生。但是算法有利有弊,算法间也很难得到统一处理。因此,学者们从不同的角度考虑这个问题。在算法上,BBS算法包括批处理算法与自适应算法;在准则上,又可以分为多种方法,例如:统一处理准则,寻求最优化准则,网孔模式化准则等。随着时代的发展,运用优化算法处理盲源信号已经趋于成熟,技术应用已经与人民生活息息相关。尽管我国对此类技术研究较晚,但在实际应用上已经获得很大进展。本文处于初级研究阶段,仅仅简要介绍一下有关盲分离的基础理论,对盲源分离技术的深层次了解
12、请参照更多文献。很多国家已经把此类技术应用于军事侦查和间谍监听中,我国则大范围应用于提高通信质量,生物技术和民用方向。由北京科技大学研究开发的盲源语音甄别系统第二代升级版,已经试用于辅助公安机关侦破案件。这也间接证明我国对此类技术的广泛重视与开发应用。借此希望国家加大对此类技术各类基金的扶持,成立专门的科学研究小组。1.3 ICA算法的发展趋势有需求就有问题,就有解决问题的方法应运而生。就如30年前学者为了处理“鸡尾酒会”问题应运而生的ICA算法。处理盲源语音信号的方法发展至今,经过改良已经应用于更广泛的领域。诸如国外马里兰大学和欧洲、日本的一些研究机构已经着手于运用此技术研究外太空声音、海上
13、声纳监听识别系统和用于预测海洋地震的发生等。在生物领域也有望通过此类技术研究导致帕金森症产生的真实原因。目前,各国学者一致统一,ICA算法的研究中主要面对的问题有两个。一个是稳定性问题,另一个是收敛性问题。在未来的发展趋势下,力求对多维混合语音分离条件下的分离效果更准确;在多噪声环境下,排除噪声干扰的能力更强;获得独立语音信号更理想清晰。盲源分离技术将会朝着算法更优,分离效果跟明显,去噪效果更好,完全智能化等方向发展。1.4 研究任务与方向本文主要探讨ICA算法的基本理论,知道混合语音的特点,了解算法中处理独立信号的原理,了解ICA算法中负熵极大化算法的应用。运用matlab软件对算法进行编程
14、,学会用程序表示矩阵方程和单独方程的方法。利用已编写程序对录制好的盲源混合语音信号进行语音分离。完成多种二维线型混合语音信号的分离,做好应对各种不确定因素导致仿真结果的不同,及时调整程序,观察仿真图,对比原独立信号与分离信号,找出误差,分析实验结果,得出正确的实验结论。第二章 ICA算法2.1 ICA算法的提出当人们寻求一种解决分离盲源混合声音的方法时,需要了解混合声音的特点。盲源混合语音的特点是由多个独立自主的语音信号所构成。因此,我们只要寻找一个可以解决处理独立统一的算法,就可以继续探讨下一步解决问题的方法。因此,学者们提出了ICA算法。图2-1就是类似此类问题的简图。 图2-1 盲源混合
15、语音信号框图2.2 ICA算法的原理本文用这个公式模拟录音机录制的的多维混合语音信号,用公式来模拟每个独立信号,并且每个独立信号间是没联系的,从公式(1)可以看出,矩阵是由矩阵和A矩阵混合构成的: (2-1)A为混合矩阵。ICA算法关键在于假设一个独立统计的信号源,并且找到一个W矩阵对X矩阵进行解混。本课题里所涉及的混合矩阵A和源信号均未知,本论文介绍的算法就是要分离出每一个独立信号。通过上述方法,得到维输出向量,向量即为独立分量的预估,即,如2-2图示:图2-2经线性混合后的ICA模型由图2-2可知,通过公式(中各行各列仅存在一个元素)求解值,得到。需要找出确定矩阵的值,才能进一步解决问题。
16、事实上未知,因此无法确切的求出,但可以寻找一种方法求出的近似解。推理证明,得到公式,是源信号的线性组合,通过定可以证明的高斯性大于的高斯性。如果(式中的可作为单独的独立分量),这样做的目的是寻找最小高斯性区域,经过计算中各行各列仅存在一个非零元素,通过问题转化,就可以求能使非高斯性最大的来解决。ICA算法最简洁的方法就是寻找最优解,找出最合适的目标函数(又称对比函数)通过最合适的算法求出的最优解。这样就可以认为ICA算法就是求出目标函数与寻找优化算法的过程。在明确目标函数的情况下,可以利用传统的最优化算法进行求解,目标函数的选取决定了算法的一些统计特性,例如算法收敛的速度和计算的稳定性是由优化
17、算法所决定。 2.3 独立统计简介一、概念简介ICA算法的核心内容是独立统计。简要说明,在统计学上独立的定义由概率密度来定义,假定和是两个随机变量,和互不包含各自信息,如果他们的联合概率密度可按公式进行分解,和为和的边缘概率密度,则可以证明和是独立的。由大量实验和数据证明,在个随机变量条件下,上述定理依然成立,由此可以间接证明联合密度可用个随机变量的乘积来表示。二、独立性的随机变量的性质对于假定函数和,总有,正常情况下随机变量的概率密度无从知晓,仅仅从概率的角度来考虑独立问题是非常麻烦的,我们可以换一种角度来讨论独立的定义。依然假设两个随机变量和,如果公式成立,推导出和不相关,如果公式成立,并
18、且(和R),就可以确切的推导出和是统计独立的。综上所述,假设的和独立,那么和一定不相关;同理可证,假设的和不相关,那它们却不一定是独立的。最终讨论出来的结果证明,上述两种方法表达的意思相同,第一种从定义出发,有很强的严谨性,依赖于数学计算和公式推导,但也存在着很强的局限性,不方便初学者对其综合性计算;第二种的核心讨论问题是“相关性”理论的考虑,相关性使独立概念浅显易懂,更适合初学者理解。三、ICA模型中的几个限制条件:(1) 必须确保信号源之间相互独立;(2) 在诸多源信号、之中最多只有一个正态(高斯)分布, 本来分离高斯信号就是一个病态问题,而且混合后的高斯信号依旧以高斯信号形式表现;(3)
19、 仿真过程中观测信号的数量要源信号的数量,即,当时,矩阵为不可逆矩阵,在这种情况下不可能分离出源信号或者是非常困难的分离出来,大多数的情况下应该取;(4) 需要注意的是:本文要求混合矩阵必须是列满秩的矩阵,并且程序设计中取为非奇异方阵。正常情况中,提取的盲源声音中都包含噪声。为了使问题处理简单化,本轮文涉及的盲源混合语音是在非常安静的环境下录制的,可以近似认为忽略噪声带来的的影响。四、ICA算法中存在的不确定因素:在求解时,我们可以通过不同的方法,得到不同的结果,所得到的解也不是唯一的,下面主要谈论几种常见解W矩阵的小方法:(1)还原法:信号源属于盲源信号,信号的幅度是任意的,导致仿真结果图与
20、原独立信号图存在幅度不同的问题。因此在计算时,由于和确切数值并不知道,但是本文通过将中分量扩大倍,在求解W解混矩阵时,仅仅把中对应的混合系数除以,就可以轻易求出W矩阵。运用这种方法可以在确保观测信号幅度不变,排出源信号存在的不确定因素。(2)排序混乱法:联系上文,可知和矩阵都未知,而且在不知道盲源语音信号的前提下,不可能按照人们的意愿先分离出哪个声音,再分离出哪个声音。通常情况下分离出的独立语音都是没有顺序的。但本文将置换矩阵和它的逆矩阵插入在中,经计算可以求得,作为一个新的混合矩阵,起到保持语音有序性的原则,这样程序就可以通过所有分量完成分离独立语音顺序的的任务,得到理想有序的独立分离语音。
21、综上所述,尽管以上谈到这两点问题虽然对信号特征分析起不到太大影响,但是本文力求对最终结果的稳定性、清晰性有序性达到一个合理的设计。还是考虑了信号的主要特征。正是因为信号的波形与幅度,排序无关。因此,在独立分量的求解中,通常情况下设矩阵存在单位方差,并且把S中各分量的均值都看作是零,用公式表示为: , (2-2) ICA算法的目的是要分离盲源语音信号,通过大量实验证明,作为一种新的盲源分离技术,独立分量分析算法在特定条件下,可以有效的将多维盲源语音混合信号进行分离提纯,最终获得清晰、准确的独立信号源。2.4 ICA算法的预处理为了减少噪声和存在的一些潜在病态问题。本文撰写过程中对ICA进行了预处
22、理。ICA预处理应该分两步进行:中心化和白化。对混合矩阵X进行ICA预处理可以大大提高分离结果的准确度,减少程序编写时的工作量,提高了ICA算法的工作效率。为了高效的完成混合语音分离,在论文编写和程序设计中对ICA的预处理是最关键,且必不可少的步骤。通过实验结果可以看出,ICA算法经过预处理后,使程序设计变得更简洁明了,使问题更简单化。一、中心化:中心化就是要要对原始混合语音矩阵X进行处理,利用X减去平均值,为期望,本文取作平均值,用公示表达: (2-3)此时,=0。二、白化:白化法是ICA预处理的核心步骤。白化需要做的工作是把原信号X进行线性变,得到一个新的向量Z。并且向量各个分量之间没有任
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 毕业设计 论文 基于 ICA 算法 混合 语音 信号 分离 29
限制150内