本科毕业论文-—语音端点检测算法的研究及matla程序仿真与实现.doc
《本科毕业论文-—语音端点检测算法的研究及matla程序仿真与实现.doc》由会员分享,可在线阅读,更多相关《本科毕业论文-—语音端点检测算法的研究及matla程序仿真与实现.doc(68页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、摘要摘要语音端点检测是指从一段语音信号中准确的找出语音信号的起始点和结束点,它的目的是为了使有效的语音信号和无用的噪声信号得以分离,因此在语音识别、语音增强、语音编码、回声抵消等系统中得到广泛应用。 目前端点检测方法大体上可以分成两类,一类是基于阈值的方法,该方法根据语音信号和噪声信号的不同特征,提取每一段语音信号的特征,然后把这些特征值与设定的阈值进行比较,从而达到语音端点检测的目的,该方法原理简单,运算方便,所以被人们广泛使用,本文主要对基于阀值的方法进行研究。另一类方法是基于模式识别的方法,需要估计语音信号和噪声信号的模型参数来进行检测。由于基于模式识别的方法自身复杂度高,运算量大,因此
2、很难被人们应用到实时语音信号系统中去。端点检测在语音信号处理中占有十分重要的地位,直接影响着系统的性能。本文首先对语音信号进行简单的时域分析,其次利用短时能量和过零率算法、倒谱算法、谱熵算法进行语音端点检测,并对这几种算法进行端点检测,并进行实验分析。本文首先分别用各算法对原始语音信号进行端点检测,并对各算法检测结果进行分析和比较。其次再对语音信号加噪,对不同信噪比值进行端点检测,分析比较各算法在不同信噪比下的端点检测结果,实验结果表明谱熵算法语音端点检测结果比其他两种方法好。关键词语音端点检测;语音信号处理;短时能量和过零率;倒谱;谱熵I燕山大学本科生毕业设计(论文)AbstractEndp
3、oint detection is a voice signal from the accurate speech signal to the identify start and the end points, the purpose is to enable to separated the effective voice signals and un-useful noise. So, in the speech recognition system, speech enhancement, speech coding, echo cancellation and other syste
4、ms are widely used.In Current the endpoint detection can be roughly divided into two categories, one is based on the threshold method based on the different characteristics of speech signal and the noise signals, a voice signal for each extracted feature, and then set the values of these thresholds
5、compare with the values to achieve the endpoint detection purposes, This method is simple, it convenient operation, it is widely used, the main in this paper is based on the method of threshold method. Another method is based on the method of pattern recognition , it needs to estimate the speech sig
6、nal and the noise signal model parameters were detected. Because is based on the method of pattern recognition and high self-complexity, a large amount of computation, so it is difficult to be use in real-time voice signal system for people.The Endpoint detection is take a very important position in
7、 the speech recognition, it directly affects the performance of the system. In this article first domain analysis in simple speech signal time, than dual threshold algorithm, cepstrum algorithm, spectral entropy algorithm for endpoint detection, and these types of endpoint detection algorithms, and
8、experimental analysis points. Firstly, the algorithm were used to the original speech signal detection, and the algorithm to analyze and compare results. Secondly, the speech signal and then adding noise, SNR values for different endpoint detection, analysis and comparison of various algorithms unde
9、r different SNR endpoint detection results, experimental results show that the spectral entropy of speech endpoint detection algorithm results better than the other two methods. Keywordsvoice activity detection;Signal processing; Average energy use of short-term and short-time average zero-crossing
10、rat; cepstrum; spectral entropy III 毕业设计(论文)原创性声明和使用授权说明原创性声明本人郑重承诺:所呈交的毕业设计(论文),是我个人在指导教师的指导下进行的研究工作及取得的成果。尽我所知,除文中特别加以标注和致谢的地方外,不包含其他人或组织已经发表或公布过的研究成果,也不包含我为获得 及其它教育机构的学位或学历而使用过的材料。对本研究提供过帮助和做出过贡献的个人或集体,均已在文中作了明确的说明并表示了谢意。作 者 签 名: 日 期: 指导教师签名: 日期: 使用授权说明本人完全了解 大学关于收集、保存、使用毕业设计(论文)的规定,即:按照学校要求提交毕业设
11、计(论文)的印刷本和电子版本;学校有权保存毕业设计(论文)的印刷本和电子版,并提供目录检索与阅览服务;学校可以采用影印、缩印、数字化或其它复制手段保存论文;在不以赢利为目的前提下,学校可以公布论文的部分或全部内容。作者签名: 日 期: 学位论文原创性声明本人郑重声明:所呈交的论文是本人在导师的指导下独立进行研究所取得的研究成果。除了文中特别加以标注引用的内容外,本论文不包含任何其他个人或集体已经发表或撰写的成果作品。对本文的研究做出重要贡献的个人和集体,均已在文中以明确方式标明。本人完全意识到本声明的法律后果由本人承担。作者签名: 日期: 年 月 日学位论文版权使用授权书本学位论文作者完全了解
12、学校有关保留、使用学位论文的规定,同意学校保留并向国家有关部门或机构送交论文的复印件和电子版,允许论文被查阅和借阅。本人授权 大学可以将本学位论文的全部或部分内容编入有关数据库进行检索,可以采用影印、缩印或扫描等复制手段保存和汇编本学位论文。涉密论文按学校规定处理。作者签名:日期: 年 月 日导师签名: 日期: 年 月 日指导教师评阅书指导教师评价:一、撰写(设计)过程1、学生在论文(设计)过程中的治学态度、工作精神 优 良 中 及格 不及格2、学生掌握专业知识、技能的扎实程度 优 良 中 及格 不及格3、学生综合运用所学知识和专业技能分析和解决问题的能力 优 良 中 及格 不及格4、研究方法
13、的科学性;技术线路的可行性;设计方案的合理性 优 良 中 及格 不及格5、完成毕业论文(设计)期间的出勤情况 优 良 中 及格 不及格二、论文(设计)质量1、论文(设计)的整体结构是否符合撰写规范? 优 良 中 及格 不及格2、是否完成指定的论文(设计)任务(包括装订及附件)? 优 良 中 及格 不及格三、论文(设计)水平1、论文(设计)的理论意义或对解决实际问题的指导意义 优 良 中 及格 不及格2、论文的观念是否有新意?设计是否有创意? 优 良 中 及格 不及格3、论文(设计说明书)所体现的整体水平 优 良 中 及格 不及格建议成绩: 优 良 中 及格 不及格(在所选等级前的内画“”)指导
14、教师: (签名) 单位: (盖章)年 月 日评阅教师评阅书评阅教师评价:一、论文(设计)质量1、论文(设计)的整体结构是否符合撰写规范? 优 良 中 及格 不及格2、是否完成指定的论文(设计)任务(包括装订及附件)? 优 良 中 及格 不及格二、论文(设计)水平1、论文(设计)的理论意义或对解决实际问题的指导意义 优 良 中 及格 不及格2、论文的观念是否有新意?设计是否有创意? 优 良 中 及格 不及格3、论文(设计说明书)所体现的整体水平 优 良 中 及格 不及格建议成绩: 优 良 中 及格 不及格(在所选等级前的内画“”)评阅教师: (签名) 单位: (盖章)年 月 日 教研室(或答辩小
15、组)及教学系意见教研室(或答辩小组)评价:一、答辩过程1、毕业论文(设计)的基本要点和见解的叙述情况 优 良 中 及格 不及格2、对答辩问题的反应、理解、表达情况 优 良 中 及格 不及格3、学生答辩过程中的精神状态 优 良 中 及格 不及格二、论文(设计)质量1、论文(设计)的整体结构是否符合撰写规范? 优 良 中 及格 不及格2、是否完成指定的论文(设计)任务(包括装订及附件)? 优 良 中 及格 不及格三、论文(设计)水平1、论文(设计)的理论意义或对解决实际问题的指导意义 优 良 中 及格 不及格2、论文的观念是否有新意?设计是否有创意? 优 良 中 及格 不及格3、论文(设计说明书)
16、所体现的整体水平 优 良 中 及格 不及格评定成绩: 优 良 中 及格 不及格(在所选等级前的内画“”)教研室主任(或答辩小组组长): (签名)年 月 日教学系意见:系主任: (签名)年 月 日目 录摘要IAbstractII第1章 绪论11.1 课题背景11.2 语音端点检测现状11.3 相关工作21.4 本文主要研究内容3第2章 语音信号时频域分析及预处理42.1 语音信号简述42.2 语音信号分析42.2.1 时域分析52.2.2 频域分析52.3 语音信号分析处理72.3.1 预加重72.3.2 加窗分帧82.4 本章小结9第3章 语音端点检测算法研究103.1 语音端点检测103.1
17、.1 简述103.1.2 语音端点检测原理103.1.3 语音端点检测算法及实施方案123.2 基于短时能量和短时过零率的语音端点检测143.2.1 短时平均能量143.2.2 短时过零率163.2.3 基于短时能量和短时过零率的双门限端点检测173.2.4 双门限语音端点检测实验193.3 基于倒谱特征的语音端点检测203.3.1 倒谱特征203.3.2 倒谱距离203.3.3 倒谱距离的检测算法流程233.3.4 基于倒谱特征的语音端点检测试验分析253.4 基于谱熵的语音端点检测263.4.1 谱熵特征263.4.2 基于谱熵的端点检测流程273.4.4 基于谱熵特征的语音端点检测试验分
18、析283.5 算法比较303.6 本章小结33结 论35参考文献36致 谢37附录139附录245附录353附录461附录569V第1章 绪论 第1章 绪论1.1 课题背景语音端点检测在语音识别中占有十分重要的地位。语音信号处理中的端点检测技术,是指从一句简单的话语中检测出每一个字体或字节的两个端点。是进行其它语音信号处理(如语音识别、讲话人识别等)关键的第一步。进行有效的语音端点检测能够对语音信号更好的进行分析和训练,这样语音识别才能有好的识别率1。实际运用中,通常要求首先对系统的输入信号进行判断,准确地找出语音信号的起始点和终止点。这样才能采集真正的语音数据,减少数据量和运算量,并减少处理
19、时间。目前,语音技术进入了一个相对成熟点,很多厂商和研究机构有了语音技术在输入和控制上令人鼓舞的演示,输入的硬件和软件平台环境也日益向高级化迈进,但语音技术比起人类听觉能力来还相差很远,其应用也才刚刚开始,进一步规范和建设语音输入的硬件通道、软件基本引擎和平台,使语音技术能集成到需要语音功能的大量软件中去。而且语音产业需要更加开放的环境,使有兴趣和实力的企业都能加入到这方面的研究和开发中,逐步改变。随着声控电子产品的不断研发,语音识别技术在开发和研究上还有大量的工作需要做。1.2 语音端点检测现状一个比较好的语音识别或者语音端点检测,不仅仅在其所用到的算法。大多数的语音识别都是对整个系统影响是
20、非常大的,不仅仅是语音识别,也包括语音端点检测。平常的用于实验的也许差不多少,但对于一些高精度的检测或者识别则谬以千里。语音识别都是基于不同算法而进行的,所以每一种识别都要与不同算法相匹配。因此从信号段中检测出语音信号或者语音端点是语音识别的必要的预先处理过程2。随着科技的进步,技术的发展。语音识别、语音检测、语音合成都进入了一个跟高的阶段,语音识别在手机电脑上的应用也虽着科技进步而上升。然而,在一些比较嘈杂的环境下,或者专业一点的技术上的识别,随着信噪比的降低,噪声污染的多样性,噪声环境下的语音识别会大大的降低4。如,在我们身处的环境下,开门声、风扇、水声等等,都算背景噪声。而语音信号所处理
21、的信号时一些纯语音信号,或者是把一些背景噪声降下去。而语音端点检测就是在语音中检测出语音信号和非语音信号,并把语音信号的两个端点给标记处理。语音端点检测是语音识别、语音增强以及语音编码等中的一个非常重要的环节而且必不可少的。有效的端点检测技术不仅能减少系统的处理时间、提高系统的处理实时性,而且能排除无声段的噪声干扰,从而使后面工作的性能得以较大提高5,6。随着越来越多的学者对语音端点检测技术的关注,大量的新的语音端点检测算法相继被提出,而基于同一种算法又有不同的方法。例如对于熵值参数特征的检测算法,有基于信息熵7,8、基于自适应子带谱熵9、子带二次谱熵10、基于小波能量熵11、基于样本熵等的方
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 本科毕业 论文 语音 端点 检测 算法 研究 matla 程序 仿真 实现
限制150内