语音识别系统方案.doc
《语音识别系统方案.doc》由会员分享,可在线阅读,更多相关《语音识别系统方案.doc(14页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、Four short words sum up what has lifted most successful individuals above the crowd: a little bit more.-author-date语音识别系统方案语音识别系统方案语音识别系统方案1.语音识别系统概述语音交互系统是比较人性化的人机操作界面,它需要语音识别系统的支持。LD3320就是这样一款语音识别芯片。本文主要介绍了该芯片的工作原理及应用,给出了LD3320与微处理器的硬件接口电路及软件程序。随着MCU的不断出现,以MCU为核心的嵌入式语音交互系统会有非常好的应用前景。文章下面就以英唐众创开发的语
2、音识别系统为例,介绍一下该系统以及核心构造和原理。2.语音识别系统-特定人语音识别技术及原理特定人语音识别(ASR,Auto Speech RecognitiON)技术是基于关键词语列表的识别技术,它是对大量的语音数据(相当于对数千人采集的数万小时的声音数据)经语言学家语音模型分析,建立数学模型,并经过反复训练提取基元语音的细节特征,以及提取各基元间的特征差异,获得在统计概率意义上的各个基元语音特征,然后才由工程师将算法以及语音模型转换成硬件芯片并应用在嵌入式系统中。ASR技术每次识别的过程就是把用户说出的语音内容,通过频谱转换为语音特征,再将这个转换后的语音特征和关键词语列表中的条目一一进行
3、匹配,较优匹配的一条即作为识别结果。比如ASR技术在语音控制的手机应用中,这个关键词语列表的内容就是电话本中的人名、手机的菜单命令或手机存储卡中的歌曲名字。不论这个列表的条目内容是什么,只需要用户设置相关的寄存器,就可以把相应的待识别条目内容以字符形式传递给识别引擎。由此可见,语音识别芯片完成的工作就是:把MIC(麦克风)输入的声音进行频谱分析后提取语音特征,再和关键词语列表中的关键词语进行对比匹配,然后找出得分高的关键词语作为识别结果输出。通常基于ASR技术的语音识别芯片能在两种情况下给出识别结果:外部送入预定时间的语音数据(比如5 s的语音数据),芯片对这些语音数据运算分析后,给出识别结果
4、。外部送入语音数据流,语音识别芯片通过端点检测(VAD,Voice Activity Detection)技术检测出用户停止说话,把用户开始说话到停止说话之间的语音数据进行运算分析后,给出识别结果。对于情况1,可以理解为设定了一个定时录音(如5 s的语音数据),芯片在5 s后会停止把声音送入识别引擎,并且根据已送入引擎的语音数据计算出识别结果。对于情况2,需要了解VAD的工作原理:VAD技术是在一段语音数据流中,判断出哪个时间点是人声音的开始,哪个时间点是人声音的结束。判断的依据是,在背景声音的基础上有了语音发音,则视为声音的开始。而后,检测到一段持续时间的背景音(比如600ms),则视为人声
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 语音 识别 系统 方案
限制150内