基于DSP的声控电子记事本的设计与实现.doc
《基于DSP的声控电子记事本的设计与实现.doc》由会员分享,可在线阅读,更多相关《基于DSP的声控电子记事本的设计与实现.doc(6页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、基于DSP的声控电子记事本的设计与实现摘要:一种基于DSP芯片的语音识别和数字录音系统。在该系统中,DSP(单片ADSP2185)完成语音识别和数字录音功能,MCU完成用户界面处理。该系统可以实现语音名片(电路号码、工作单位、地址等)存储及声控查询、记事录音及声控回放、日历、简单计算器等功能。 关键词:ADSP2185 语音识别 数字录音语音识别及语音编解码技术经过几十年的发展,已经日趋成熟,步入实用化阶段。语音识别技术已开始应用于电话查询服务、智能玩具、PDA、家用电器、通信、工业控制、语言学习等应用领域;其于码激励线性预测(CELP)技术的语音编解码算法也因其音质好,压缩比大而在通信和数字
2、录音设备中获得了广泛应用。语音输入方式与手写输入方式相比,具有操作简便、查找方便、识别准确率高等优点。省去了大量的输入时间,降低了信息检索的复杂度。本文所介绍的声控电子记事本系统将语音识别和语音编解码在同一片DSP芯片上实现,用语音方式代替其它方式进行信息输入,提高了系统的灵活性。1 系统功能可存200张语音名片,每张语音名片包含四条信息:姓名、电话号码、工作单位、备注;声控查找语音名片信息,用户只需口述所要查找人的姓名,即可获得电话号码、工作单位、备注等信息,同时电话号码显示在液晶显示屏上。具有双音多频(DTMF)拨号功能,用户用声控查找到电话号码并显示在液晶屏上之后,只需轻触一个拨号键,即
3、可通过普通电话机的话筒实现快速自动拨号。数字录音,每段录音加语音标识;声控放音,在放音时只需口述所要语音段的语音标识即可自动找到该段录音并加放,累计录音时间达两个半小时以上。具有方便的编辑功能,增加、删除语音名片,增加、删除数字录音段。2 系统构成本文所介绍的声控电子记事本系统,是在定点16位DSP芯片上实现的,它包含特定人孤立词语音识别算法和代数码本激励线性预测(ACELP)语音编解码算法数(MFCC)为语音特征、以动态时间规划(DTW)为模板匹配算法,对于普通词条,识别率达到了99%以上。用于“录音”功能的ACELP算法是该码率下性能优异的编解码算法,虽然算法复杂度较高,但共重建语音质量的
4、平均主观评测分数(MOS分)达到了4.0,非常接近于压缩前的分数4.3。 如图1所示,系统由MCU实现总线控制,接受外部键盘输入,并在液晶屏上显示信息。在本系统中,语音充当大部分人机界面的角色,尽量省去复杂的键盘操作,而且用语音提示或语音回放代替一部门液晶文字提示。由于语音要经过DSP处理,所以MCU需要与DSP经常交换信息,以便实现友好的操作界面。2.1 DSPDSP(ADSP2185)是整个硬件系统的信号处理中心,完成语音识别、训练、编解码,进行片内RAM及外部FLASH存储芯片的数据管理与调度,并向主控芯片MCU提供简洁的命令与反馈信息。ADSP2185是Analog Devices公司
5、的产品,其主要性能如下:运算速度为50MIPS,且均为高效的单周期指令。提供了80Kbyte的片内RAM,其中32Kbyte为数据RAM,48Kbyte为程序RAM。最大可支持4Mbyte的外部存储区,用于存储数据或程序。提供对字节存储区(BM)与片内RAM区之间的DMA方式支持。提供两上可编程、全双工、自动进行收发缓冲区操作的串行口。2.2 MCUMCU(KS57C2316)是SAMSUNG公司生产的性价比较高的一种CMOS四位单片机,可以一次性编程,适于小批量生产,被广泛地应用于家用电器的控制,它具有强大的I/O功能。其主要性能如下:ROM为16K8 bit;RAM为5124 bit40个
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 基于 DSP 声控 电子 记事本 设计 实现
限制150内