基于DSP和FPGA的机器人声控系统设计与实现_1.docx
《基于DSP和FPGA的机器人声控系统设计与实现_1.docx》由会员分享,可在线阅读,更多相关《基于DSP和FPGA的机器人声控系统设计与实现_1.docx(10页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、基于DSP和FPGA的机器人声控系统设计与实现jiangf导语:以DSP和FPGA为核心的嵌入式系统无疑具有广阔的前景。机器人听觉系统主要是对人的声音进展语音识别并做出判定,然后输出相应的动作指令控制头部和手臂的动作,传统的机器人听觉系统一般是以PC机为平台对机器人进展控制,其特点是用一台计算机作为机器人的信息处理核心通过接口电路对机器人进展控制,固然处理才能比拟强大,语音库比拟完备,系统更新以及功能拓展比拟轻易,但是比拟粗笨,不利于机器人的小型化和复杂条件下进展工作,此外功耗大、本钱高。本次设计采用了性价比拟高的数字信号处理芯片TMS320VC5509作为语音识别处理器,具有较快的处理速度,
2、使机器人在脱机状态下,独立完成复杂的语音信号处理和动作指令控制,FPGA系统的开发降低了时序控制电路和逻辑电路在PCB板所占的面积1,使机器人的大脑的语音处理局部微型化、低功耗。一个体积小、低功耗、高速度能完成特定范围语音识别和动作指令的机器人系统的研制具有很大的实际意义。2系统硬件总体设计系统的硬件功能是实现语音指令的收集和步进电机的驱动控制,为系统软件提供开发和调试平台。如图1所示。系统硬件分为语音信号的收集和播放,基于DSP的语音识别,FPGA动作指令控制、步进电机及其驱动、DSP外接闪存芯片,JTAG口仿真调试和键盘控制几个局部。工作流程是麦克风将人的语音信号转化为模拟信号,在经过音频
3、芯片TLV320AIC23量化转化成数字信号输入DSPDSP完成识别后,输出动作指令。FPGA根据DSP输入的动作指令产生正确的正反转信号和准确的脉冲给步进电机驱动芯片,驱动芯片提供步进电机的驱动信号,控制步进电机的转动。片外FLASH用于存储系统程序和语音库并完成系统的上电加载。JTAG口用于与PC机进展联机在线仿真,键盘那么用于参数调整和功能的切换。3语音识别系统设计31语音信号的特点语音信号的频率成分主要分布在3003400Hz之间,根据采样定理选择信号的采样率为8kHz。语音信号的一个特点在于他的短时性,有时在一个短时段呈现随机噪声的特性,而另一段表现周期信号的特性,或者二者兼而有之。
4、语音信号的特征是随时间变化的,只有一段时间内,信号才表现稳定一致的特征,一般来讲短时段可取550ms,因此语音信号的处理要建立在其短时性上2,系统将语音信号帧长设为20ms,帧移设为10ms,那么每帧数据为16016b。32语音信号的收集和播放语音收集和播放芯片采用的是TI公司消费的TLV320AIC23B,TLV320AIC23B的模数转换ADC和数模转换DAC部件高度集成在芯片内部,芯片采用8k采样率,单声道模拟信号输入,双声道输出。TLV320AIC23具有可编程特性,DSP可通过控制接口来编辑该器件的控制存放器,而且可以编译SPI,I2C两种规格的接口,TLV320AIC23B与DSP
5、5509的电路连接如图2所示。DSP采用I2C口对TLV320AIC23的存放器进展设置。当MODE=O时,为I2C规格的接口,DSP采用主发送形式,通过I2C口对地址为00000000001111的11个存放器进展初始化。I2C形式下,数据是分为3个8b写入的。而TLV320AIC23有7位地址和9位数据,也就是讲,需要把数据项上面的最高位补充到第二个8B中的最后一位。MCBSP串口通过6个引脚CLKX,CLKR,FSX,FSR,DR和CX与TLV320AIC23相连。数据经MCBSP串口与外设的通讯通过DR和DX引脚传输,控制同步信号那么由CLKX,CLKR,FSX,FSR四个引脚实现。将
6、MCBSP串口设置为DSPMode形式,然后使串口的接收器和发送器同步,并且由TLV320AIC23的帧同步信号LRCIN,LRCOUT启动串口传输,同时将发送接收的数据字长设定为32b左声道16b,右声道16b单帧形式。33语音识别程序模块的设计为了实现机器人对非特定人语音指令的识别,系统采用非特定人的孤立词识别系统。非特定人的语音识别是指语音模型由不同年龄、不同性别、不同口音的人进展训练,在识别时不需要训练就可以识别讲话人的语音2。系统分为预加重和加窗,短点检测,特征提取,与语音库的形式匹配和训练几个局部。331语音信号的预加重和加窗预加重处理主要是去除声门鼓励和口鼻辐射的影响,预加重数字
7、滤波HZ=1一KZ-1,其中是为预加重系数,接近1,本系统中k取095。对语音序列Xn进展预加重,得到预加重后的语音序列xn:xn=Xn一kXn一11系统采用一个有限长度的汉明窗在语音序列上进展滑动,用以截取帧长为20ms,帧移设为10ms的语音信号,采用汉明窗可以有效减少信号特征的丧失。332端点检测端点检测在词与词之间有足够时间间隙的情况下检测出词的首末点,一般采用检测短时能量分布,方程为:其中,xn为汉明窗截取语音序列,序列长度为160,所以N取160,为对于无音信号En很小,而对于有音信号En会迅速增大为某一数值,由此可以区分词的起始点和完毕点。333特征向量提取特征向量是提取语音信号
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 基于 DSP FPGA 机器人 声控 系统 设计 实现 _1
限制150内