基于DSP和FPGA的机器人声控系统设计与实现_1.docx

上传人：安***

文档编号：17772251

上传时间：2022-05-26

格式：DOCX

页数：10

大小：21.28KB

( 4.5 )

《基于DSP和FPGA的机器人声控系统设计与实现_1.docx》由会员分享，可在线阅读，更多相关《基于DSP和FPGA的机器人声控系统设计与实现_1.docx（10页珍藏版）》请在淘文阁 - 分享文档赚钱的网站上搜索。

1、基于DSP和FPGA的机器人声控系统设计与实现jiangf导语：以DSP和FPGA为核心的嵌入式系统无疑具有广阔的前景。机器人听觉系统主要是对人的声音进展语音识别并做出判定，然后输出相应的动作指令控制头部和手臂的动作，传统的机器人听觉系统一般是以PC机为平台对机器人进展控制，其特点是用一台计算机作为机器人的信息处理核心通过接口电路对机器人进展控制，固然处理才能比拟强大，语音库比拟完备，系统更新以及功能拓展比拟轻易，但是比拟粗笨，不利于机器人的小型化和复杂条件下进展工作，此外功耗大、本钱高。本次设计采用了性价比拟高的数字信号处理芯片TMS320VC5509作为语音识别处理器，具有较快的处理速度，

2、使机器人在脱机状态下，独立完成复杂的语音信号处理和动作指令控制，FPGA系统的开发降低了时序控制电路和逻辑电路在PCB板所占的面积1，使机器人的大脑的语音处理局部微型化、低功耗。一个体积小、低功耗、高速度能完成特定范围语音识别和动作指令的机器人系统的研制具有很大的实际意义。2系统硬件总体设计系统的硬件功能是实现语音指令的收集和步进电机的驱动控制，为系统软件提供开发和调试平台。如图1所示。系统硬件分为语音信号的收集和播放，基于DSP的语音识别，FPGA动作指令控制、步进电机及其驱动、DSP外接闪存芯片，JTAG口仿真调试和键盘控制几个局部。工作流程是麦克风将人的语音信号转化为模拟信号，在经过音频

3、芯片TLV320AIC23量化转化成数字信号输入DSPDSP完成识别后，输出动作指令。FPGA根据DSP输入的动作指令产生正确的正反转信号和准确的脉冲给步进电机驱动芯片，驱动芯片提供步进电机的驱动信号，控制步进电机的转动。片外FLASH用于存储系统程序和语音库并完成系统的上电加载。JTAG口用于与PC机进展联机在线仿真，键盘那么用于参数调整和功能的切换。3语音识别系统设计31语音信号的特点语音信号的频率成分主要分布在3003400Hz之间，根据采样定理选择信号的采样率为8kHz。语音信号的一个特点在于他的短时性，有时在一个短时段呈现随机噪声的特性，而另一段表现周期信号的特性，或者二者兼而有之。

4、语音信号的特征是随时间变化的，只有一段时间内，信号才表现稳定一致的特征，一般来讲短时段可取550ms，因此语音信号的处理要建立在其短时性上2，系统将语音信号帧长设为20ms，帧移设为10ms，那么每帧数据为16016b。32语音信号的收集和播放语音收集和播放芯片采用的是TI公司消费的TLV320AIC23B，TLV320AIC23B的模数转换ADC和数模转换DAC部件高度集成在芯片内部，芯片采用8k采样率，单声道模拟信号输入，双声道输出。TLV320AIC23具有可编程特性，DSP可通过控制接口来编辑该器件的控制存放器，而且可以编译SPI，I2C两种规格的接口，TLV320AIC23B与DSP

5、5509的电路连接如图2所示。DSP采用I2C口对TLV320AIC23的存放器进展设置。当MODE=O时，为I2C规格的接口，DSP采用主发送形式，通过I2C口对地址为00000000001111的11个存放器进展初始化。I2C形式下，数据是分为3个8b写入的。而TLV320AIC23有7位地址和9位数据，也就是讲，需要把数据项上面的最高位补充到第二个8B中的最后一位。MCBSP串口通过6个引脚CLKX，CLKR，FSX，FSR，DR和CX与TLV320AIC23相连。数据经MCBSP串口与外设的通讯通过DR和DX引脚传输，控制同步信号那么由CLKX，CLKR，FSX，FSR四个引脚实现。将

6、MCBSP串口设置为DSPMode形式，然后使串口的接收器和发送器同步，并且由TLV320AIC23的帧同步信号LRCIN，LRCOUT启动串口传输，同时将发送接收的数据字长设定为32b左声道16b，右声道16b单帧形式。33语音识别程序模块的设计为了实现机器人对非特定人语音指令的识别，系统采用非特定人的孤立词识别系统。非特定人的语音识别是指语音模型由不同年龄、不同性别、不同口音的人进展训练，在识别时不需要训练就可以识别讲话人的语音2。系统分为预加重和加窗，短点检测，特征提取，与语音库的形式匹配和训练几个局部。331语音信号的预加重和加窗预加重处理主要是去除声门鼓励和口鼻辐射的影响，预加重数字

7、滤波HZ=1一KZ-1，其中是为预加重系数，接近1，本系统中k取095。对语音序列Xn进展预加重，得到预加重后的语音序列xn：xn=Xn一kXn一11系统采用一个有限长度的汉明窗在语音序列上进展滑动，用以截取帧长为20ms，帧移设为10ms的语音信号，采用汉明窗可以有效减少信号特征的丧失。332端点检测端点检测在词与词之间有足够时间间隙的情况下检测出词的首末点，一般采用检测短时能量分布，方程为：其中，xn为汉明窗截取语音序列，序列长度为160，所以N取160，为对于无音信号En很小，而对于有音信号En会迅速增大为某一数值，由此可以区分词的起始点和完毕点。333特征向量提取特征向量是提取语音信号

8、中的有效信息，用于进一步的分析处理。目前常用的特征参数包括线性预测倒谱系数LPCC、美尔倒谱系数MFCC等。语音信号特征向量采用Mel频率倒谱系数MFCCMelFrequencyCepstrumCoeficient的提取，MFCC参数是基于人的听觉特性的，他利用人听觉的临界带效应3，采用MEL倒谱分析技术对语音信号处理得到MEL倒谱系数矢量序列，用MEL倒谱系数表示输入语音的频谱。在语音频谱范围内设置假设干个具有三角形或者正弦形滤波特性的带通滤波器，然后将语音能量谱通过该滤波器组，求各个滤波器输出，对其取对数，并做离散余弦变换DCT，即可得到MFCC系数。MFCC系数的变换式可简化为：其中，i

9、为三角滤波器的个数，本系统选P为16，Fk为各个滤波器的输出数据，M为数据长度。334语音信号的形式匹配和训练模型训练即将特征向量进展训练建立模板，形式匹配即将当前特征向量与语音库中的模板进展匹配得出结果。语音库的形式匹配和训练采用隐马尔可夫模型HMMHiddenMarkovModels，他是一种统计随机经过统计特性的概率模型一个双重随机经过，由于隐马尔可夫模型可以很好地描绘语音信号的非平稳性和可变性，因此得到广泛的使用4。HMM的根本算法有3种：Viterbi算法，前向一后向算法，Baum-Welch算法。本次设计使用Viterbi算法进展状态判别，将收集语音的特征向量与语音库的模型进展形式

10、匹配。Baum-Welch算法用来解决语音信号的训练，由于模型的观测特征是帧间独立的，进而可以使用Baum-Welch算法进展HMM模型的训练。34语音识别程序的DSP开发DSP的开发环境为CCS31及。DSPBIOS，将语音识别和训练程序分别做成模块，定义为不同的函数，在程序中调用。定义语音识别器函数为intRecognizerintMicin，识别结果输出函数为intResultvoid，语音训练器函数为intTrainintTmode，intAudiod，动作指令输入函数为intKeyinintAction5。语音识别器的作用是将当前语音输入变换成语音特征向量，并对语音库的模板进展匹配并

11、输出结果，语音应答输出函数将获取的语音识别结果对应的语音应答输出，语音训练是将多个不同年龄、不同性别、不同口音的人语音指令输入转化为训练库的模板。为防止样本错误，每个人的语音指令需要训练2次，对于2次输入用用欧氏间隔去进展形式匹配，假设2次输入相似度到达95，那么参加样本集。语音应答输入函数是为每个语音库中模板输入对立的语音输出，以到达语言应答目的。系统工作状态为执行语言识别子程序，训练时执行外部中断，执行训练函数，获得数据库模板，训练完毕返回。程序框图如图3所示。4机器人的动作控制系统设计41FPGA逻辑设计系统通过语音控制机器人头部动作，头部运动分为上下和左右运动2个自由度，需要2个步进电

12、机控制，DSF完成语音识别以后，输出相应的动作指令，动作执行完毕后，DSP发出归零指令，头部回到初试状态。FPGA的作用是提供DSP接口逻辑，设置存储DSP指令的RAM块，同时产生步进电机驱动脉冲控制步进电机转动方向和角度。FPGA器件为动作指令控制单元，设计采用FLEXlOKE芯片，接收DSP数据后并行控制2路步进电机。FPGA内部构造逻辑如图4所示，FPGA内部设置2个元件为电机脉冲发生器，控制电机的工作脉冲以及正反转。AOA7为DSP数据输入端口，WR为数据写端口，P1，P2为2个步进电机驱动芯片脉冲输入口，L1，L2为电机正反转控制口，ENABLE为使能信号。RAM1和RAM2分别为2

13、个步进电机的指令存放器，电机脉冲发生器发出与RAM中相应数目的方波脉冲。DSP通过DOD8数据端输出8位指令，其中。D8为RAM选择，为1时选择RAM1，为0时选择RAM0，DOD7为输出电机角度，电极上下和左右旋转角度为120，精度为1，初始值都为60，DOD7的范围为0000000011111000，初始值为00111100。FPGA作为步进脉冲发生器，通过期钟周期配置控制电机转速，与初始值对应坐标决定正反转。系统动作指令程序如图5所示。其中R1为DSP指令存放器，R2为当前坐标存放器，通过DSP的输出坐标与FPGA的当前坐标进展差值运算来确定步进电机的旋转方向和旋转角度，优点是可以根据新

14、的输入指令的变化，完毕当前动作以运行新的指令，指令执行完毕后，系统清零，步进电机回到初始状态。42FPGA逻辑仿真FPGA以MAX-PLUS开发平台，用语言为VHDL语言对上述逻辑功能进展设计，并通过JTAG接口进展了调试，FLEXl0KE芯片可以根据DSP输出指令输出正确的正反转信号和脉冲波形。43步进电机驱动设计FPGA通过P1，L1，P2，L2输出控制控制步进电机驱动芯片。步进电机驱动采用的是东芝公司消费的单片正弦细分二相步进电机驱动专用芯片TA8435H，FPGA与TA8435H电路连接如图6。由于FLEX1OKE和TMS320VC5509工作电压为33V，而TA8435H为5V和25V，所以管脚连接使用光电耦合器件TLP521，使两边电压隔离。CLK1为时钟输入脚，CWCCW为正反转控制脚，A，A，B，B为二相步进电机输入。5结语系统充分利用了DSP的高处理速度和可扩展的片外存储空间，具有高速、实时、识别率高的特点并支持大的语音库，FPGA的使用使系统电路获得简化，一片FLEXl0KE芯片可以完成2个步进电机的时序控制。固然在处理速度和语音库的存储容量上与PC机系统具有一定的差距，但在机器人的微型化、低功耗和特定功能实现上，以DSP和FPGA为核心的嵌入式系统无疑具有广阔的前景。0

文档加载中……请稍候！
如果长时间未打开，您也可以点击刷新试试。

下载文档到电脑，查找使用更方便

15.18 金币

版权申诉 word格式文档无特别注明外均可编辑修改；预览文档经过压缩，下载后原文更清晰！ 立即下载

配套讲稿：: 如PPT文件的首页显示word图标，表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
特殊限制：: 部分文档作品中含有的国旗、国徽等图片，仅作为作品整体效果示例展示，禁止商用。设计者仅对作品中独创性部分享有著作权。
关键词：: 基于 DSP FPGA 机器人声控系统设计实现 _1

淘文阁 - 分享文档赚钱的网站所有资源均是用户自行上传分享，仅供网友学习交流，未经上传用户书面授权，请勿作他用。

限制150内

关于本文

本文标题：基于DSP和FPGA的机器人声控系统设计与实现_1.docx
链接地址：https://www.taowenge.com/p-17772251.html