硬件设计.ppt
《硬件设计.ppt》由会员分享,可在线阅读,更多相关《硬件设计.ppt(95页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、DSP技术及应用技术及应用李红李红主要内容主要内容1.硬件结构2.引脚与信号说明第二章第二章 DSP硬件系统硬件系统2.1C54XX硬件结构基本结构基本结构 下图给出了C54x DSP的结构框图。C54x DSP的基本结构围绕8条总线(4条程序/数据总线和4条地址总线),有中央处理器(CPU)、存储器及片内外设与专用硬件电路三类。CPU包括算术逻辑单元(ALU)、累加器(ACC)、乘累加单元(MAC)、移位寄存器和寻址单元等。存储器包括片内ROM、单访问RAM(SARAM)和双访问RAM(DARAM)。片内外设与专用硬件电路包括片内各种类型的同步串口、主机接口、定时 器、时 钟 发 生 器、锁
2、 相 环 及 各 种 控 制 电 路。C54x DSP系列芯片种类很多,但体系结构基本一致。不同型号的C54x DSP芯片CPU结构与功能完全相同,其差异主要体现在存储器容量、片内外设、供电电压、速度以及封装上。表2.1列出了不同型号C54x DSP系列芯片的主要特征。其中,“*”表示该芯片有1个时分复用串口(TDM),“!”表示有1个缓冲串口(BSP)(C548/9有2个),“?”代表多通道缓冲串口(MCBSP),“#”代表不同的锁相环(PLL)选项,“”表示每个核有6通道直接存储器访问(DMA)器件。表 C54x DSP芯片的主要特征硬件工作概述硬件工作概述C54X总线结构片内存储器中央处
3、理单元片内外设串行口IEEE.1149.1标准扫描逻辑C54xx总线结构TMS320C54xx DSP采用先进的哈佛结构并具有八组总线,其独立的程序总线和数据总线允许同时读取指令和操作数,实现高度的并行操作。54xx结构的建立主要围绕着8条16位的总线展开的。这8条总线包括4条程序数据总线和4条地址总线。采用各自分开的数据总线分别用于读数据和写数据,允许CPU在同一个机器周期内进行两次读操作数和一次写操作数。独立的程序总线和数据总线允许CPU同时访问程序指令和数据。采用冯.诺依曼结构的处理器程序程序/数据存储器数据存储器CPU哈佛结构哈佛结构程序存储器程序存储器CPU数据存储器数据存储器哈佛结
4、构的指令流的定时关系中央处理单元(CPU)1.40位的算术逻辑单元(ALU);22个40位的累加器;340位桶形移位器;41717位乘法器;540位加法器;6比较选择存储单元(CSSU);7数据地址发生单元;8程序地址发生单元。1算术逻辑单元(ALU)和累加器TMS320C54x使 用 40位 算 术 逻 辑 单 元(ALU)和两个40位累加器(ACCA和ACCB)来完成算术运算和逻辑运算,且大多数都是单周期指令。ALU功能框图如图所示。其中保护位可以防止迭代运算中(如自相关运算)产生的溢出。40位ALU可以实现绝大多数的算术和逻辑运算功能,且许多运算可以在1个周期内完成。ALU有2个输入端,
5、1个输出端。当ALU进行算术运算时,分为两个16位的ALU使用,此时来自数据存储器、累加器或T 寄存器的数据分别进入两个ALU。在这种情况下,1个周期内将同时完成两个16位的操作。ALU的运算结果通常被送往累加器A或累加器B。AG、BG、AH、BH、AL和BL是存储器映射寄存器(MMR),它们的值可以通过压入或弹出堆栈进行保存或恢复。ACCA和ACCB 的差别在于ACCA的(3116)位可以用作乘累加单元的一个输入。这些寄存器还可用于寻址操作。2桶形移位寄存器如图所示为桶形移位寄存器的功能框图。桶形移位寄存器的输入可以为:从DB获得的16位操作数;从DB和CB获得的32位操作数;从累加器A或B
6、获得的40位操作数。桶形移位寄存器的输出连到ALU或经过MSW/LSW(最高有效字/最低有效字)写选择单元至EB总线。40位的桶形移位寄存器主要用于累加器或数据区操作数的定标:(1)在ALU运算前,对来自数据存储器的操作数或者累加器的值进行定标;(2)对累加器的值进行算术或逻辑移位;(3)对累加器归一化处理;(4)对累加器的值存储到数据存储器之前进行定标。移位位数范围为-1631,移位位数为正对应于左移,移位位数为负则对应于右移。40位的输出结果可以送到ALU的输入端。移位数可以用一个立即数(-1615)形式定义,或者用状态寄存器ST1的累加器移位模式(ASM)字段(共5位)定义,或者用T寄存
7、器中最低6位的值来定义。例如:SFTL A,+2 ;累加器A(ACCA)中的值逻辑左移2位 ADD A,ASM,B;累加器A中的值移位(位数由ASM值确定)后与累加器B的值 相加,结果放在累加器B(ACCB)中 NORM A ;标准化累加器A中的值(移位位数由T寄存器中最低6位的值确定)3乘法器/加法器单元C54x CPU有一个17*17位的硬件乘法器,与40位的专用加法器相连,可以在单周期内完成一次乘法累加运算。其功能框图如图所示。乘法器的输出经小数/整数乘法(FRCT)输入控制后加到加法器的一个输入端,加法器的另一个输入端来自累加器A或B。加法器还包括零检测器、舍入器(二进制补码)及溢出/
8、饱和逻辑电路。MAC单元中,乘法器能够进行有符号数、无符号数以及有符号数与无符号数的相乘运算,依据不同情况作以下三种处理:(1)如果是两个有符号数相乘,则每个16位操作数先进行符号扩展,在最高位前添加1个符号位(其值由最高位决定),扩展为17位有符号数后再相乘;(2)如果是无符号数乘以无符号数,则在两个操作数的最高位前面添加“0”,扩展为17位的操作数再相乘;(3)如果是有符号数与无符号数相乘,有符号数在最高位前添加1个符号位(其值由最高位决定),无符号数在最高位前面添加“0”,然后两个操作数相乘。两个16位的二进制补码相乘会产生两个符号位,为了提高计算精度,在状态寄存器ST1中设置小数相乘模
9、式FRCT=1,乘法器结果左移1位以去掉1个多余的符号位。在MAC单元中,加法器的输入一个来自乘法器的输出,另一个来自累加器A或B中的某一个输出。加法器的运算结果输出到累加器A或B中。4比较、选择和存储单元(CSSU)比较、选择和存储单元(CSSU)是专门为Viterbi算 法 设 计 的 加 法/比 较/选 择(ACS)操作的硬件单元,其功能框图如图所示。CSSU支持均衡器和信道译码器所用的各种Viterbi算法。Viterbi算法示意图如图所示。CSSU单元是为实现数据通信与模式识别领域常用的快速加法/比较/选择ACS运算而专门设计的专用硬件电路。CSSU中的比较电路将累加器中的高16位与
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 硬件 设计
限制150内