DSP芯片的基本结构和特征olo.docx
《DSP芯片的基本结构和特征olo.docx》由会员分享,可在线阅读,更多相关《DSP芯片的基本结构和特征olo.docx(65页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、第2章 DSSP芯片片的基本本结构和特特征2.1 引言可编程DDSP芯芯片是一一种具有有特殊结结构的微微处理器器,为了了达到快快速进行行数字信信号处理理的目的的,DSSP芯片片一般都都具有程程序和数数据分开开的总线线结构、流流水线操操作功能能、单周周期完成成乘法的的硬件乘乘法器以以及一套套适合数数字信号号处理的的指令集集。本章章将首先先介绍DDSP芯芯片的基基本结构构,然后后介绍TTI公司司的各种种DSPP芯片的的特征,最最后简要要介绍其其他公司司的DSSP芯片片的特点点。2.2 DSSP芯片片的基本本结构为了快速速地实现现数字信信号处理理运算,DSP芯片一般都采用特殊的软硬件结构。下面以TM
2、S320系列为例介绍DSP芯片的基本结构。TMS3320系系列DSSP芯片片的基本本结构包包括:(11)哈佛佛结构;(2)流流水线操操作;(33)专用用的硬件件乘法器器;(44)特殊殊的DSSP指令令;(55)快速速的指令令周期。这些特点点使得TTMS3320系系列DSSP芯片片可以实实现快速速的DSSP运算算,并使使大部分分运算(例例如乘法法)能够够在一个个指令周周期内完完成。由由于TMMS3220系列列DSPP芯片是是软件可可编程器器件,因因此具有有通用微微处理器器具有的的方便灵灵活的特特点。下下面分别别介绍这这些特点点是如何何在TMMS3220系列列DSPP芯片中中应用并并使得芯芯片的功
3、功能得到到加强的的。2.2.1 哈佛结结构哈佛结构构是不同同于传统统的冯诺曼(VVon Neuumann)结构构的并行行体系结结构,其其主要特特点是将将程序和和数据存存储在不不同的存存储空间间中,即即程序存存储器和和数据存存储器是是两个相相互独立立的存储储器,每每个存储储器独立立编址,独独立访问问。与两两个存储储器相对对应的是是系统中中设置了了程序总总线和数数据总线线两条总总线,从从而使数数据的吞吞吐率提提高了一一倍。而而冯诺曼结结构则是是将指令令、数据据、地址址存储在在同一存存储器中中,统一一编址,依依靠指令令计数器器提供的的地址来来区分是是指令、数数据还是是地址。取取指令和和取数据据都访问
4、问同一存存储器,数数据吞吐吐率低。在哈佛结结构中,由由于程序序和数据据存储器器在两个个分开的的空间中中,因此此取指和和执行能能完全重重叠运行行。为了了进一步步提高运运行速度度和灵活活性,TTMS3320系系列DSSP芯片片在基本本哈佛结结构的基基础上作作了改进进,一是是允许数数据存放放在程序序存储器器中,并并被算术术运算指指令直接接使用,增增强了芯芯片的灵灵活性;二是指指令存储储在高速速缓冲器器(Caachee)中,当当执行此此指令时时,不需需要再从从存储器器中读取取指令,节节约了一一个指令令周期的的时间。如如TMSS3200C300具有644个字的的Cacche。2.2.2 流水线线与哈佛结
5、结构相关关,DSSP芯片片广泛采采用流水水线以减减少指令令执行时时间,从从而增强强了处理理器的处处理能力力。TMMS3220系列列处理器器的流水水线深度度从26级不不等。第第一代TTMS3320处处理器采采用二级级流水线线,第二二代采用用三级流流水线,而而第三代代则采用用四级流流水线。也也就是说说,处理理器CLKOUT1执行译码取指NN1N2N1N1N2NNN1可以以并行处处理26条指指令,每每条指令令处于流流水线上上的不同同阶段。图图2.11所示为为一个三三级流水水线操作作的例子子。图2.11 三三级流水水线操作作在三级流流水线操操作中,取取指、译译码和执执行操作作可以独独立地处处理,这这可
6、使指指令执行行能完全全重叠。在在每个指指令周期期内,三三个不同同的指令令处于激激活状态态,每个个指令处处于不同同的阶段段。例如如,在第第N个指令令取指时时,前一一个指令令即第NN-1个指令令正在译译码,而而第N-2个指指令则正正在执行行。一般般来说,流流水线对对用户是是透明的的。2.2.3专用用的硬件件乘法器器在一般形形式的FFIR滤滤波器中中,乘法法是DSSP的重重要组成成部分。对对每个滤滤波器抽抽头,必必须做一一次乘法法和一次次加法。乘乘法速度度越快,DSP处理器的性能就越高。在通用的微处理器中,乘法指令是由一系列加法来实现的,故需许多个指令周期来完成。相比而言,DSP芯片的特征就是有一个
7、专用的硬件乘法器。在TMS320系列中,由于具有专用的硬件乘法器,乘法可在一个指令周期内完成。从最早的TMS32010实现FIR的每个抽头算法可以看出,滤波器每个抽头需要一条乘法指令MPY:LT;装乘乘数到TT寄存器器DMOVV;在存存储器中中移动数数据以实实现延迟迟MPY;相乘乘APACC;将乘乘法结果果加到AACC中中其他三条条指令用用来将乘乘数装入入到乘法法器电路路( LLT),移移动数据据(DMMOV)以及将乘法结果(存在乘积寄存器P中)加到ACC中(APAC)。因此,若采用256抽头的FIR滤波器,这四条指令必须重复执行256次,且256次乘法必须在一个抽样间隔内完成。在典型的通用微
8、处理器中,每个抽头需要30 40个指令周期,而TMS32010只需4条指令。如果采用特殊的DSP指令或采用 TMS320C54X等新一代的DSP芯片,可进一步降低FIR抽头的计算时间。2.2.4 特殊的的DSPP指令DSP芯芯片的另另一个特特征是采采用特殊殊的指令令。2.2.33节中介介绍的DDMOVV就是一一个特殊殊的DSSP指令令,它完完成数据据移位功功能。在在数字信信号处理理中,延延迟操作作非常重重要,这这个延迟迟就是由由DMOOV来实实现的。TMS32010中的另一个特殊指令是LTD,它在一个指令周期内完成LT、DMOV和APAC三条指令。LTD和MPY指令可以将FIR滤波器抽头计算从
9、4条指令降为2条指令。在第二代处理器中,如TMS320C25,增加了2条更特殊的指令,即RPT和MACD指令,采用这2条特殊指令,可以进一步将每个抽头的运算指令数从2条降为1条:RPTKK2555;重复复执行下下条指令令2566次MACDD;LT, DMMOV, MPPY 及及 APPAC2.2.5快速速的指令令周期哈佛结构构、流水水线操作作、专用用的硬件件乘法器器、特殊殊的DSSP指令令再加上上集成电电路的优优化设计计,可使使DSPP芯片的的指令周周期在2200nns 以以下。TTMS3320系系列处理理器的指指令周期期已经从从第一代代的2000nss降低至至现在的的20nns 以以下。快快
10、速的指指令周期期使得DDSP芯芯片能够够实时实实现许多多DSPP应用。2.3 TII定点DSSP芯片片自19882年TI推出出第一个个定点DDSP芯片片TMSS320010以以来,TTI的定定点DSSP芯片片已经经经历了TTMS3320CC1X、TMSS3200C2XX/C22XX、TMSS3200C5XX 、TMSS3200C544X、TMSS3200C622X等几几代产品品,产品品的性能能价格比比不断提提高,应应用越来来越广泛泛。下面面分别介介绍这些些芯片的的主要特特征。2.3.1 TMSS3200C1XX2.3.1.11 基基本特点点第一代TTMS3320系系列DSSP芯片片包括:TMS
11、S320010、TMSS320011、TMSS3200C100、 TMMS3220C115/EE15和和TMSS3200C177/E117。其其中,TTMS3320110和TMSS320011采用用2.44mm的 NMMOS 工艺,而而其他几几种则采采用1.8mm CMOOS工艺艺。这些些芯片的的典型工工作频率率为200MHzz。TMSS3200第一代代DSPP芯片的的主要特特点如下下: 指令周周期:1160nns/2200nns/2280nns 片内RRAM:1444字/2556字(TMMS3220C115/EE15/C177/E117) 片内RROM:1.55K字/4KK字(TMMS322
12、0C115/CC17)4K字字片内程程序EPPROMM(TMMS3220E115/EE17)4K字字外部全全速存储储器扩展展 并行乘乘法器:乘积为为32位 桶形移移位器:将数据据从存储储器移到到ALUU 并行移移位器 允许文文本交换换的412位堆堆栈 两个间间接寻址址的辅助助寄存器器 双通道道串行口口(TMMS3220111,TMMS3220C117/EE17) 片内压压扩硬件件(TMMS3220111,TMMS3220C117/EE17) 协处理理器接口口(TMMS3220C117/EE17) 器件封封装:440脚双双列直插插(DIIP)/44脚脚塑封(PPLCCC)2.3.1.22 TMM
13、S3220C110TMS3320 DSPP芯片的的第一代代产品是是基于TTMS3320110和它它的CMMOS版版本TMMS3220C110的结结构。TTMS3320110于19882年推推出,是是第一个个能够达达到 55 个MIPPS的微微处理器器。TMS3320110采用用改进的的哈佛结结构,即即程序和和数据空空间相互互独立。程程序存储储器可在在片内(11.5KK字)或片外外(4KK字)。片内内数据RRAM为为1444字。有有四个基基本的算算术单元元:算术术逻辑单单元(AALU)、累加器(ACC)、乘法器和移位器。(1)AALU:32位数数据操作作的通用用算术逻逻辑单元元。ALLU可进进行
14、加、减减和逻辑辑运算;(2)AACC:累加器器存储AALU的的输出,也也是ALLU的一一个输入入。它采采用322位字长长操作,分分高166位和低低16位两两部分。处处理器提提供高116位和和低166位的专专门指令令:SAACH(高16位)和SACL(低16位);(3) 乘法器器:16616位并并行乘法法器由三三个单元元组成:T寄存器器、P寄存器器和乘法法器阵列列。T寄存器器存储被被乘数,P寄存器存储32位乘积。为了使用乘法器,被乘数首先必须从数据RAM中装入到T寄存器,可用LT、LTA和LTD指令。然后执行MPY(乘)或MPYK(乘立即数)指令。乘和累加器操作可用LTA、LTD和MPY、MPY
15、K指令在两个指令周期内完成;(4) 移位器器:有两两个移位位器可用用于数据据移位。一一个是桶桶形移位位器,另另一个是是并行移移位器。桶桶形移位位器又称称定标移移位器。当当数据存存储器的的数据送送入累加加器或与与累加器器中的数数据进行行运算时时,先通通过这个个移位器器进行0016位左左移,然然后再进进行运算算。并行行移位器器即输出出移位器器,其作作用是将将累加器器中的数数据左移移0、1或4位后再再送入数数据存储储器中,以以实现小小数运算算或小数数乘积的的调整。在TMSS320010/C100基础上上又派生生了多个个处理器器,它们们可提供供不同的的处理器器速度、存存储器扩扩展和各各种I/O集成成。
16、2.3.1.33 TMMS3220C11X的其其他芯片片1TMMS3220C115/EE15TMS3320CC15/E155与TMSS320010的的代码和和管脚全全兼容,提提供2556字的的片内RRAM和和4K字的的片内RROM(CC15)或EPROM(E15)。TMS320C15的指令周期有200ns和160ns(TMS320C15-25)两种。2TMMS3220C117/EE17TMS3320CC17/E177是一个个专用的的微处理理器。它它有4KK字的片片内程序序ROMM(C117)或或EPRROM(EE17),一个全双工串行通信的双通道串行口,片内硬件压扩器(m律/A律),一个用于串
17、行通信的串行口定时器,及一个协处理器接口。协处理器接口可以在处理器和4/8/16位微处理器之间提供直接接口。TMS320C17/E17与TMS32010目标代码兼容,且可用相同的开发工具。该处理器是基于TMS320C10的CPU内核,外加片内的外设存储器和I/O模块。TMS320C17/E17可认为是半定制的DSP芯片。表2.1 是TMS320第一代产品的比较表。表2.11 TMMS3220第一一代处理理器DSP芯芯片指令周期期(ns)制造工艺艺片内程序序ROMM(字)片内程序序EPRROM(字)片内数据据RAMM(字)片外程序序(字)TMS3320110200NMOSS1.5KK1444KT
18、MS3320110-25160NMOSS1.5KK1444KTMS3320110-14280NMOSS1.5KK1444KTMS3320111200NMOSS1.5KK144TMS3320CC10200CMOSS1.5KK1444KTMS3320CC10-25160CMOSS1.5KK1444KTMS3320CC15200CMOSS4K2564KTMS3320CC15-25160CMOSS4K2564KTMS3320EE15200CMOSS4K2564KTMS3320CC17200CMOSS4K256TMS3320CC17-25160CMOSS4K256TMS3320EE17200CMOSS4
19、K2562.3.2 TTMS3320CC2X第二代TTMS3320 DSPP芯片包包括TMMS3220200、TMSS3200C255/E225、TMSS3200C266及TMSS3200C288。在这这些芯片片中,TTMS3320220是一一个过渡渡的产品品,其指指令周期期为2000nss,与TMMS3220100相当,而而其硬件件结构则则与TMMS3220C225一致致。在第第二代DDSP芯芯片中,TMS320C25是一个典型的代表,其他芯片都是由TMS320C25派生出来的。其中TMS320E25将内部4K字的ROM改为EPROM;TMS320C26去掉了内部的4K字ROM,而将片内RA
20、M增加到1.5K字;TMS320C28则将内部ROM增加到8K字。由于TMS320C25的典型性,下面就讨论TMS320C25的基本特征和结构。2.3.2.11 TMMS3220C225的基基本特征征 指令周周期: TMSS3200C255:1000ns,TMSS3200C255-333:1200ns,TMSS3200C255-500:80nns 片内掩掩膜ROOM:4K 字 片内RRAM:5444字,分分B0、B1和B2三块块 程序和和数据空空间均为为64KK字 具有88级硬件件堆栈、8个辅助寄存器 具有全全静态双双缓冲串串行口,可可与许多多串行器器件直接接接口 与低速速片外存存储器通通信的
21、等等待状态态插入 采用HHOLDD操作的的DMAAFFTT变换用用的比特特反转寻寻址 扩展精精度算术术和自适适应滤波波支持 从外部部存储器器全速执执行的MMAC/MACCD指令令 具有在在多处理理器之间间进行同同步的能能力,支支持多处处理器共共享存储储器1.88m CCMOSS工艺,668脚PGAA或PLCCC封装装2.3.2.22 TTMS3320CC25的的结构TMS3320CC25是是第二代代TMSS3200中与TMMS3220200管脚全全兼容的的CMOOS版本本,但指指令执行行速度是是TMSS320020的的2倍,且且增加了了硬件和和软件资资源。指指令集是是TMSS320010和和T
22、MSS320020的的超集,在在源代码码级与它它们兼容容。此外外,在代代码级与与TMSS320020兼兼容,因因此,TTMS3320220的程程序可不不用修改改直接在在TMSS3200C255上运行行。100nns的指指令周期期可提供供较强的的运算能能力。由由于大部部分指令令在一个个指令周周期内执执行,处处理器在在1秒内内可执行行10000万条条指令(110MIIPS)。运算能力的增加主要得益于乘累加指令(MAC)和带数据移位的乘累加指令(MACD)、具有专用算术单元的8个辅助寄存器、适合于自适应滤波和扩展精度运算的指令集支持、比特反转寻址、快速的I/O支持等。指令集中中提供在在两个存存储空间
23、间中进行行数据移移动的指指令。在在外部,程程序和数数据存储储空间在在同一总总线上复复用,从从而使得得在尽量量减少芯芯片引脚脚的情况况下最大大程度地地扩大两两个空间间的地址址范围。在在内部,TMS320C25结构通过保持程序和数据总线结构分离以使指令全速执行来获得最大的处理能力。芯片内部部的程序序执行采采用三级级流水线线形式。流流水线对对用户来来说是透透明的。但但是,在在某些情情况下流流水线可可能被打打断(如如跳转指指令),在在这种情情况下,指指令执行行时间要要考虑流流水线必必须清空空和重新新填充。两两块大的的片内RRAM在在系统设设计时提提供了很很大的灵灵活性,其其中一块块既可配配置为程程序存
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- DSP 芯片 基本 结构 特征 olo
限制150内