计算机系统结构论文.doc
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_05.gif)
《计算机系统结构论文.doc》由会员分享,可在线阅读,更多相关《计算机系统结构论文.doc(11页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、【精品文档】如有侵权,请联系网站删除,仅供学习与交流计算机系统结构论文.精品文档.计算机系统结构论文计算机系统结构中多处理机技术摘要:多处理机通过共享的主存或输入/输出子系统或高速通信网络进行通信。利用多台处理机进行多任务处理,协同求解一个大而复杂的问题来提高速度,或者依靠冗余的处理机及其重组能力来提高系统的可靠性、适应性和可用行。该文介绍了微处理器的发展、多处理机的总线以及处理机系统中通信和存储技术的发展和两种特殊的多处理机系统结构。关键词:多处理机;体系结构;总线微电子技术和封装技术的进步,使得高性能的VLSI 微处理器得以大批量生产,性能价格比不断合理,这为并行多处理机的发展奠定了重要的
2、物质基础。计算机系统性能增长的根本因素有两个:一是微电子技术,另一个是计算机体系结构技术。五十年代以来,人们先后采用了先行控制技术、流水线技术、增加功能部件甚至多机技术、存储寻址和管理能力的扩充、功能分布的强化、各种互联网络的拓扑结构以及支持多道、多任务的软件技术等一系列并行处理技术,提高计算机处理速度,增强系统性能。多处理机体系结构是计算机体系结构发展中的一个重要内容,已成为并行计算机发展中人们最关注的结构。1 微处理器的发展20 世纪80 年代中期,RISC 精简指令集计算机,用20%指令的组合实现了CISC 计算机指令系统不常用的80%指令的功能。在提高性能方面,RISC 采用了超级流水
3、线、超级标量、超长指令字并行处理结构;多级指令Cache;编译优化等技术,充分利用RISC 的内部资源,发挥其内部操作的并行性,从而提高流水线的执行效率。20 世纪80 年代后期,RISC 处理机的性能指标几乎以每年翻一番的速度发展,它对于提高计算机系统的性能和应用水平起着巨大的作用。目前, 由Intel 和HP 两家公司联合开发的基于IA64 架构的Merced 芯片, 并由其共同定义的显式并行指令计算技术EPIC(Explicitly Parallel Instruction Computing ),将为微处理器技术的发展带来突破性进展。EPIC 技术主要指编译器在微处理器执行指令之前就对
4、整个程序的代码作出优化安排,编译器分析指令间的依赖关系,将没有依赖关系的指令(最多3 个)组成一“组”,由Merced内置的执行单元读入被分成组的指令群并执行。从理论上讲,EPIC 可以并行执行3 倍于执行单元数的指令。64 位体系结构的Merced 芯片还采用了指令预测、数据预装等技术,可以显著地减少实际执行程序的长度,同时增强语句执行的并行性,经过代码的重组,程序的执行时间比基于传统体系结构的微处理器几乎减少了一半;更加不同凡响的是,可以消除分支预测错误的三分之二。IA64 微处理器具有128 个通用寄存器以及128 个浮点寄存器,而目前基于RISC 的微处理器通常只有32 个寄存器。它还
5、具有更为丰富的与大量寄存器相连的附属功能部件,使得其应用更为广泛,同时内部各功能部件之间的可伸缩性扩展了机器的“宽度”, 提高了系统的性能。容量更大的Cache 以及更多的读写端口, 使得基于IA64 微处理器的速度不再受到存储延迟的限制。EPIC 设计的Merced 芯片可并行处理十几个运算,而当今最优秀的芯片也只能并行处理4 个运算操作。EPIC 芯片用并行方式执行任务而不用顺序执行,这将使其速度比现在的CISC 和RISC 芯片至少快两倍。只有0.18 微米微小距离的迹线间宽度也使芯片时钟能够达到900MHZ。使用EPIC 设计的Merced 是第一个被分为三部分的芯片:一部分运行CIS
6、C,另一部分运行RISC,第三部分运行EPIC。把三种体系结合于一块芯片意味着现存的应用程序将仍然可以运行在基于新芯片的服务器上。2 多处理机的总线目前,在多处理机系统中有两种主要的连接方式:一种是共享存贮器的的多处理机系统,另一种是消息传递的分布式多处理机系统。由于专用信号处理系统一般要求结构紧凑,在满足实时性要求的前提下,对系统资源的利用率要求放在比较次要的位置上,故其操作系统简单实用,不具备消息传递的多处理机系统中的复杂的消息寻径能力;另外,由于信号处理场合的大计算量要求,系统内处理机比较多,单纯的共享总线结构效率不高。因此,共享总线结构和分布式结构相结合是一种发展趋势。大多数多处理机系
7、统的互连结构可归结为共享总线系统结构,共享总线系统结构为传统多处理系统的互连形式,由于没有通信口,处理机之间交换数据必须通过共享存贮器,其处理效率随着处理机数目增加而下降。3 通信的发展由于通信通常在芯片的外部实现,其速度远低于芯片内部的计算速度,因而通信往往成为并行多处理机系统发展的瓶颈。通信网络中,总线结构最简单,节点机数目较大时,总线上的通信趋于饱和,成为并行机发展的瓶颈。采用开关网络来取代总线可以增加通信通路的数目,消除通信瓶颈。交叉开关可以提供任意源节点到任一目的节点的通路,但硬件成本高。N 个部件互联需要O(N2)交叉点的开关,当N100 时,成本之高是惊人的。折衷的办法是采用多级
8、开关,适当减少互连通路以降低成本,但通信性能也会随之下降。消息传递是一种有效的通信方法。消息格式的改进使多计算机的寻径由存储转发方式演进为虫蚀方式。第一台多计算机系统采用的是存储转发(store and forword)寻径方式。在存储转发网络中,包是信息流的基本单位,每个节点有一个包缓冲区,包从源节点经过一系列中间节点到达目的节点。包交换的寻径方式以其较高的传输带宽和较低的平均传输时延,更适合于具有动态和突发特性的MMP 系统的数据传送。目前的一些多计算机系统多采用虚拟直通的寻径方式。其思想是:为了减少时延,没有必要等到整个消息全部缓冲后再作路由选择,只要接受到用作寻径的消息头部即可判断。其
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 计算机系统 结构 论文
![提示](https://www.taowenge.com/images/bang_tan.gif)
限制150内