2022年2022年接口技术报告 2.pdf
《2022年2022年接口技术报告 2.pdf》由会员分享,可在线阅读,更多相关《2022年2022年接口技术报告 2.pdf(4页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、接口技术作业报告Intel Core i7处理器是英特尔于2008 年推出的 64 位四核心 CPU, 沿用 x86-64 指令集,并以 Intel Nehalem 微架构为基础1,取代 Intel Core 2 系列处理器。 Nehalem 曾经是 Pentium 4 10 GHz版本的代号。Intel Core i7 的特点主要有以下几点:(1)支持超线程的技术,令到四核心的处理器,有总共8 个线程 (2010 年推出的 Core i7 980X 6 核心系列将有 12 个线程)(2)存储器控制器会自带于CPU 中,支持三通道DDR3 SDRAM(3)支持 Turbo Mode (后更名为
2、 Dynamic Speed )技术,倘若有程序使用较多的处理器负载,处理器频率可以按步骤提升,此外,可以自动往上提升倍频9该功能不需要操作系统的支持,完全由硬件监(4)支持 Power Gates 技术,核心闲置的时候可被关闭。对比上一代的Core 2 Duo ,Core i7 的核心电阻可以被关闭,电流可以完全不通过核心。各个处理器核心可运作于不同的频率和电压(5)Turbo Mode及 Power Gates功能都是由一个单元提供,占去大约一百万个晶体管(6)放弃了传统的FSB,使用了新的 Quick Path Interconnect,与 AMD 的 HyperTransport相似。
3、相比FSB , 每一个处理器都可以有独立的QPI 通道与其他处理器连接, 处理器之间不用再共享FSB 带宽,并绕路到北桥才能通信。此外,QPI 是双向传输(7)指令集方面, SSE4 的版本会提升为SSE 4.2 ,后者新增了 7 条指令(8)处理器采用模块化设计。例如核心、存储器控制器、以至输入输出接口控制器,都能够以不同的数量配搭。这样做可以使到产品更容易针对不同市场,而每一个模块都可以有独立的电压,令到处理器更省电(9)L2 缓存亦有所减少,每一个核心独立256KB,但拥有较低读取延迟值。加入L3 缓存,每一个处理器共享 8MB(10)处理器核心的电压与系统存储器同步。目前,官方会支持D
4、DR3-800 和 DDR3-1066 规格。对于DDR3-1333 ,由于处理器只可以接受较低的电压水平(限制在1.65V 或以下) ,高速的存储器意味着需要较高的电压, 所以此规格的官方支持仍然存在疑问。第二批 X58 芯片组主机版将可以实现电压异步,方便用家超频。另外,原先只有 XE 版本处理器可以调整存储器频率。后Intel 修改为所有上市的Core i7 处理器,均可以修改存储器和QPI 的频率Nehalem 的核心部分比Core 微架构改进了以下部分:快速通道互联(QPI):取代前端总线(FSB)的一种点到点连接技术,20 位宽的 QPI 连接其带宽可达惊人的每秒 25.6GB ,
5、远超过原来的FSB。QPI 最初能够发放异彩的是支持多个处理器的服务器平台,QPI 可以用于多处理器之间的互联。集成了内存控制器(IMC) :内存控制器从北桥芯片组上转移到CPU 片上,支持三通道DDR3 内存, 内存读取延迟大幅减少,内存带宽则大幅提升,最多可达三倍。Cache设计:采用三级全内含式Cache设计, L1 的设计与 Core 微架构一样; L2 采用超低延迟的设计,每个核心各拥有256KB 的 L2 Cache;L3 则是采用共享式设计,被片上所有核心共享使用。Nehalem的核心部分比Core 微架构新增加的功能主要有以下几方面:New SSE4.2 Instruction
6、s (新增加 SSE4.2指令)Turbo Mode (内核加速模式)Improved Lock Support (改进的锁定支持)Additional Caching Hierarchy (新的缓存层次体系)Deeper Buffers (更深的缓冲)名师资料总结 - - -精品资料欢迎下载 - - - - - - - - - - - - - - - - - - 名师精心整理 - - - - - - - 第 1 页,共 4 页 - - - - - - - - - Improved Loop Streaming (改进的循环流)Simultaneous Multi-Threading (同步多
7、线程)Faster Virtualization (更快的虚拟化)Better Branch Prediction (更好的分支预测)QPI 总线技术Nehalem使用的 QPI 总线是基于数据包传输 (packet-based ) 、 高带宽、低延迟的点到点互连技术 (point to point interconnect),速度达到6.4GT/s (每秒可以传输6.4G 次数据)。每一条连接(link)是 20bit位宽的接口,使用高速的差分信号(differential signaling)和专用的时钟通道(dedicated clock lane),这些时钟通道具有失效备援(failo
8、ver )。 QPI 数据包是 80bit 的长度,发送需要用4 个周期。尽管数据包是 80bit ,但只有 64bit 是用于数据,其它的数据位则是用于流量控制、CRC 和其它一些目的。这样,每条连接就一次传输16bit (2Byte )的数据,其余的位宽则是用于CRC 。由于 QPI 总线可以双向传输,那么一条 QPI 总线连接理论最大值就可以达到25.6GB/s (22B 6.4GT/s )的数据传送。单向则是12.8GB/s 。对于不同市场的Nehalem ,可以具有不同的QPI 总线条数。比如桌面市场的CPU ,具有 1 条或者半条 QPI 总线(半条可能是用10bit 位宽或单向)
9、; DP 服务器(双 CPU 插座)的 CPU ,每个具有 2 条 QPI总线;而 MP 服务器( 4 个或 8 个 CPU 插座)的,则每个具有4 条或更多的QPI 总线。IMC( 集成内存控制器) Nehalem的 IMC (integrated memory controller, 整合内存控制器),可以支持 3 通道的 DDR3 内存,运行在 1.33GT/s (DDR3-1333 ),这样总共的峰值带宽就可以达到32GB/s (3 64bit 1.33GT/s8)。不过还并不支持FB-DIMM ,要 Nehalem EX (Beckton )才有可能会支持FB-DIMM (Fully
10、 Buffered-DIMM,全缓冲内存模组)。每通道的内存都能够独立操作,控制器需要乱序执行来降低(掩盖)延迟。由于有了Core 2 近 4 倍的内存带宽, Nehalem的每个核心支持最大10 个未解决的数据缓存命中失败(outstanding data cache miss)和总共 16 个命中失败,而Core 2 在运行中则只支持最大8 个数据缓存的和总共14 个的命中失败。IMC 能够很显著的降低内存延迟(尤其是对于采用FB-DIMM 方案的系统)。下面的Nehalem与Harpertown ,我不清楚是什么频率情况下的对比(来自于IDF 上的表格,可能Nehalem是 3.2GHz
11、 )。Nehalem的本地内存延迟大约是Harpertown的 60% 。Harpertown系统使用的是1.6GT/s 的前端总线,所有内存都在一个位置,大约是略低于100ns (纳秒)的延迟,这样Nehalem 的内存延迟就是约60ns 。对于 2 个 CPU 插座的 Nehalem 来说,使用的是 NUMA 结构(Non Uniform Memory Access Achitecture,非均匀内存存取架构),远方内存的延迟则要高一些,因为这时对内存的请求和回应需要通过QPI 总线,其延迟大约是Harpertown的 95% 。所以,即使是最糟糕的情况,延迟还是得到了降低。一个有意思的问
12、题是, 当使用 4 个 CPU 插座的 Nehalem 时, 延迟是否将会被增大?因为这种系统很有可能会使用FB-DIMM ,而这意味着将遭受延迟损失,不过远方内存的延迟还是将只会比本地内存慢个约30ns 。对于其它使用IMC 和核心互连的多CPU 系统 (例如 EV7 、 K8、 K10 ) , 内存延迟也是非均匀的 (NUMA ) 。为了优化性能,操作系统就必须知道延迟差异,并调度那些在同一个CPU 上共享数据的进程。Windows Vista 是 Microsoft 的第一个为NUMA 进行优化的操作系统, 而 Linux 等则已经很早就可以支持NUMA 了。Nehalem的远方 /本地
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 2022年2022年接口技术报告 2022 接口 技术 报告
限制150内