DDR系列内存详解及硬件设计规范.pdf
《DDR系列内存详解及硬件设计规范.pdf》由会员分享,可在线阅读,更多相关《DDR系列内存详解及硬件设计规范.pdf(44页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、 D D D DD D D DR R R R 系列系列系列系列内存内存内存内存详解及硬件详解及硬件详解及硬件详解及硬件设计规范设计规范设计规范设计规范 By:Michael Oct 12,2010 DDR 系列内存详解及硬件设计规范 1目目目目 录录录录 1.概述.3 2.DDR 的基本原理.3 3.DDR SDRAM 与 SDRAM 的不同.5 3.1 差分时钟.6 3.2 数据选取脉冲(DQS).7 3.3 写入延迟.9 3.4 突发长度与写入掩码.10 3.5 延迟锁定回路(DLL).10 4.DDR-.12 4.1 DDR-内存结构.13 4.2 DDR-的操作与时序设计.15 4.3
2、 DDR-封装技术.19 5.DDR-.21 5.1 DDR-技术概论.21 5.2 DDR-内存的技术改进.23 6.内存模组.26 6.1 内存模组的分类.26 6.2 内存模组的技术分析.28 7.DDR 硬件设计规范.34 7.1 电源设计.34 7.2 时钟.37 7.3 数据和 DQS.38 7.4 地址和控制.39 7.5 PCB 布局注意事项.40 7.6 PCB 布线注意事项.41 7.7 EMI 问题.42 7.8 测试方法.42 DDR 系列内存详解及硬件设计规范 2摘要:本文介绍了 DDR 系列 SDRAM 的一些概念和难点,并分别对 DDR-I/的技术特点进行了论述,
3、最后结合硬件设计提出一些参考设计规范。关键字关键字关键字关键字:DDR,DDR,DDR,DDR,SDRAMSDRAMSDRAMSDRAM,内存模组内存模组内存模组内存模组,DQSDQSDQSDQS,DLL,MRS,ODT,DLL,MRS,ODT,DLL,MRS,ODT,DLL,MRS,ODT Notes:Aug 30,2010 Added DDR III and the PCB layout specification -by Michael.Hao DDR 系列内存详解及硬件设计规范 31.概述 DDR SDRAM 全称为 Double Data Rate SDRAM,中文名为“双倍数据流
4、SDRAM”。DDR SDRAM 在原有的SDRAM 的基础上改进而来。也正因为如此,DDR 能够凭借着转产成本优势来打败昔日的对手 RDRAM,成为当今的主流。本文着重介绍 DDR 的原理和 DDR SDRAM 相对于传统 SDRAM(又称 SDR SDRAM)的不同。DDR SDRAM 可在一个时钟周期内传送两次数据 2.DDR的基本原理 我们看 DDR 正规的时序图。DDR SDRAM 读操作时序图 从中可以发现它多了两个信号:CLK#与 DQS,CLK#与正常 CLK 时钟相位相反,形成差分时钟信号。而数据的传输在 CLK 与 CLK#的交叉点进行,可见在 CLK 的上升与下降沿(此时
5、正好是 CLK#的上升沿)都有数据被触发,从而实现 DDR。在此,我们可以说通过差分信号达到了 DDR 的目的,甚至讲 CLK#帮助了第DDR 系列内存详解及硬件设计规范 4二个数据的触发,但这只是对表面现象的简单描述,从严格的定义上讲并不能这么说。之所以能实现 DDR,还要从其内部的改进说起。SDRAM 内存芯片的内部结构图 DDR 内存芯片的内部结构图,注意比较上文中 SDRAM 的结构图 这也是一颗 128Mbit 的内存芯片,标称规格也与前文的 SDRAM 一样为 324bit。从图中可以看出来,白色区域内与 SDRAM 的结构基本相同,但请注意灰色区域,这是与 SDRAM 的不同之处
6、。首先就是内部的L-Bank 规格。SDRAM 中 L-Bank 存储单元的容量与芯片位宽相同,但在 DDR SDRAM 中并不是这样,存储单DDR 系列内存详解及硬件设计规范 5元的容量是芯片位宽的一倍,所以在此不能再套用讲解 SDRAM 时“芯片位宽=存储单元容量”的公式了。也因此,真正的行、列地址数量也与同规格 SDRAM 不一样了。以本芯片为例,在读取时,L-Bank 在内部时钟信号的触发下一次传送 8bit 的数据给读取锁存器,再分成两路 4bit 数据传给复用器,由后者将它们合并为一路 4bit 数据流,然后由发送器在 DQS 的控制下在外部时钟上升与下降沿分两次传输 4bit 的
7、数据到输出。这样,如果时钟频率为 100MHz,那么在 I/O 端口处,由于是上下沿触发,那么就是传输频率就是 200MHz。这就是 DDR SDRAM 的工作原理,这种内部存储单元容量(也可以称为芯片内部总线位宽)=2芯片位宽(也可称为芯片 I/O 总线位宽)的设计,就是所谓的两位预取(2-bit Prefetch),有的公司则贴切的称之为 2-n Prefetch(n 代表芯片位宽)。3.DDR SDRAM与SDRAM的不同 DDR SDRAM 与 SDRAM 的不同主要体现在以下几个方面。DDR SDRAM 与 SDRAM 的主要不同对比表 DDR 系列内存详解及硬件设计规范 6 DDR
8、 SDRAM 与 SDRAM 一样,在开机时也要进行 MRS,不过由于操作功能的增多,DDR SDRAM 在 MRS 之前还多了一 EMRS 阶段(Extended Mode Register Set,扩展模式寄存器设置),这个扩展模式寄存器控制着 DLL 的有效/禁止、输出驱动强度、QFC 有效/无效等。3.1 差分时钟 差分时钟(参见上文“DDR SDRAM 读操作时序图”)是 DDR 的一个必要设计,但 CK#的作用,并不能理解为第二个触发时钟,而是起到触发时钟校准的作用。由于数据是在 CK 的上下沿触发,造成传输周期缩短了一半,因此必须要保证传输周期的稳定以确保数据的正确传输,这就要求
9、 CK 的上下沿间距要有精确的控制。但因为温度、电阻性能的改变等原因,CK 上下沿间距可能发生变化,此时与其反相的 CK#就起到纠正的作用(CK 上升快下降慢,CK#则是上升慢下降快)。而由于上下沿触发的原因,也使 CL=1.5 和2.5 成为可能,并容易实现。DDR 系列内存详解及硬件设计规范 7 与 CK 反相的 CK#保证了触发时机的准确性 3.2 数据选取脉冲(DQS)DQS 是 DDR SDRAM 中的重要功能,它的功能主要用来在一个时钟周期内准确的区分出每个传输周期,并便于接收方准确接收数据。每一颗芯片都有一个 DQS 信号线,它是双向的,在写入时它用来传送由北桥发来的 DQS 信
10、号,读取时,则由芯片生成 DQS 向北桥发送。完全可以说,它就是数据的同步信号。我们分别从数据的读和写两个方面来分析 DQS 的不同作用。读数据过程读数据过程读数据过程读数据过程 DDR 系列内存详解及硬件设计规范 8在读取时,DQS 与数据信号同时出现(也是在 CK 与 CK#的交叉点);即在读取时,DQS 的上/下沿作为数据周期的分割点。但是数据有效却是在 DQS 的高/低电平期中部,也就是 CK 的中间。DDR 内存中的 CL 也就是从 CAS 发出到 DQS 生成的间隔,数据真正出现在数据 I/O 总线上相对于 DQS触发的时间间隔被称为 tAC。注意,这与 SDRAM 中的 tAC
11、的不同。实际上,DQS 生成时,芯片内部的预取已经完毕了,tAC 是指上文结构图中灰色部分的数据输出时间,由于预取的原因,实际的数据传出可能会提前于 DQS 发生(数据提前于 DQS 传出)。由于是并行传输,DDR 内存对 tAC 也有一定的要求,对于 DDR-266,tAC 的允许范围是0.75ns,对于 DDR-333,则是0.7ns,有关它们的时序图示见前文,其中 CL 里包含了一段 DQS 的导入期。写数据过程写数据过程写数据过程写数据过程 在写入时,以 DQS 的高/低电平期中部为数据周期分割点,而不是上/下沿。但数据的接收触发有效却为 DQS 的上/下沿。这和上面的读 DDR 的过
12、程正好相反。为什么会有这种差异?在写的过程,如果以 DQS 的上下沿区分数据周期的危险很大。由于芯片有预取的操作,所以输出时的同步很难控制,只能限制在一定的时间范围内,数据在各 I/O 端口的出现时间可能有快有慢,会与 DQS 有一定的间隔,这也就是为什么要有一个 tAC 规定的原因。而在接收方,一切必须保证同步接收,不能有 tAC 之类的偏差。这样在写入时,芯片不再自己生成 DQS,而以发送方传来的 DQS 为基准,并相应延后一定的时间,在 DQS 的中部为数据周期的选取分割点(在读取时分割点就是上下沿),从这里分隔开两个传输周期。这样做的好处是,由于各数据信号都会有一个逻辑电平保持周期,即
13、使发送时不同步,在 DQS 上下沿时都处于保持周期中,此时数据接收触发的准确性无疑是最高的。DDR 系列内存详解及硬件设计规范 93.3 写入延迟 在上面的 DQS 写入时序图中,可以发现写入延迟已经不是 0 了,在发出写入命令后,DQS 与写入数据要等一段时间才会送达。这个周期被称为 DQS 相对于写入命令的延迟时间(tDQSS,WRITE Command to the first corresponding rising edge of DQS),对于这个时间大家应该很好理解了。为什么要有这样的延迟设计呢?原因也在于同步,毕竟一个时钟周期两次传送,需要很高的控制精度,它必须要等接收方做好充
14、分的准备才行。tDQSS 是 DDR 内存写入操作的一个重要参数,太短的话恐怕接受有误,太长则会造成总线空闲。tDQSS 最短不能小于 0.75 个时钟周期,最长不能超过 1.25 个时钟周期。有人可能会说,如果这样,DQS 不就与芯片内的时钟不同步了吗?对,正常情况下,tDQSS 是一个时钟周期,但写入时接受方的时钟只用来控制命令信号的同步,而数据的接受则完全依靠 DQS 进行同步,所以DQS 与时钟不同步也无所谓。不过,tDQSS 产生了一个不利影响读后写操作延迟的增加,如果 CL=2.5,还要在 tDQSS 基础上加入半个时钟周期,因为命令都要在 CK 的上升沿发出。当 CL=2.5 时
15、,读后写的延迟将为 tDQSS+0.5 个时钟周期(图中 BL=2)另外,DDR 内存的数据真正写入由于要经过更多步骤的处理,所以写回时间(tWR)也明显延长,一般在 3 个时钟周期左右,而在 DDR-规范中更是将 tWR 列为模式寄存器的一项,可见它的重要性。DDR 系列内存详解及硬件设计规范 103.4 突发长度与写入掩码 在 DDR SDRAM 中,突发长度只有 2、4、8 三种选择,没有了随机存取的操作(突发长度为 1)和全页式突发。这是为什么呢?因为 L-Bank 一次就存取两倍于芯片位宽的数据,所以芯片至少也要进行两次传输才可以,否则内部多出来的数据怎么处理?而全页式突发事实证明在
16、 PC 内存中是很难用得上的,所以被取消也不稀奇。但是,突发长度的定义也与 SDRAM 的不一样了,它不再指所连续寻址的存储单元数量,而是指连续的传输周期数,每次是一个芯片位宽的数据。对于突发写入,如果其中有不想存入的数据,仍可以运用 DM信号进行屏蔽。DM 信号和数据信号同时发出,接收方在 DQS 的上升与下降沿来判断 DM 的状态,如果 DM为高电平,那么之前从 DQS 中部选取的数据就被屏蔽了。有人可能会觉得,DM 是输入信号,意味着芯片不能发出 DM 信号给北桥作为屏蔽读取数据的参考。其实,该读哪个数据也是由北桥芯片决定的,所以芯片也无需参与北桥的工作,哪个数据是有用的就留给北桥自己去
17、选吧。3.5 延迟锁定回路(DLL)DDR SDRAM 对时钟的精确性有着很高的要求,而 DDR SDRAM 有两个时钟,一个是外部的总线时钟,一个是内部的工作时钟,在理论上 DDR SDRAM 这两个时钟应该是同步的,但由于种种原因,如温度、电压波动而产生延迟使两者很难同步,更何况时钟频率本身也有不稳定的情况(SDRAM 也有内部时钟,不过因为它的工作/传输频率较低,所以内外同步问题并不突出)。DDR SDRAM 的 tAC 就是因为内部时钟与外部时钟有偏差而引起的,它很可能造成因数据不同步而产生错误的恶果。实际上,不同步就是一种正/负延迟,如果延迟不可避免,那么若是设定一个延迟值,如一个时
18、钟周期,那么内外时钟的上升与下降沿还是同步的。鉴于外部时钟周期也不会绝对统一,所以需要根据外部时钟动态修正内部时钟的延迟来实现与外部时钟的同步,这就是 DLL 的任务。DLL 不同于主板上的 PLL,它不涉及频率与电压转换,而是生成一个延迟量给内部时钟。目前 DLL 有两种实现方法,一个是时钟频率测量法(CFM,Clock Frequency Measurement),一个是时钟比较法(CC,Clock Comparator)。CFM 是测量外部时钟的频率周期,然后以此周期为延迟值控制内部时钟,这样内外时钟正好就相差了一个时钟周期,从而实现同步。DLL 就这样反复测量反复控制延迟值,使内部时钟
19、与外部时钟保持同步。CC 的方法则是比较内外部时钟的长短,如果内部时钟周期短了,就将所少的延迟加到下一个内部时钟周期里,然后再与外部时钟做比较,若是内部时钟周期长了,就将多出的延迟从下一个内部时钟中刨除,如此往复,最终使内外时钟同步。DDR 系列内存详解及硬件设计规范 11 CFM 式 DLL 工作示意图 CC 式 DLL 工作示意图 CFM 与 CC 各有优缺点,CFM 的校正速度快,仅用两个时钟周期,但容易受到噪音干扰,并且如果测量失误,则内部的延迟就永远错下去了。CC 的优点则是更稳定可靠,如果比较失败,延迟受影响的只是一个数据(而且不会太严重),不会涉及到后面的延迟修正,但它的修正时间
20、要比 CFM 长。DLL 功能在 DDR SDRAM 中可以被禁止,但仅限于调试与评估操作,正常工作状态是自动有效的。DDR 系列内存详解及硬件设计规范 12 4.DDR-DDR-相对于 DDR 的主要改进如下:由于 DDR-相对 DDR-I 的设计变动并不大,因此很多操作就不在此详细介绍了,本文重点阐述 DDR-的一些重要变化。DDR 系列内存详解及硬件设计规范 134.1 DDR-内存结构 DDR-内存的预取设计是 4bit,通过 DDR 的讲述,大家现在应该知道其含义。上文已经说过,SDRAM 有两个时钟,一个是内部时钟,一个是外部时钟。在 SDRAM 与 DDR 时代,这两个时钟频率是
21、相同的,但在 DDR-内存中,内部时钟变成了外部时钟的一半。以 DDR-400 为例,数据传输频率为 400MHz(对于每个数据引脚,则是 400Mbps/pin),外部时钟频率为 200MHz,内部时钟频率为 100MHz。因为内部一次传输的数据就可供外部接口传输 4 次,虽然以 DDR 方式传输,但数据传输频率的基准外部时钟频率仍要是内部时钟的两倍才行。就如 RDRAM PC800 一样,其内部时钟频率也为100MHz,是传输频率的 1/8。DDR-、DDR 与 SDRAM 的操作时钟比较 所以,当预取容量超过接口一次 DDR 的传输量时,内部时钟必须降低(除非数据传输不是 DDR 方式,
22、而是一个时钟周期 4 次)。如果内部时钟也达到 200MHz,那外部时钟也要达到 400MHz,这会使成本有大幅度提高。因此,DDR-虽然实现了 4-bit 预取,但在实际效能上,与 DDR 是一样的。在上面那幅比较图DDR 系列内存详解及硬件设计规范 14中,可以看出厂商们的一种误导,它虽然表示出在相同的核心频率下,DDR-达到了两倍于 DDR 的的带宽,但前提是 DDR-的外部时钟频率也是 DDR 和 SDRAM 的两倍。在 DDR 的时钟频率已经达到 166/200MHz 的今天,再用 100MHz 去比较,显然意义不大。这点也请大家们注意识别,上图更多的是说明 DDR-内外时钟的差异。
23、毕竟内部时钟由外部决定,所以外部时钟才是比较的根本基准。总之,现在大家要明确认识,在外部时钟频率相同的情况下,DDR-与 DDR 的带宽一样。DDR 系列内存详解及硬件设计规范 154.2 DDR-的操作与时序设计 1 1 1 1、片外驱动调校片外驱动调校片外驱动调校片外驱动调校(OCDOCDOCDOCD,OffOffOffOff-Chip DriverChip DriverChip DriverChip Driver)DDR-内存在开机时也会有初始化过程,同时在 EMRS 中加入了新设置选项,由于大同小异,在此就不多说了。在 EMRS 阶段,DDR-加入了可选的 OCD 功能。OCD 的主要
24、用意在于调整 I/O 接口端的电压,来补偿上拉与下拉电阻值。目的是让 DQS 与 DQ 数据信号之间的偏差降低到最小。调校期间,分别测试 DQS高电平/DQ 高电平,与 DQS 低电平/DQ 高电平时的同步情况,如果不满足要求,则通过设定突发长度的地址线来传送上拉/下拉电阻等级(加一档或减一档),直到测试合格才退出 OCD 操作。OCD 的作用在于调整 DQS 与 DQ 之间的同步,以确保信号的完整与可靠性 DDR 系列内存详解及硬件设计规范 16不过,据一些厂商的技术人员介绍,一般情况下有 DQS#(差分 DQS 时)就基本可以保证同步的准确性,而且 OCD 的调整对其他操作也有一定影响,因
25、此在普通台式机上不需要用 OCD 功能,它一般只会出现在高端产品中,如对数据完整性非常敏感的服务器等。2 2 2 2、片内终结片内终结片内终结片内终结(ODTODTODTODT,OnOnOnOn-Die TerminationDie TerminationDie TerminationDie Termination)所谓的终结,就是让信号被电路的终端被吸收掉,而不会在电路上形成反射,造成对后面信号的影响。在 DDR 时代,控制与数据信号的终结在主板上完成,每块 DDR 主板在 DIMM 槽的旁边都会有一个终结电压岛的设计,它主要由一排终结电阻构成。长期以来,这个电压岛一直是 DDR 主板设计上
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- DDR 系列 内存 详解 硬件 设计规范
限制150内