静态时序分析经典071952.pdf
《静态时序分析经典071952.pdf》由会员分享,可在线阅读,更多相关《静态时序分析经典071952.pdf(37页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、非淡泊无以明志,非宁静无以致远。诸葛亮先天下之忧而忧,后天下之乐而乐。范仲淹 静态时序分析(Static Timing Analysis)基础及应用 陈麒旭 前言 在制程进入深次微米世代之后,芯片(IC)设计的高复杂度及系统单芯片(SOC)设计方式兴起。此一趋势使得如何确保IC 质量成为今日所有设计从业人员不得不面临之重大课题。静态时序分析(Static Timing Analysis 简称 STA)经由完整的分析方式判断 IC 是否能够在使用者的时序环境下正常工作,对确保 IC 质量之课题,提供一个不错的解决方案。然而,对于许多 IC 设计者而言,STA 是个既熟悉却又陌生的名词。本文将力求
2、以简单叙述及图例说明的方式,对STA 的基础概念及其在 IC 设计流程中的应用做详尽的介绍。什么是 STA?STA 的简单定义如下:套用特定的时序模型(Timing Model),针对特定电路分析其是否违反设计者给定的时序限制(Timing Constraint)。以分析的方式区分,可分为 Path-Based 及 Block-Based 两种。先来看看 Path-Based 这种分析方式。如图一所示,信号从A 点及 B 点输入,经由4 个逻辑闸组成的电路到达输出 Y 点。套用的 Timing Model 标示在各逻辑闸上,对于所有输入端到输出端都可以找到相对应的延迟时间。而使用者给定的 Ti
3、ming Constraint 为:1.信号 A 到达电路输入端的时间点为 2(AT=2,AT 为 Arrival Time)。2.信号 B 到达电路输入端的时间点为 5(AT=5)。3.信号必须在时间点 10 之前到达输出端 Y(RT=10,RT 为 Required Time)。万两黄金容易得,知心一个也难求。曹雪芹非淡泊无以明志,非宁静无以致远。诸葛亮现在我们针对 P1 及 P2 两条路径(Path)来做分析。P1 的起始点为 A,信号到达时间点为 2。经过第 1 个逻辑闸之后,由于此闸有 2 单位的延迟时间,所以信号到达此闸输出的时间点为 4(2+2)。依此类推,信号经由 P1 到达输
4、出 Y 的时间点为 7(2+2+3)。在和上述第三项 Timing Constraint 比对之后,我们可以得知对 P1 这个路径而言,时序(Timing)是满足使用者要求的。按照同样的方式可以得到信号经由路径 B 到达输出 Y 的时间点为 11(5+1+3+2),照样和上述第三项 Timing Constraint 比对,我们可以得知对 P2 这个路径而言,Timing是不满足使用者要求的。对图一的设计而言,总共有 6 个信号路径。对于采用 Path-Based 分析方式的 STA软件来说,它会对这 6 个信号路径作逐一的分析,然后记录下结果。IC 设计者藉由检视其分析报告的方式来判断所设计
5、的电路是否符合给定的 Timing Constraint。由于最常用来做静态时序分析验证核可(STA Signoff)的 EDA 软件 PrimeTime 采用Path-Based 的分析方式,所以本文将以 Path-Based 的分析方式介绍为主。再来看看Block-Based 的分析方式。此时时序信息(Timing Information)的储存不再是以路径为单位,而是以电路节点(Node)为单位。由 Timing Constraint 我们仅能得知 A 节点的 AT 为 2,B 节点的 AT 为 5 以及 Y 节点的 RT 为 10。Block-Based 的分析方式会找出每个节点的 A
6、T 和 RT,然后比对这两个数值。当 RT 的值大于 AT 时表示信号比 Timing Constrain 中要求的时间还早到达,如此则 Timing 是满足的,反之则不满足。STA 资料准备 在做 STA 之前,我们必须对其准备工作有充分的了解。STA 所需的资料如图三所示,以下我们分项说明。其中 Design Data 部分,由于 Block Model 和 STA 软件相关性太高,我们不在此加以说明,请直接参阅您STA 软件的使用手册。勿以恶小而为之,勿以善小而不为。刘备谋事在人,成事在天!增广贤文 图三 Library Data:STA 所需要的 Timing Model 就存放在标准
7、组件库(Cell Library)中。这些必要的时序信息是以 Timing Arc 的方式呈现在标准组件库中。Timing Arc 定义逻辑闸任两个端点之间的时序关系,其种类有 Combinational Timing Arc、Setup Timing Arc、Hold Timing Arc、Edge Timing Arc、Preset and Clear Timing Arc、Recovery Timing Arc、Removal Timing Arc、Three State Enable&Disable Timing Arc、Width Timing Arc。其中第 1、4、5、8 项定义
8、时序延迟,其它各项则是定义时序检查。图四 Combinational Timing Arc 是最基本的 Timing Arc。Timing Arc 如果不特别宣告的话,就是属于此类。如图四所示,他定义了从特定输入到特定输出(A 到 Z)的延迟时间。Combinational Timing Arc 的 Sense 有三种,分别是 inverting(或 negative unate),non-inverting(或 positive unate)以及 non-unate。当 Timing Arc 相关之特定输出(图四 Z)信号变化方向和特定输入(图四 A)信号变化方向相反(如输入由 0 变 1,
9、输出由 1 变 0),则此 Timing Arc 为 inverting sense。反之,输出输入信常将有日思无日,莫待无时思有时。增广贤文万两黄金容易得,知心一个也难求。曹雪芹号变化方向一致的话,则此 Timing Arc 为 non-inverting sense。当特定输出无法由特定输入单独决定时,此 Timing Arc 为 non-unate。万两黄金容易得,知心一个也难求。曹雪芹勿以恶小而为之,勿以善小而不为。刘备 图五 图六 图七 图八 图九 图十 图十一 图十二 天行健,君子以自强不息。地势坤,君子以厚德载物。易经其身正,不令而行;其身不正,虽令不从。论语其它的 Timing
10、 Arc 说明如下。Setup Timing Arc:定义序向组件(Sequential Cell,如 Flip-Flop、Latch 等)所需的 Setup Time,依据 Clock 上升或下降分为 2 类(图五)。Hold Timing Arc:定义序向组件所需的 Hold Time,依据 Clock 上升或下降分为 2 类(图六)。Edge Timing Arc:定义序向组件 Clock Active Edge 到数据输出的延迟时间,依据 Clock 上升或下降分为 2 类(图七)。Preset and Clear Timing Arc:定义序向组件清除信号(Preset 或 Clea
11、r)发生后,数据被清除的速度,依据清除信号上升或下降及是 Preset 或 Clear 分为 4 类(图八)。这个 Timing Arc 通常会被取消掉,因为它会造成信号路径产生回路,这对 STA 而言是不允许的。Recovery Timing Arc:定义序向组件 Clock Active Edge 之前,清除信号不准启动的时间,依据 Clock 上升或下降分为 2 类(图九)。Removal Timing Arc:定义序向组件 Clock Active Edge 之后,清除信号不准启动的时间,依据 Clock 上升或下降分为 2 类(图十)。Three State Enable&Disab
12、le Timing Arc:定义 Tri-State 组件致能信号(Enable)到输出的延迟时间,依据 Enable 或 Disable 分为 2 类。(图十一)Width Timing Arc:定义信号需维持稳定的最短时间,依据信号维持在 0 或1 的位准分为 2 类。(图十二)上文列出了标准组件库内时序模型的项目,但对其量化的数据却没有加以说明。接下来,我们就来看看到底这些时序信息的确实数值是如何定义在标准组件库中的。以 Combinational Timing Arc 为例,信号从输入到输出的延迟时间可以描述成以输入的转换时间(Transition Time)和输出的负载为变量的函数。
13、描述的方式可以是线性的方式,如图十三所示。也可以将这 2 个变量当成指针,建立时序表格(Timing Table),让 STA 软件可以查询出正确的延迟时间。这种以表格描述的方式会比上述线性描述的方式准确许多,因此现今市面上大部分的标准组件库皆采用产生时序表格的方式来建立 Timing Model。古之立大事者,不惟有超世之才,亦必有坚忍不拔之志。苏轼丈夫志四方,有事先悬弧,焉能钧三江,终年守菰蒲。顾炎武 图十三 我们举个简单的例子来说明 STA 软件如何从时序表格计算出组件延迟时间。(图十四)图十四 组件延迟时间(Ddelay):输入达逻辑 1 位准 50%到输出达逻辑 1 位准 50%的时
14、间。组件转换时间(Dtransition):输出达逻辑 1 位准 20%(80%)到 80%(20%)的时间。当输入的转换时间为 0.5,输出负载为 0.2 时,可由图十四的时序表格查得组件 I2 的延迟时间为 0.432。而由于表格的大小有限,对于无法直接由表格查询到的延迟时间(如输入转换时间 0.25,输出负载 0.15),STA 软件会利用线性内插或外插的方式计算延迟时间。对于其它的 Timing Arc,不管是时序延迟或时序检查,其相对应的时序数值计算和上例的计算方式是一样的。志不强者智不达,言不信者行不果。墨翟云路鹏程九万里,雪窗萤火二十年。王实甫接下来我们说明操作环境(Operat
15、ing Condition)对时序的影响。操作环境指的是制程(Process)、电压(Voltage)、温度(Temperature)三项因子。这三项因子通常会被简称为 PVT,其对时序的影响可用下方线性方程式来描述。其中 nom_process、nom_voltage 及 nom_temperature 会定义在标准组件库中,代表建立时序表格时的操作环境。Interconnect Data:在什么是 STA段落的例子中,为了方便说明,我们并没有把逻辑闸和逻辑闸间的联机延迟(Interconnect Delay)考虑在内。事实上,许多 DSM IC 设计之时序表现是由联机延迟主导的,其重要性不
16、容我们忽视。联机延迟依照布局与绕线(P&R)前后有不同的考虑。在布局与绕线前,组件在芯片中摆放的位置尚未确定,所以联机延迟是一个预估值。而在布局与绕线之后,联机延迟则是根据实际绕线计算出来的。对布局与绕线之前的联机延迟,通常是用 Wireload Model 来预估。Wireload Model 根据芯片面积的预估大小及联机驱动组件数目(Fan-out)的多寡来决定联机的电阻和电容值,STA 软件则利用这些电阻电容值计算出联机延迟。在布局与绕线之后,可以利用电阻电容萃取(RC Extraction)软件将绕线图形转换成实际的电阻电容电路,然后贴回(Back-annotate)STA 软件计算联
17、机延迟。Timing Constraints:Timing Constraint 为使用者所给定,用来检验设计电路时序的准则。其中最重要的一项就是频率(Clock)的描述。对于一个同步电路而言,缓存器和缓存器之间的路径延迟时间必须小于一个 Clock 周期(Period),也就是说,当我们确认了 Clock 规格,所有缓存器间的路径的 Timing Constraint 就会自动给定了。宠辱不惊,看庭前花开花落;去留无意,望天上云卷云舒。洪应明良辰美景奈何天,便赏心乐事谁家院。则为你如花美眷,似水流年。汤显祖图十五 Clock 规格包含波形、Latency 及 Uncertainty 的定义。
18、波形定义一个 Clock的周期及信号上升缘及下降缘的时间点。Latency 定义从 Clock 来源到序向组件Clock 输入端的延迟时间。Uncertainty 则定义 Clock 信号到序向组件 Clock 输入端可能早到或晚到的时间。如果上面的文字让你有不知所云的感觉,那底下看图说故事的解说也许会让你有比较清晰的概念。在图十五的电路中,左边的正反器(Flip-Flop)在第一个 Clock 上升缘时会丢出数据,此数据会在第二个 Clock 上升缘让右边的Flip-Flop 撷取。要分析右边的Flip-Flop 能否正确撷取数据就必须知道第一个Clock上升缘到达节点C1的时间点和第二个上
19、升缘到达节点 C2的时间点。假设在时间点为0 的时候,Clock信号由S 点出发,经过一段时间(source latency,1 个时间单位,仿真芯片外的 Clock 延迟时间,例如板子上的绕线产生的信号延迟时间)到达电路的 Clock 输入端点 P,接下来再经过一段时间(芯片内 Clock绕线造成的信号延迟时间),Clock 信号分别到达 C1 和 C2 节点。如果电路已经进行布局与绕线,输入端点 P 到 C1 和 C2 的信号延迟时间可由联机上的寄生电阻电容计算得来。比方说,经过计算发现信号由 P 传递到 C1 需要 1 个时间单位,由 P 传递到 C2 需 2 个时间单位,则 Clock
20、 信号第一个上升缘到达 C1 和第二个上升缘到达 C2 的时间点就会如图十六下方两列所示,分别为时间点 2 和 13(因为加上了 1 个时间单位的 source latency)。图十六 在布局与绕线之前,我们无法准确得知 P 到 C1 和 C2 的信号延迟时间,仅能先做个预估。图十五的 network latency 及上文提到的 Uncertainty 就是用来做此种预估的。先假设我们拥有某种完美的布局与绕线软件可以让 Clock 输入端点P 到所有 Flip-Flop 的 Clock 输入端的信号延迟时间一模一样,那么我们只要知道这个信号延迟时间就可以得到 Clock 信号到达 C1 和
21、 C2 的时间点了。这个信号延迟时间可以藉由电路特性(如预估面积大小,Flip-Flop 数目等)来做预估,丈夫志四方,有事先悬弧,焉能钧三江,终年守菰蒲。顾炎武古之立大事者,不惟有超世之才,亦必有坚忍不拔之志。苏轼而这个预估值就是所谓的 network latency。如果这种完美的软件存在的话,那Clock 的上升缘到达 C1 和 C2 的时间点就可以由 Latency(source latency+network latency)计算出来。很不幸的,世界上没有这么完美的软件,在布局与绕线后 Clock 输入端点 P到所有 Flip-Flop 的 Clock 输入端的信号延迟时间不会完全一
22、样。也就是说Clock的某个上升缘不会同时到达C1 和 C2。因此我们要对上述的预估值做些修正,加入 Uncertainty的描述来定义Clock上升缘左右移动的可能范围。在图十六中,Uncertainty为 1 个时间单位,所以 Clock第一个上升缘会在时间点3(因为 Latency为 3)左右 1 时间单位范围内(也就是时间点2 到时间点4)到达 C1,。第二个上升缘则会在时间点12 到 14 的范围内到达C2。除了 Clock 之外,对于电路其它输出输入端点及其周边的环境(Boundary Condition)也要加以描述。在说明 Boundary Condition 之前,我们得对路
23、径(Path)有更进一步的了解。上文曾提及STA 会将电路中所有的 Path 找出来加以分析,但 Path 的定义是什么呢?Path 根据起点及终点可以分为 4 种:1.由 Flip-Flop Clock 输入到 Flip-Flop 数据输入(图十七左上)。2.由主要输入(Primary Input,简称 PI)到 Flip-Flop 数据输入(图十七右上)。3.由 Flip-Flop Clock 输入到主要输出(Primary Output,简称 PO)(图十七左下)。4.由主要输入到主要输出(图十七右下)。当 Clock 规格确定了之后,第 1 种 Path 的时序限制(Timing Co
24、nstraint)就自动的给定了。为了给定其它 3 种 Path 的时序限制,我们必须定义 Boundary Condition。图十七 以家为家,以乡为乡,以国为国,以天下为天下。管子牧民以家为家,以乡为乡,以国为国,以天下为天下。管子牧民一般来说,我们会定义下列的 Boundary Condition:1.Driving Cell:定义输入端点的推动能力(图十八)。2.Input Transition Time:定义输入端点的转换时间(图十八)。3.Output Capacitance Load:定义输出负载(图十八)。4.Input Delay:输入端点相对于某个 Clock 领域的延迟
25、时间。(图十九,Delayclk-Q+a)5.Output Delay:自输出端点往外看相对于某个 Clock 领域的延迟时间。(图十九,c)在这些 Boundary Condition 定义之后,上述 4 种 Path 事实上都可看成是第1 种 Path(Flip-Flop 到 Flip-Flop)。也就是说,加上 Boundary Condition后,只要 Clock 给定,所有 Path 的 Timing Constraint 就会自动给定。图十八 图十九 由于每个 Path 都有 Timing Constraint,所以时序分析都能够进行。但在某些情况下,有些 Path 的分析可能没
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 静态 时序 分析 经典 071952
限制150内