logo资料库

PT静态时序分析个人总结.doc

第1页 / 共20页
第2页 / 共20页
第3页 / 共20页
第4页 / 共20页
第5页 / 共20页
第6页 / 共20页
第7页 / 共20页
第8页 / 共20页
资料共20页,剩余部分请下载后查看
STA资料准备
Library Data:
Interconnect Data:
Timing Constraints:
STA流程及分析方式
前言 在制程进入深次微米世代之后,晶片(IC)设计的高复杂度及系统 单晶片(SOC)设计方式兴起。此一趋势使得如何确保 IC 品质成为今日所有设计 从业人员不得不面临之重大课题。静态时序分析(Static Timing Analysis 简 称 STA)经由完整的分析方式判断 IC 是否能够在使用者的时序环境下正常工作, 对确保 IC 品质之课题,提供一个不错的解决方案。然而,对于许多 IC 设计者而 言,STA 是个既熟悉却又陌生的名词。本文将力求以简单叙述及图例说明的方式, 对 STA 的基础概念及其在 IC 设计流程中的应用做详尽的介绍。 什么是 STA? STA 的简单定义如下:套用特定的时序模型(Timing Model),针对 特定电路分析其是否违反设计者给定的时序限制(Timing Constraint)。以分 析的方式区分,可分为 Path-Based 及 Block-Based 两种。 先来看看 Path-Based 这种分析方式。如图一所示,讯号从 A 点及 B 点输 入,经由 4 个逻辑闸组成的电路到达输出 Y 点。套用的 Timing Model 标示在各 逻辑闸上,对于所有输入端到输出端都可以找到相对应的延迟时洹6 褂谜吒 ǖ腡 iming Constraint 为: 1. 讯号 A 到达电路输入端的时间点为 2(AT=2,AT 为 Arrival Time)。 2. 讯号 B 到达电路输入端的时间点为 5(AT=5)。 3. 讯号必须在时间点 10 之前到达输出端 Y(RT=10,RT 为 Required Time)。 现在我们针对 P1 及 P2 两条路径(Path)来做分析。P1 的起始点为 A, 讯号到达时间点为 2。经过第 1 个逻辑闸之后,由于此闸有 2 单位的延迟时间, 所以讯号到达此闸输出的时间点为 4(2+2)。依此类推,讯号经由 P1 到达输出 Y 的时间点为 7(2+2+3)。在和上述第三项 Timing Constraint 比对之后,我们 可以得知对 P1 这个路径而言,时序(Timing)是满足使用者要求的。 按照同样的方式可以得到讯号经由路径 B 到达输出 Y 的时间点为 11(5+ 1+3+2),照样和上述第三项 Timing Constraint 比对,我们可以得知对 P2 这个 路径而言,Timing 是不满足使用者要求的。
对图一的设计而言,总共有 6 个讯号路径。对于采用 Path-Based 分析方 式的 STA 软体来说,它会对这 6 个讯号路径作逐一的分析,然后记录下结果。I C 设计者藉由检视其分析报告的方式来判断所设计的电路是否符合给定的 Timin g Constraint。由于最常用来做静态时序分析验证核可(STA Signoff)的 EDA 软体 PrimeTime?采用 Path-Based 的分析方式,所以本文将以 Path-Based 的分 析方式介绍为主。 再来看看 Block-Based 的分析方式。此时时序资讯(Timing Informati on)的储存不再是以路径为单位,而是以电路节点(Node)为单位。由 Timing Constraint 我们仅能得知 A 节点的 AT 为 2,B 节点的 AT 为 5 以及 Y 节点的 RT 为 10。Block-Based 的分析方式会找出每个节点的 AT 和 RT,然后比对这两个数 值。当 RT 的值大于 AT 时表示讯号比 Timing Constrain 中要求的时间还早到达, 如此则 Timing 是满足的,反之则不满足。 STA 资料准备 在做 STA 之前,我们必须对其准备工作有充分的了解。STA 所需的资料如图三所 示,以下我们分项说明。其中 Design Data 部分,由于 Block Model 和 STA 软体 相关性太高,我们不在此加以说明,请直接参阅您 STA 软体的使用手册。 图 三 Library Data:
STA 所需要的 Timing Model 就存放在标准元件库(Cell Library)中。这些必 要的时序资讯是以 Timing Arc 的方式呈现在标准元件库中。Timing Arc 定义逻 辑闸任两个端点之间的时序关系,其种类有 1. Combinational Timing Arc、 2. Setup Timing Arc、 3. Hold Timing Arc、 4. Edge Timing Arc、 5. Preset and Clear Timing Arc、 6. Recovery Timing Arc、 7. Removal Timing Arc、 8. Three State Enable & Disable Timing Arc、 9. Width Timing Arc。 其中第 1、4、5、8 项定义时序延迟,其他各项则是定义时序检查。 图 四 Combinational Timing Arc 是最基本的 Timing Arc。Timing Arc 如果不特别宣 告的话,就是属于此类。如图四所示,他定义了从特定输入到特定输出(A 到 Z) 的延迟时间。Combinational Timing Arc 的 Sense 有三种,分别是 inverting (或 negative unate),non-inverting(或 positive unate)以及 non-unat e。当 Timing Arc 相关之特定输出(图四 Z)讯号变化方向和特定输入(图四 A) 讯号变化方向相反(如输入由 0 变 1,输出由 1 变 0),则此 Timing Arc 为 inv erting sense。反之,输出输入讯号变化方向一致的话,则此 Timing Arc 为 no n-inverting sense。当特定输出无法由特定输入单独决定时,此 Timing Arc 为 non-unate。 图 五
图 六 图 七 图 八 图 九 图 十 图 十一
图 十二 其他的 Timing Arc 说明如下。         Setup Timing Arc:定义序向元件(Sequential Cell,如 F lip-Flop、Latch 等)所需的 Setup Time,依据 Clock 上升或下降分为 2 类(图五)。 Hold Timing Arc:定义序向元件所需的 Hold Time,依据 C lock 上升或下降分为 2 类(图六)。 Edge Timing Arc:定义序向元件 Clock Active Edge 到资料 输出的延迟时间,依据 Clock 上升或下降分为 2 类(图七)。 Preset and Clear Timing Arc:定义序向元件清除讯号(P reset 或 Clear)发生后,资料被清除的速度,依据清除讯号上升或下降 及是 Preset 或 Clear 分为 4 类(图八)。这个 Timing Arc 通常会被取消 掉,因为它会造成讯号路径产生回路,这对 STA 而言是不允许的。 Recovery Timing Arc:定义序向元件 Clock Active Edge 之前,清除讯号不准启动的时间,依据 Clock 上升或下降分为 2 类(图九)。 Removal Timing Arc:定义序向元件 Clock Active Edge 之 后,清除讯号不准启动的时间,依据 Clock 上升或下降分为 2 类(图十)。 Three State Enable & Disable Timing Arc:定义 Tri-Sta te 元件致能讯号(Enable)到输出的延迟时间,依据 Enable 或 Disable 分为 2 类。(图十一) Width Timing Arc:定义讯号需维持稳定的最短时间,依据 讯号维持在 0 或 1 的位准分为 2 类。(图十二) 上文列出了标准元件库内时序模型的项目,但对其量化的数据却没有加以说明。 接下来,我们就来看看到底这些时序资讯的确实数值是如何定义在标准元件库中 的。 以 Combinational Timing Arc 为例,讯号从输入到输出的延 迟时间可以描述成以输入的转换时间(Transition Time)和输出的负载为变数 的函数。描述的方式可以是线性的方式,如图十三所示。也可以将这 2 个变数当 成指标,建立时序表格(Timing Table),让 STA 软体可以查询出正确的延迟时 间。这种以表格描述的方式会比上述线性描述的方式准确许多,因此现今市面上 大部分的标准元件库皆采用产生时序表格的方式来建立 Timing Model。
图 十三 我们举个简单的例子来说明 STA 软体如何从时序表格计算出元件延迟时间。(图 十四) 图十四   元件延迟时间(Ddelay):输入达逻辑 1 位准 50% 到输出达逻辑 1 位准 50%的时间。 位准 20%(80%)到 80%(20%)的时间。 元件转换时间(Dtransition):输出达逻辑 1 当输入的转换时间为 0.5,输出负载为 0.2 时,可由图十四的时序 表格查得元件 I2 的延迟时间为 0.432。而由于表格的大小有限,对于无法直接 由表格查询到的延迟时间(如输入转换时间 0.25,输出负载 0.15),STA 软体 会利用线性内插或外插的方式计算延迟时间。 对于其他的 Timing Arc,不管是时序延迟或时序检查,其相对 应的时序数值计算和上例的计算方式是一样的。 接下来我们说明操作环境(Operating Condition)对时序的影 响。操作环境指的是制程(Process)、电压(Voltage)、温度(Temperature)
三项因子。这三项因子通常会被简称为 PVT,其对时序的影响可用下方线性方程 式来描述。其中 nom_process、nom_voltage 及 nom_temperature 会定义在标准 元件库中,代表建立时序表格时的操作环境。 Interconnect Data: 在「什么是 STA」段落的例子中,为了方便说明,我们并没有把逻辑闸 和逻辑闸间的连线延迟(Interconnect Delay)考虑在内。事实上,许多 DSM I C 设计之时序表现是由连线延迟主导的,其重要性不容我们忽视。 连线延迟依照布局与绕线(P&R)前后有不同的考量。在布局与绕线前, 元件在晶片中摆放的位置尚未确定,所以连线延迟是一个预估值。而在布局与绕 线之后,连线延迟则是根据实际绕线计算出来的。对布局与绕线之前的连线延迟, 通常是用 Wireload Model 来预估。Wireload Model 根据晶片面积的预估大小及 连线驱动元件数目(Fan-out)的多寡来决定连线的电阻和电容值,STA 软体则 利用这些电阻电容值计算出连线延迟。在布局与绕线之后,可以利用电阻电容萃 取(RC Extraction)软体将绕线图形转换成实际的电阻电容电路,然后贴回(B ack-annotate)STA 软体计算连线延迟。 Timing Constraints: Timing Constraint 为使用者所给定,用来检验设计电路时序的准则。 其中最重要的一项就是时脉(Clock)的描述。对于一个同步电路而言,暂存器 和暂存器之间的路径延迟时间必须小于一个 Clock 周期(Period),也就是说, 当我们确认了 Clock 规格,所有暂存器间的路径的 Timing Constraint 就会自动 给定了。 图十五 Clock 规格包含波形、Latency 及 Uncertainty 的定义。波形定义一个 Clock 的 周期及讯号上升缘及下降缘的时间点。 Latency 定义从 Clock 来源到序向元件 C lock 输入端的延迟时间。Uncertainty 则定义 Clock 讯号到序向元件 Clock 输入 端可能早到或晚到的时间。
如果上面的文字让你有不知所云的感觉,那底下看图说故事的解说也许会让你有 比较清晰的概念。在图十五的电路中,左边的正反器(Flip-Flop)在第一个 Cl ock 上升缘时会丢出资料,此资料会在第二个 Clock 上升缘让右边的 Flip-Flop 撷取。要分析右边的 Flip-Flop 能否正确撷取资料就必须知道第一个 Clock 上升 缘到达节点 C1 的时间点和第二个上升缘到达节点 C2 的时间点。假设在时间点为 0 的时候,Clock 讯号由 S 点出发,经过一段时间(source latency,1 个时间 单位,模拟晶片外的 Clock 延迟时间,例如板子上的绕线产生的讯号延迟时间) 到达电路的 Clock 输入端点 P,接下来再经过一段时间(晶片内 Clock 绕线造成 的讯号延迟时间),Clock 讯号分别到达 C1 和 C2 节点。如果电路已经进行布局 与绕线,输入端点 P 到 C1 和 C2 的讯号延迟时间可由连线上的寄生电阻电容计算 得来。比方说,经过计算发现讯号由 P 传递到 C1 需要 1 个时间单位,由 P 传递 到 C2 需 2 个时间单位,则 Clock 讯号第一个上升缘到达 C1 和第二个上升缘到达 C2 的时间点就会如图十六下方两列所示,分别为时间点 2 和 13(因为加上了 1 个时间单位的 source latency)。 图十六 在布局与绕线之前,我们无法准确得知 P 到 C1 和 C2 的讯号延迟时间,仅能先做 个预估。图十五的 network latency 及上文提到的 Uncertainty 就是用来做此种 预估的。先假设我们拥有某种完美的布局与绕线软体可以让 Clock 输入端点 P 到所有 Flip-Flop 的 Clock 输入端的讯号延迟时间一模一样,那么我们只要知 道这个讯号延迟时间就可以得到 Clock 讯号到达 C1 和 C2 的时间点了。这个讯号 延迟时间可以藉由电路特性(如预估面积大小,Flip-Flop 数目等)来做预估, 而这个预估值就是所谓的 network latency。如果这种完美的软体存在的话,那 Clock 的上升缘到达 C1 和 C2 的时间点就可以由 Latency(source latency + n etwork latency)计算出来。 很不幸的,世界上没有这么完美的软体,在布局与绕线后 Clock 输入端点 P 到所 有 Flip-Flop 的 Clock 输入端的讯号延迟时间不会完全一样。也就是说 Clock 的某个上升缘不会同时到达 C1 和 C2。因此我们要对上述的预估值做些修正,加 入 Uncertainty 的描述来定义 Clock 上升缘左右移动的可能范围。在图十六中,
分享到:
收藏