【摘 要】
:
在当前的集成电路产业发展中,得益于半导体制造工艺随着摩尔定律的不断发展,集成电路的制程从28nm向7nm甚至5nm和3nm不断推进。集成度的提高使得复杂集成电路的物理设计的时序收敛难度相应提高。如何在物理设计流程中使静态时序分析的结果更为精确,使结果与实际物理特性更吻合,并兼顾完成物理设计全流程所需的时间及算力资源,成为了芯片设计的关键内容之一。论文基于TSMC的7nm工艺下一款ARM架构Cort
论文部分内容阅读
在当前的集成电路产业发展中,得益于半导体制造工艺随着摩尔定律的不断发展,集成电路的制程从28nm向7nm甚至5nm和3nm不断推进。集成度的提高使得复杂集成电路的物理设计的时序收敛难度相应提高。如何在物理设计流程中使静态时序分析的结果更为精确,使结果与实际物理特性更吻合,并兼顾完成物理设计全流程所需的时间及算力资源,成为了芯片设计的关键内容之一。论文基于TSMC的7nm工艺下一款ARM架构Cortex-A55的CPU芯片部分模块,该设计规模约为93万个标准单元,最高工作频率为2.198Ghz。使用Cadence公司的布局布线工具Innovus完成物理设计和时序分析,随后使用时序签核工具Tempus对时序结果进行了分析。论文的主要工作包括:(1)基于综合和映射后生产的网表,选用TSMC 7nm工艺,完成了该CPU模块的物理设计流程及时序分析优化方案。(2)基于统计学片上偏差的分析方式,采用基于路径的静态时序分析技术PBA,完成该CPU模块的时序分析与仿真验证。仿真结果表明,使用PBA技术的静态时序分析结果在时钟树综合前阶段的最差违例路径时序裕量为-0.963ns,优于GBA方式下的目标值-1.058ns。最差十条时序违例路径总时序裕量为-9.583ns,优于GBA方式下的目标值-10.506ns,满足设计要求。(3)在该模块物理设计的现有流程基础上,通过调整不同阶段的时序分析方式,修复设计规则违例,以及优化时序分析结果,使得关键路径上的时序裕量有所增加。在时钟树综合前阶段的时序分析中使用PBA方式,将WNS从-0.041ns优化为-0.033ns,优化量19.51%。将TNS从-34.8521ns优化为-9.1132ns。优化量73.85%。在时钟树综合后阶段的时序分析中使用PBA方式,将WNS从-0.063ns优化为-0.047ns,优化力度25.40%。将TNS从-97.308ns优化为-85.631ns,优化力度12.00%。在布线后阶段的时序分析中使用PBA方式,将WNS从-0.049ns优化为-0.045ns,优化力度8.16%。将TNS从-56.973ns优化为-53.163ns,优化力度6.69%。对布线后阶段PBA方式下筛选出的真正时序违例路径进行ECO修复,WNS优化后的结果为-0.004ns,满足设计要求。论文针对CPU模块的物理设计中使用PBA方式的时序分析方法,对PBA方式的尚存缺陷提出了优化方向,论文结果对数字IC物理设计的精准时序优化与分析具有一定的工程参考价值。
其他文献
硅元素及其化合物在现代工业中起着不可或缺的作用,现已经被广泛应用到了各个相关领域中。本文采用原子掺杂的方法,寻找新型的硅同素异形体和硅化物结构,并结合第一性原理计算方法研究了新结构在常压下的力学性质、弹性各向异性、电子结构等性质,同时还分析了能带变化的影响因素,为有效合成该材料提供理论基础,也为其他新材料的理论研究提供支撑。本文研究的主要内容如下:1.对G21、G58、G90、G117、G158、
随着科技的快速发展,功能材料已经广泛应用于现代工业的各个领域之中,新型功能材料的结构设计与合成是目前材料科学的研究热点之一。本文采用基于CALYPSO的晶体结构设计技术,首先结合只限定原子数的直接搜索方法,发现了一个具有直接带隙的新型大胞超硬碳晶体结构Fmmm-C80。然后采用功能材料反向搜索方法,在使用CALYPSO搜索晶体结构的过程中,设定带隙为每一代结构中的二次筛选目标参数,最终发现了一个新
传统的密码系统假设攻击者只能访问密码算法的输入和输出,即密码算法处在一种黑盒模型下。但随着计算机与互联网技术的高速发展,攻击者的能力得到了显著提高,传统的黑盒模型已经无法满足密码算法安全性分析的需要。2002年,Chow等人根据数字版权管理(Digital Rights Management,简称DRM)应用场景,提出白盒攻击环境(White-Box Attack Context,简称WBAC)的
低序级断层延伸短,断距小,识别解释有一定的困难,但低序级断层是局部微幅度构造和油气富集的主控因素,能否识别低序级断层和微幅度构造直接影响致密储层水平井部署,轨迹控制和砂岩钻遇率。本文首先基于多窗口倾角扫描的曲率属性,凸显低序级断层的特征;然后采用属性定量优化方法,即结合地震剖面,平剖结合统计不同断距断层的曲率值,以此设定门槛值,消除非断裂地质效应,突出目标低序级断层和微幅度构造的平面剖面特征,提高
深度神经网络的分布式训练包含模型并行,数据并行等不同策略。传统模型并行流水化策略将深度神经网络按层分配到不同计算设备上,通过重叠计算时间与通信时间减小分布式通信的开销,但是该策略将神经网络模型中的分支和捷径与其他神经网络结构看作一个整体,在切分模型时难以保证结果的均匀分布,导致训练迭代时间增加。数据并行通常使用同步法进行计算设备间模型参数的更新,在每个迭代周期的末尾,参数服务器会与各计算设备进行通
图像信息是人们获取信息的重要组成部分,高质量的图像会让人们获得更加准确的信息,而由于图像在获取的过程中受到设备和环境的限制,客观上导致了部分图像信噪比低下。随着人们对图像质量的需求越来越高,真实图像去噪问题在生产和生活中有着重要的作用。针对真实图像去噪,国内外学者提出大量算法,但是这些去噪算法基本上都是基于高斯白噪声的假设,在仿真的高斯图像上能取得理想的去噪效果,但是在实际的相机系统中,由于实际噪
荧光寿命与荧光团所处的微环境密切相关,且不受激发光强度、荧光团浓度和光漂白等因素影响,能够提供与荧光光谱技术、荧光显微技术互补的生物体功能信息。荧光寿命测量系统一般是基于激光扫描共聚焦显微系统(LSCM)搭建的。LSCM的分辨率能够达到亚微米量级,是研究生物组织样品的重要工具,在生命科学、生物医学、工业检测等领域获得了广泛的应用。LSCM中的共焦小孔使得焦平面以外的荧光被屏蔽,只有焦点处的荧光才能
通信信号的自动调制识别(Automatic Modulation Classification,AMC)被广泛应用于战场通信侦察对抗及无线电频谱监测等军事和民用领域。最近深度学习在AMC中显示出较好的应用效果,克服了传统AMC方法中依赖专家经验的“特征工程”的缺陷。然而,现有深度学习AMC的方法大都依赖海量标记数据,且要求决策场景与训练场景有较强的一致性,在现实复杂电磁环境下应用局限。针对该问题,
频域有限差分法(FDFD)在计算具有谐振结构电磁问题上比时域有限差分(FDTD)方法有明显的优势。然而FDFD方法需要求解大型复数稀疏矩阵方程的逆来获得方程的解。就笔者所知,目前文献中没有大型复数稀疏矩阵方程并行求解的高效方案。为解决FDFD串行算法计算规模的限制以及提高计算效率,本文研究了基于MPI的FDFD并行算法,使计算规模和计算效率得到明显提升。本文的主要研究内容如下:(1)本文研究了基于
随着在线文娱市场规模的不断扩大,人们对精神文化和生活品质的追求在不断上升,社会对文化娱乐领域的应用需求也越来越高。面对日益激增的文娱信息,知识图谱以其结构化、网络化的特点,能够更好地表示文娱信息之间的相关性,有助于用户更直观地理解文娱信息之间的联系。目前,面向特定领域的知识图谱应用越来越多,但是市场上与文娱领域相关的知识图谱应用还比较少,也缺少开源的文娱知识图谱。同时,智能问答作为搜索引擎未来发展