基于BOOM超标量处理器可配置参数的性能优化研究

来源 :西安电子科技大学 | 被引量 : 0次 | 上传用户:storm_shen
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着集成电路工艺技术的高速发展以及日益复杂的微处理器设计需求,研究人员必须最大限度地缩短微处理器的设计周期。由于指数级增大的设计空间、越来越高的设计复杂度以及长时间运行的工作负载,在较短的设计时间内进行处理器的设计空间探索(DSE)工作变得越来越困难。处理器研究人员通常采用典型的搜索优化技术来加速设计空间探索,如模拟退火算法、遗传算法等。即使这些技术可以一定程度上加快设计空间探索的速度,仍然需要消耗大量时间进行DSE。其主要原因是典型的搜索优化技术无法理解处理器内不同参数之间如何影响处理器的性能,仅将处理器系统作为一个“黑盒子”。因此如何加快处理器体系结构设计空间探索工作变得尤为重要。本文提出了基于关键性分析模型驱动模拟退火算法进行处理器设计空间探索的方法(CDSA-DSE)。首先将关键性驱动的扰动信息作为模拟退火算法的随机扰动,为模拟退火算法提供当前设计点临近区域的局部信息。然后提出了超标量设计空间的修剪策略以缩小待探索设计空间的范围。最后具体介绍了关键性分析模型,并在其中加入了超标量处理器核心部件发射队列的模型。关键性分析模型与模拟退火算法相结合可以有效地加速DSE。此外,本文还将该方法应用于超标量处理器BOOM,然后对BOOM进行基于时序的结构优化以提升其主频性能,分别优化了BOOM的译码、寄存器重命名阶段以及定点执行单元乘法模块,优化了加载/存储单元内缓存页表失效处理机制、访存序列失败检测机制,以及取消了原子指令堵前堵后的特性。对于基准测试程序SPEC CPU 2006,CDSA-DSE获得最佳性能配置参数的速度要比仅使用模拟退火算法平均快2.1倍。通过改变DSE起点和设计空间大小的敏感性研究也表明CDSA-DSE优于仅采用模拟退火算法的DSE。本文基于SMIC 40nm工艺对BOOM结构优化前后进行逻辑综合,仿真结果表明BOOM面向应用程序的性能降低4.46%的情况下,最坏条件工艺角下其主频提升14.2%。以上结果表明,本设计满足BOOM处理器性能优化的设计指标要求。
其他文献
学校具有人群高度集中、接触往来密切的典型特征,各种传染病极易流行。一旦传染病疫情爆发,不仅直接危害学生的身心健康,而且还影响到学校正常的教学秩序,做好传染病的预防是
蓝莓为小浆果,在东北地区的生长时间在每年的3、4月份,在7、8月份大量产果,采收后在室温下一周左右即快速腐烂。为了解决蓝莓集中时间采收与市场的长期需求之间的问题,采后的蓝莓经常被放置于冷库中保存以延缓腐烂。但冷藏后的蓝莓果实转入常温货架期,果蒂部位极易出现凹陷现象,并且随着贮藏时间的延长果蒂凹陷症状加重,影响蓝莓果实的品质。这个问题已经成为蓝莓产业发展的瓶颈问题。因此,研究冷藏蓝莓果蒂凹陷机制,探
随着我国金融资本参与市场程度的提高,以及参与方式的多样化和灵活化,由此引发的市场收购行为日趋增多,并出现了多种新的收购类型,例如本文涉及到的敌意收购,在我国资本市场上,继1993年第一起敌意收购案——“宝延风波”后,因2006年我国实行股权分置改革政策,许多上市公司的控股股东减持公司股票,导致很多上市公司的股权结构从当初的“一股独大”逐步走向分散。而2015年我国资本市场发生股价暴跌的情况,使得众
双端面磨床作为一种高精、高效的加工母机,具有装夹变形小、加工误差少,磨削热应力均匀分布等特点,可实现对活塞环、轴承、阀片等零件的双面磨削加工,在汽车、轴承等行业具有广泛的用途。国内双端面磨床发展很快,但高档数控双端面磨床装备依然匮乏,迫切需要开发高精度数控立式双端面磨床。因此本文从理论研究、机床结构、润滑系统等方面,对双端面磨床的设计进行了深入系统的研究。本文的主要研究内容有:(1)介绍双端面磨削