UniCore-3处理器前端取指部件的设计与验证

来源 :北京大学 | 被引量 : 0次 | 上传用户:kaliya
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着集成电路的发展和电子产品的日新月异,微处理器的性能要求在不断的提升。当前单核微处理器体系结构研究主要通过挖掘指令间的并行度来提高微处理器的性能。流水线、乱序多发射、动态指令调度等先进技术的发展使得处理器指令级并行程度越来越高,取指阶段必须提供足够的指令,才能保证后续流水级的指令并行处理能力得到充分的发挥。取指部件位于流水线的最前端,其取指带宽成为流水线指令执行带宽的上限,因此前端取指部件的设计和实现是一个重要的课题。  本文基于北京大学微处理器研发中心正在研发的UniCore-3超标量处理器,完成了其前端取指部件的设计与实现,并就其对处理器的性能影响进行了性能评测与结构优化。主要工作包括:  1.调研了主流处理器中前端取指部件的组成结构以及关键组成部件ICache和转移预测单元的研究现状。结合UniCore-3处理器的设计目标,将前端取指部件划分为ICache和取指单元两个组成部分,取指单元中包含实现G-share方向预测器和BTB、RAS结构的转移预测单元。  2.完成了前端取指部件的总体结构设计,然后分别对取指单元和ICache进行了详细的功能设计和低功耗设计。根据设计方案完成了RTL代码实现,对代码进行了时序评估和关键路径调整,使代码满足1G Hz的频率要求。  3.完成前端取指部件的功能验证。对取指单元和ICache分别制定了模块级功能覆盖大纲,编写定向测试文件在模块级验证平台完成了模块级验证,修正代码错误25个。从指令访存和分支指令带来的控制相关两个方面制定了汇编验证大纲,构造汇编场景在模拟环境和FPGA原型验证环境中完成了汇编验证,修正代码错误16个。  4.对前端取指部件的取指带宽以及影响取指带宽的三类因素在FPGA原型环境中进行了数据评测。根据评测结果提出并实现了针对转移预测单元的优化方案,将前端取指部件的取指带宽提升了4%。  根据性能评测结果,前端取指部件达到了为流水线提供充足指令的设计目标,未来工作将主要集中于前端取指部件低功耗机制的性能评估。
其他文献
去隔行和缩放是增强视频显示质量的典型后处理方法。传统上,通常采用视频后处理芯片或CPU实现。由于专用视频后处理芯片研发及生产成本较高,而CPU对视频数据的处理效率较低,随着
随着信息技术的不断发展,信息化已经深入到了社会政治、经济、文化、生产、生活的各个领域,计算机网络已经成为人类生活、学习、工作等各方面不可缺少的工具。然而,伴随着网络在
在集成电路工艺以及微处理器性能需求的双重推动下,多核处理器逐渐取代单核处理器成为了市场的主流,微处理器的发展进入多核时代。当今大部分多核处理器采用共享存储的结构,各处
屏幕内容通常是指由电子设备的屏幕产生的视频或图像。随着计算机、平板电脑和智能手机等设备的迅速发展,屏幕内容在远程桌面、屏幕传输和云计算等应用中发挥着越来越重要的作
随着信息技术的发展,信息检索的作用日益凸显。特别是在图像检索领域,如何从海量的图像数据中快速、准确地寻找到我们期望的图像是一个十分重要且越来越热门的研究方向。基于内
近年来,随着塔式起重机在国内应用得越来越广泛,塔式起重机驾驶员的需求量在增加,同时安全事故发生率也在提高。在培训过程中,局限于一对一培训,培训内容有限,实际操作受现场条件限
词是计算语言学研究的重要对象,但从汉语词汇语义资源的建设情况来看,目前的汉语词义描述尚缺乏有效、客观、一致的辅助手段。因此,本文深入挖掘汉语的构词特点,尝试了一条经由汉
带参并发系统广泛存在于各类计算机系统的核心模块中,验证带参系统的正确性是形式验证领域中的一个热点问题。验证带参系统的难点在于:我们可以验证带参的一个很小规模的实例,
随着Internet的飞速发展,人们交流和获取信息的方式都发生了很大的变化,网络成了人们主要信息来源。政府网站作为电子政府的核心,逐渐成为了政府发布相关政策、法律、信息的主流
随着技术的发展,网络视频方兴未艾,而高清视频、3D视频等高质量的视频的提出和应用,对视频的存储、处理和传输提出了更高的要求。云计算服务的兴起,正好可以满足视频应用高存储和