指令标签辅助的链式数据预取技术研究

来源 :中国科学院大学 | 被引量 : 0次 | 上传用户:xueliping
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
计算单元与存储单元分离的冯诺依曼架构,使数据必须经过搬运才能被CPU处理。传统的顺序预取和Stride预取技术起到了将处理器随后要用到的数据提前取到片上Cache的作用。但是,对于基于指针操作的应用,由于处理器很难对指针的内容进行准确预测,因此传统预取方法不能满足链表、图等指针追逐特点比较明显的应用程序的数据预取需求。  为了对处理器中指针追逐的访存模式进行优化,本文提出了ILAMP(InstructionLabel Assisted Memory Prefetching)技术,一种基于指令标签提示的预取机制。该机制是在指令集架构中添加新的访存指令(LD_ PCHS),该指令在处理器译码阶段产生加载指针的访存标签(PCHS_FLAG),在Cache缺失的情况下,一直传递到内存控制器。当加载的指针返回到内存控制器时,内存控制器中的预取器逻辑可以根据标签提示,提取该指针、进行虚实地址转换后发出预取请求。当依赖于指针访存的新请求进入内存控制器时,就可以直接命中,从而省去了访问DRAM存储器的延迟开销。  本文主要贡献有三点:  1)提出并实现了可产生标签的访存指令,对访存内容进行区分;  2)设计并实现了集成了虚实地址转换部件的内存控制器,从而支持内存侧虚拟地址预取。  3)专门的预取缓冲器,用于暂存指针预取结果,避免了对Cache的污染;并进行了优化设计。  实验结果表明,本文提出的ILAMP技术与激进的Stride预取方案相比,ILAMP预取技术降低LLC读请求的平均访问延迟在9个测试程序中的平均值为15%,最高到19%;Olden测试集的预取准确性的平均值高于77%,图计算应用程序的预取准确度达到96%以上。对于设计的开销,ILAMP技术消耗存储器带宽在6%到10%之间,硬件的存储开销约为1KB。
其他文献
当前因特网规模的不断增长导致了IP地址逐步耗尽,以及Internet路由系统负荷日益增多.此外,消费者对于移动IP的许多增值服务和QoS的要求不断提高.针对这些问题,IPv6作为一种新
在电子商务迅速崛起的今天,各企业的应用服务器之间迫切需要实现大量的互操作来满足日益增长的电子商务业务需求。而目前存在的大量的OLTP系统由于其模型的固有缺陷,往往被局限
随着移动互联网的发展,WiFi成为一种十分重要的接入方式。有研究表明,高达91.8%用户通过WiFi接入互联网,并且占所有网络流量的比例为53%。超过一半的实际测量结果中WiFi接入时延占
WebGIS,可以简单的定义为Internet上的GIS,是利用互联网技术完善和扩展传统地理信息系统功能的技术。研究和实现J2EE体系结构下的WebGIS系统有着深刻的理论意义和应用价值,代表
该文从视频点播系统的体系结构出发,深入研究了视频点播系统的各个组成部分以及较常采用的解决方案,这些组成部分即包括硬件设备也包括一些新的技术和协议.在此基础上,设计了
近几年,伴随着信息技术的迅猛发展和广泛应用,人类已迈入一个“信息大数据”的时代。各类互联网应用作为信息技术的产物,极大程度地便利了人们生活,也带来了所谓“信息超载”的问
学位
首先,该文针对目前数据仓库系统设计的不足,对传统的数据仓库系统设计思路进行了改进,指出了业务视角对于数据仓库系统的质量保证具有重要意义;其次,以FCM软件质量模型为基础
流媒体服务器的性能受处理器、网络接口、存储系统等诸要素的综合影响.这几个要素之间的关系符合木桶原理,即:整个流媒体服务器的性能由它们三者之间性能最差的一个决定.为了
论文的内容如下:第一章介绍了该论文的研究背景和在论文期间所做的一些工作.第二章对网络管理技术和电信管理网技术从理论上做了一个论述.第三章对Q3接口的技术理论和标准进