可扩展内存系统的功耗和性能优化研究

来源 :中国科学院大学 | 被引量 : 0次 | 上传用户:qncy1230s
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
多核与虚拟化的发展,数据规模的增长,以及新的计算模式的出现,对内存容量提出了不断增长的需求。然而,DRAM系统的扩展性却受到了封装、工艺和信号完整性问题的限制,尤其以信号完整性的影响最为严重,使得内存容量随着接口频率的提升甚至呈现下降趋势。采用缓冲芯片的解决方案虽然可以缓解信号完整性问题,但是其扩展性受到了同步访存协议的限制。另外,内存容量的扩展将会导致功耗和性能问题。一方面,内存功耗已经占了系统功耗的很大部分,随着内存容量的扩展,内存功耗将持续增长,其中很大比例来自于DRAM的刷新功耗。刷新操作同时阻塞正常访存的执行,影响性能。而且,随着DRAM密度的提升,刷新带来的功耗和性能开销将显著增加。另一方面,内存容量的扩展将使地址空间加大,加剧TLB的冲突,造成严重的性能开销。大页面可以显著缓解TLB冲突,未来可能成为趋势,但是却与传统的基于页着色的性能优化技术冲突,无法同时发挥作用提升性能。  本文针对内存系统的可扩展性,以及内存扩展带来的功耗、性能等问题进行优化,主要工作包括以下几个方面:  针对同步访存协议对缓冲芯片扩展性的限制,本文提出一种基于两次访存的扩展方案Twin-Load,该方法可以在标准同步DRAM接口上构建异步访存协议,从而打破了同步协议的限制,利用缓冲芯片组成可扩展的拓扑结构,同时避免了定制异步接口的成本、时效性和通用性的问题。Twin-Load方法将一次内存读取拆分为两次,第一次将数据预取至缓冲芯片,第二次从缓冲芯片读出正确数据,每次内存读取都是基于标准的同步协议,但是两者作为整体实现了异步访问。Twin-Load可以通过软件方式实现,利用手工或编译的方式替换程序中的访存指令,从而完全不需要修改现有处理器。本文通过原型平台验证了Twin-Load的有效性,虽然软件Twin-Load方式引入了更多的指令和访存,但是仍可以达到理想内存性能的74%,相比于在PCIe接口上扩展内存的方案,性能有数量级的提升。本文同时给出了硬件实现Twin-Load的方式,以及连接NVM的方法。  针对DRAM刷新导致的功耗和性能开销,本文提出一种基于内存元数据的智能刷新管理方法DTail,该方法利用所有内存单元并不需要以同样频率刷新的特性,减少不必要的刷新,从而降低其导致的功耗和性能开销。DTail从系统各个层次获取不需要刷新的内存行的信息(称为元数据),并将元数据存储于内存自身,由内存控制器在需要进行刷新时从内存中读取并进行判断,决定是否执行刷新。元数据的大小与内存容量成正比,但是DTail将元数据存储于内存的做法使得其存储开销相比于内存容量可以忽略不计,保证DTail的扩展性。本文同时发现现有的两种刷新方式在减少刷新方面具有互补的特性,从而根据元数据信息,在两者之间动态切换,达到更好的性能和更低的功耗。本文通过实验证明了DTail的有效性,在同时利用保持时间信息和有效性信息的情况下,可以几乎完全消除刷新对性能的影响,并减少绝大部分的刷新功耗。  针对大页面与页着色技术的冲突,本文提出一种基于位置换的Cache索引方法SWAP,该方法通过引入一层伪地址空间,解耦虚实转换和Cache索引,使大页面和页着色技术可以同时发挥作用。操作系统管理伪地址空间,维护虚地址空间到伪地址空间的映射,并且使用大页面降低TLB的冲突;SWAP将伪地址的某些位进行置换得到物理地址,实现伪地址空间到物理地址空间的转换。利用这层简单的硬件映射,SWAP可以把操作系统对伪地址空间中大页面的着色传递到物理地址空间,从而实现页着色带来的好处,比如划分共享Cache。评测结果显示,SWAP可以叠加大页面和页着色带来的性能提升。
其他文献
自主计算所要解决的是日益复杂的计算环境中所面临的管理与成本问题,提高系统的运行效率,使得IT系统能够自我管理.本文从基于主体的自主单元设计,自主计算的软件建模方法、基
层次式交换网络是一种适应下一代互联网的基于IP交换的新型网络体系结构,它按照层次构造网络拓扑,地址空间与拓扑结构严格匹配,以交换代替路由,克服了现有Internet的网络结构无序
学位
多媒体技术的飞速发展和广泛使用产生了大量的图像和视频等视觉信息,由于信息量增长太快而处理能力不足,这些信息往往不能被有效利用.通过对视觉信息进行有效存储,建立索引和
文本的主题分析旨在确定一个文本的主题结构,即识别所讨论的主题,界定主题的外延,跟踪主题的转换,觉察主题间的关系等,它是很多信息处理领域,比如文本理解、语言建模、信息的检索与
学位
本文研究如何提高现有基于短语的统计机器翻译系统的性能,并利用文中提出的思想实现面向特定领域的统计机器翻译系统.文中研究了两种改善基于短语的统计机器翻译系统性能的方
科学计算是伴随着电子计算机的出现而迅速发展并获得广泛应用的新兴交叉学科,是数学及计算机应用于高科技领域的必不可少的纽带和工具。高性能计算机的研制水平和实际应用水平
学位
学位
自动人脸识别的研究有着重要的学术价值和广泛的应用前景。本文沿着统计学习与融合的思路对人脸识别中的对齐、特征表达和分类器的训练及构造三个关键问题进行了深入的研究。
软件测试的开销在整个软件开发过程中占有重大的比例,提高软件测试的效率、降低测试的开销,对降低软件成本具有重要作用。测试数据生成是软件测试之中一个占用大量资源的过程
随着网络技术发展,网络应用趋于语音、数据和视频融合,新一代VoIP技术在专网组网中得到普便推广。基于网络的语音通信比传统电话有费用少、节省带宽和业务灵活的优点。各企事业