可扩展内存系统的功耗和性能优化研究

来源 :中国科学院大学 | 被引量 : 0次 | 上传用户：qncy1230s

【摘要】

：

多核与虚拟化的发展，数据规模的增长，以及新的计算模式的出现，对内存容量提出了不断增长的需求。然而，DRAM系统的扩展性却受到了封装、工艺和信号完整性问题的限制，尤其以信号完整

【作者】

：

崔泽汉

【机构】

：

中国科学院大学

【出处】

：

中国科学院大学

【发表日期】

：

2015年期

【关键词】

：

可扩展内存系统内存功耗同步访存协议智能刷新管理伪地址空间

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

多核与虚拟化的发展，数据规模的增长，以及新的计算模式的出现，对内存容量提出了不断增长的需求。然而，DRAM系统的扩展性却受到了封装、工艺和信号完整性问题的限制，尤其以信号完整性的影响最为严重，使得内存容量随着接口频率的提升甚至呈现下降趋势。采用缓冲芯片的解决方案虽然可以缓解信号完整性问题，但是其扩展性受到了同步访存协议的限制。另外，内存容量的扩展将会导致功耗和性能问题。一方面，内存功耗已经占了系统功耗的很大部分，随着内存容量的扩展，内存功耗将持续增长，其中很大比例来自于DRAM的刷新功耗。刷新操作同时阻塞正常访存的执行，影响性能。而且，随着DRAM密度的提升，刷新带来的功耗和性能开销将显著增加。另一方面，内存容量的扩展将使地址空间加大，加剧TLB的冲突，造成严重的性能开销。大页面可以显著缓解TLB冲突，未来可能成为趋势，但是却与传统的基于页着色的性能优化技术冲突，无法同时发挥作用提升性能。　　本文针对内存系统的可扩展性，以及内存扩展带来的功耗、性能等问题进行优化，主要工作包括以下几个方面:　　针对同步访存协议对缓冲芯片扩展性的限制，本文提出一种基于两次访存的扩展方案Twin-Load，该方法可以在标准同步DRAM接口上构建异步访存协议，从而打破了同步协议的限制，利用缓冲芯片组成可扩展的拓扑结构，同时避免了定制异步接口的成本、时效性和通用性的问题。Twin-Load方法将一次内存读取拆分为两次，第一次将数据预取至缓冲芯片，第二次从缓冲芯片读出正确数据，每次内存读取都是基于标准的同步协议，但是两者作为整体实现了异步访问。Twin-Load可以通过软件方式实现，利用手工或编译的方式替换程序中的访存指令，从而完全不需要修改现有处理器。本文通过原型平台验证了Twin-Load的有效性，虽然软件Twin-Load方式引入了更多的指令和访存，但是仍可以达到理想内存性能的74％，相比于在PCIe接口上扩展内存的方案，性能有数量级的提升。本文同时给出了硬件实现Twin-Load的方式，以及连接NVM的方法。　　针对DRAM刷新导致的功耗和性能开销，本文提出一种基于内存元数据的智能刷新管理方法DTail，该方法利用所有内存单元并不需要以同样频率刷新的特性，减少不必要的刷新，从而降低其导致的功耗和性能开销。DTail从系统各个层次获取不需要刷新的内存行的信息（称为元数据），并将元数据存储于内存自身，由内存控制器在需要进行刷新时从内存中读取并进行判断，决定是否执行刷新。元数据的大小与内存容量成正比，但是DTail将元数据存储于内存的做法使得其存储开销相比于内存容量可以忽略不计，保证DTail的扩展性。本文同时发现现有的两种刷新方式在减少刷新方面具有互补的特性，从而根据元数据信息，在两者之间动态切换，达到更好的性能和更低的功耗。本文通过实验证明了DTail的有效性，在同时利用保持时间信息和有效性信息的情况下，可以几乎完全消除刷新对性能的影响，并减少绝大部分的刷新功耗。　　针对大页面与页着色技术的冲突，本文提出一种基于位置换的Cache索引方法SWAP，该方法通过引入一层伪地址空间，解耦虚实转换和Cache索引，使大页面和页着色技术可以同时发挥作用。操作系统管理伪地址空间，维护虚地址空间到伪地址空间的映射，并且使用大页面降低TLB的冲突;SWAP将伪地址的某些位进行置换得到物理地址，实现伪地址空间到物理地址空间的转换。利用这层简单的硬件映射，SWAP可以把操作系统对伪地址空间中大页面的着色传递到物理地址空间，从而实现页着色带来的好处，比如划分共享Cache。评测结果显示，SWAP可以叠加大页面和页着色带来的性能提升。

其他文献

自主计算中的建模与协同研究

自主计算所要解决的是日益复杂的计算环境中所面临的管理与成本问题,提高系统的运行效率,使得IT系统能够自我管理.本文从基于主体的自主单元设计,自主计算的软件建模方法、基

学位

人工智能自主计算系统自主单元

层次式交换网络IP包分类的设计与实现——基于网络处理器平台

层次式交换网络是一种适应下一代互联网的基于IP交换的新型网络体系结构，它按照层次构造网络拓扑，地址空间与拓扑结构严格匹配，以交换代替路由，克服了现有Internet的网络结构无序

学位

通信网络

视频对象分割及特征提取的研究

多媒体技术的飞速发展和广泛使用产生了大量的图像和视频等视觉信息,由于信息量增长太快而处理能力不足,这些信息往往不能被有效利用.通过对视觉信息进行有效存储,建立索引和

学位

运动目标分割小波变换独立成分分析分水岭变换边缘检测支持向量回归机

中文文本的主题分析技术研究

文本的主题分析旨在确定一个文本的主题结构，即识别所讨论的主题，界定主题的外延，跟踪主题的转换，觉察主题间的关系等，它是很多信息处理领域，比如文本理解、语言建模、信息的检索与

学位

中文文本

基于短语的统计机器翻译性能改进方法研究与系统实现

本文研究如何提高现有基于短语的统计机器翻译系统的性能,并利用文中提出的思想实现面向特定领域的统计机器翻译系统.文中研究了两种改善基于短语的统计机器翻译系统性能的方

学位

统计机器翻译判别重排序单纯形算法翻译模板专译家系统

基于网格的高性能计算作业提交平台开发技术研究

科学计算是伴随着电子计算机的出现而迅速发展并获得广泛应用的新兴交叉学科，是数学及计算机应用于高科技领域的必不可少的纽带和工具。高性能计算机的研制水平和实际应用水平

学位

计算机网

战术指控系统中可靠数据分发服务应用研究

学位

多元统计方法在fMRI数据分析中的应用

自动人脸识别的研究有着重要的学术价值和广泛的应用前景。本文沿着统计学习与融合的思路对人脸识别中的对齐、特征表达和分类器的训练及构造三个关键问题进行了深入的研究。

学位

磁共振成像数据分析多元统计方法脑功能集成

EJB测试平台测试数据生成和管理子系统的设计与实现

软件测试的开销在整个软件开发过程中占有重大的比例,提高软件测试的效率、降低测试的开销,对降低软件成本具有重要作用。测试数据生成是软件测试之中一个占用大量资源的过程

学位

测试平台EJB测试测试数据模板测试数据生成测试数据管理回归测试

VoIP组网方案研究与设计实现

随着网络技术发展，网络应用趋于语音、数据和视频融合，新一代VoIP技术在专网组网中得到普便推广。基于网络的语音通信比传统电话有费用少、节省带宽和业务灵活的优点。各企事业

学位

VoIP技术服务质量安全管理语音网关

可扩展内存系统的功耗和性能优化研究

与本文相关的学术论文