面向存算一体加速器的遗留程序自动转换机制

来源 :雷博 | 被引量 : 0次 | 上传用户:yangzanJane
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,使用电阻式随机存储器(Resistive Random-Access Memory,Re RAM)作为基础的存算一体(Computing-In-Memory,CIM)架构已经成为解决传统冯·诺依曼体系结构中“内存墙”问题的一种高效方式。它能利用基尔霍夫电压/电流定律实现高度并行的模拟计算,能支持部分算术运算与布尔逻辑操作。但是,由于其功能比较单一,它往往需要与通用处理器协同使用。然而,基于传统通用处理器的应用程序(遗留程序)并不能直接运行在这种异构计算架构下。因此,研究程序自动转换机制和工具来实现遗留程序的移植具有重要的科学意义和应用价值。基于ReRAM存算一体架构的编译工具(Re RAM-based CIM architectures’Compilation Tool,RCCT)能自动识别、转换及卸载遗留程序中可被CIM加速器加速的代码,并能同时支持有源码和没有源码的遗留程序及多种应用场景。RCCT的设计主要包括以下几个方面的工作。首先,根据CIM加速器的应用场景,分析并抽象得到它能加速的基本计算范式,如矩阵向量乘法、矩阵矩阵乘法以及位图布尔逻辑运算。第二,根据范式中的关键指令和约束关系,RCCT识别遗留程序对应的LLVM中间表示(Intermediate Representation,IR)中存在的CIM可加速代码段,并根据一个轻量级的计算卸载模型来进一步分析计算卸载的收益,避免无效的计算卸载。第三,设计了自动代码转换机制,可以根据可加速计算类型和CIM加速器提供的接口自动将原IR代码转换为目标IR代码。最后,重新编译转换后的IR代码为新的可执行文件,并在执行时将可加速计算卸载到CIM加速器执行,实现对遗留程序的加速。实验结果表明,RCCT可以有效地将传统遗留程序自动转换成能被CIM执行的二进制可执行文件,对给定测试集的范式的识别准确率和转换准确率均达到100%,并有效提高遗留应用程序的性能和能耗。与通用的X86处理器相比,应用的性能和能源效率分别提高了10倍和27倍。
其他文献
读后续写是近年来提出的一种提升外语学习效率的有效方法。目前读后续写相关研究大多是从教师角度出发,立足大学生群体,对高中生在此任务中的体验和反馈关注较少。鉴于此,本研究试图探究高中生在读后续写任务中所遇到的写作障碍、写作障碍与续写水平之间的关系以及学生产生写作障碍的原因。本研究的研究对象是全国范围内来自不同年级的有过读后续写经历的高中生,研究对2595位学生进行了问卷调查,并对其中10位学生进行了深
学位
语言迁移是指一个人一种语言的知识对其他语言的知识和使用的影响,根据其方向可分为正向迁移与反向迁移。我国反向迁移研究存在理论介绍居多,实证研究较少,语料搜集不够,调查对象不全等问题,需要更多实证研究更具体、科学地考察,以更全面认识二语对一语的影响及迁移现象。翻译过程中二语会无形地对译者的母语语用产生影响,造成反向迁移,直接体现在译者在顺向翻译中使用欧化表达传递被译语信息。由此可见,汉语欧化与反向迁移
学位
20世纪80年代以后,外语学习领域对以焦虑为代表的情感变量对语言学习的影响给予了更高的关注。已有研究涉及外语焦虑的影响、成因、研究工具等各个方面。多数研究表明,外语学习者的焦虑情绪对其学习表现有负面影响。然而,在二语写作研究中,鲜有研究探讨中国英语专业学生的毕业论文写作焦虑。毕业论文作为学生语言专业技能和学术成果的集中展示,部分学生无法高质量完成,这在一定程度上受到论文写作焦虑的影响。因此,有必要
学位
新型非易失性内存(Non-Volatile Memory,NVM)具有高性能、字节访问粒度及掉电不易失的特点。为兼顾性价比,通常将非易失性内存与固态盘(Solid State Drive,SSD)混合使用,基于NVM和SSD混合结构的键值存储已成为重要研究方向。日志结构合并树(Log-Structured Merge Tree,LSM-Tree)被广泛应用于键值存储研究,但其层次结构造成的读写放大
学位
容器是一种操作系统级虚拟化技术,具有资源利用率高,部署快速和移植性灵活等特点。然而,多容器会共享主机操作系统的内核I/O(Input/Output)栈,导致其并发执行文件操作时需竞争I/O栈中的共享资源,严重限制了容器的I/O性能。资源竞争产生的主要原因在于操作系统内核I/O栈对容器无感知。一方面,虚拟文件系统(Virtural File System,VFS)无法利用容器的层级特性,难以与层级文
学位
云块存储(Cloud Block Storage,CBS)系统是当前云存储系统中的一种主流存储架构,云供应商通过搭建云块存储系统为租户提供虚拟块级存储设备(称为云盘)。近些年来,云上工作负载种类以及存储的数据量飞速上升,云盘数量达到数百万块,云块存储系统存储集群利用率不断增加,为云块存储系统的资源管理带来的巨大的挑战。云块存储系统中资源管理的一种主要方式是分配云盘到合适的存储集群。传统的分配策略由
学位
信息时代下海量数据的存储和处理一直是困扰着人们的难题。在此背景下,各种新型存储技术和计算架构被提出并得以不断发展。其中,相变存储器不仅存储性能优异,而且还因其阈值转换及缓变式结晶/非晶化过程而具备模拟生物突触和神经元行为的能力,有望作为神经形态器件以实现类脑计算。然而,目前对相变存储器的神经形态应用研究仍处于初级阶段,存在着器件功能单一且性能不佳等问题。对此,本文提出了一种基于GeGaSb的相变存
学位
测井曲线聚类属于石油勘探领域的地层分布区域性宏观研究,聚类后不同的井形成的集合可以使用相同方法分析,打破对测井“一孔之见”的传统认识,帮助测井解释人员形成全面完整的地层分析。测井曲线聚类的实现可以为相关工作人员提供新的测井曲线分析工具,为测井曲线分析带来更多的选择,具有重要的现实意义。测井曲线聚类通常包括预处理、相似度计算和曲线聚类三步。曲线预处理实现曲线的深度对齐和曲线数据量压缩。曲线相似度计算
学位
近年来,随着信息化、数字化进程的加速发展,中国数据中心产业规模增长迅猛,造成了行业能耗以及碳排放急速增长。此外,“碳达峰·碳中和”的背景下相关部门对数据中心行业的用能管理提出了高能效、低排放的要求。因此,将分布式新能源发电接入数据中心能源系统是必然的趋势。显然,接入分布式新能源发电可以降低数据中心对电网的依赖、降低碳排放量。然而,新能源的高不确定性和强随机性,会对数据中心能源系统的供能安全性、稳定
学位
岩性是地质描述的关键指标,能反映地下油气资源的空间分布,因此测井岩性解释对地质勘察及资源开发有着重要意义。目前传统测井数据驱动的岩性识别方法存在一定的局限性:1)测井数据存在异常值、岩性样本不平衡等问题,影响岩性识别模型的训练质量;2)原始测井表征中样本相互独立,无法表示相邻采样点、测井曲线之间的耦合关系;3)不同井或地区采集的测井数据分布具有差异性,导致跨域岩性识别模型的适用性不佳。针对上述问题
学位