基于深度强化学习的编译器自动优化方法研究

来源 :西北大学 | 被引量 : 0次 | 上传用户:ninghaitao
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,深度强化学习(Deep Reinforce Learning,DRL)作为一种强大的自我学习技术,被广泛应用到编译器优化任务上,以支持代码在复杂的多核异构平台下运行性能的提升。但是,面对具有庞大搜索空间的优化任务,利用DRL进行搜索依旧面临挑战,一方面庞大搜索空间中包含大量冗余以及无价值的搜索路径,另一方面如果要部署DRL框架开展自动调优工作,仍然需要编译专家耗费较长时间来选择目标任务所对应的DRL算法、状态表示函数、奖励函数、转移函数以及模型的超参数。针对上述挑战,本文提出了一套编译器自动优化框架(Deep Reinforce Learning Tunnel,DRLTunnel),该框架封装多种DRL算法和组件,用来帮助经验欠缺的开发人员利用DRL快速高效开展编译器优化任务,同时该框架还增加基于蒙特卡洛树搜索的优化空间智能剪枝方法,以降低搜索空间的复杂度,从而进一步提高DRLTunnel生成的DRL搜索引擎的搜索性能。本文的主要工作和贡献如下:1、本文通过分析两个代表性编译器的代码优化空间组成和空间搜索过程,发现代码优化空间存在大量可被去除的、对代码优化无用的选项,以及在搜索过程中存在选择较优而不是更优节点的情况。针对上述优化空间冗余和搜索低效问题,本文提出了基于蒙特卡洛树搜索的优化空间智能剪枝方法,降低代码优化空间复杂度和优化编译器搜索代码优化空间过程。2、为了利用深度强化学习的高效搜索能力,进一步提高编译器的搜索性能,同时降低深度强化学习部署的开销成本,本文提出了基于马尔可夫决策过程的并行多任务优化策略选择方法,根据不同的编译器优化任务自动生成合适的DRL结构,以此支持DRL优化工作的快速部署,并利用该结构完成编译器优化任务。3、设计了基于上述两种方法的编译器自动优化框架DRLTunnel,提供开放的接口和灵活的接入机制。基于DRLTunnel在神经网络编译器优化任务Auto-TVM与超优化编译器优化任务STOKE上开展深入的效果验证,并在四种不同的处理器硬件平台上分别与已有的七类主流优化框架进行比较。实验结果表明,无论是超优化编译器优化还是神经网络编译器优化,相较持续改进的手工调优方法,DRLTunnel都能够提供更好的优化方案,优化后的代码运行性能平均提升1.41倍。
其他文献
互联网行业在我国蓬勃发展,与各行各业深度融合。如今,我国开启了向第二个百年奋斗目标进军的第一个五年,要坚定不移实施网络强国战略和“互联网+”行动计划,大力发展数字经济。而城市互联网行业的发展,促进了城市间技术、人才的交流,城市互联网在空间上的关联越发紧密。在影响城市互联网行业发展的影响因素中,人力资源发挥着核心支撑作用。优秀的人力资源有助于提高经济效益,建立和完善现代企业制度。可以说,人才是互联网
学位
客户细分工作在保持存量客户,发掘潜在用户以及差异化营销方面发挥着重要的作用,不断变化的客群特征要求客户细分需要有较强的时效性,要求管理人员动态调整客群划分,这需要快速和准确的划分策略予以支持。随着数字经济的发展,互联网企业积累了大量的数据资源,应用大数据和机器学习方法开展客户细分及购买倾向预测工作,并取得了显著的效果。但是海量和快速更新的数据,使得静态数据挖掘算法的训练产生了巨大的计算和储存空间开
学位
肺癌作为一种恶性肿瘤,它逐渐侵蚀着人类的身体健康,为人类的生存带来巨大威胁。在我国,其每年导致的发病人数和死亡人数都位列第一,而肺癌中的非小细胞肺癌(Non-small Cell Lung Cancer,NSCLC)的发病率则达到了肺癌总发病数的八成以上。基于非小细胞肺癌驱动基因的靶向药物,由于其疗效可靠、副作用轻微,已成为最受关注的治疗方法之一。在驱动基因中,表皮生长因子受体(Epidermal
学位
多视图数据及高维图像数据的特征提取问题是图像处理中的重要问题。基于子空间投影的图像特征提取方法有着运算代价小、描述能力强等优势,并且广泛应用于多视图图像识别和降维中。因此,论文课题致力于研究现有多视图公共子空间投影方法在子空间学习过程中未能充分利用多视图数据中有效信息的问题,以及现有低维子空间学习方法预先学习重构关系的问题,对现有算法进行了改进,以提高对于多视图图像数据以及高维图像数据的特征提取性
学位
当今时代,发展数字经济已经升级为国家战略。我国发展数字经济具备独特优势,但目前各省数字经济发展不平衡的现象依然存在。本文旨在研究中国区域数字经济格局优化与协同发展,测度最新统计分类标准下我国各省数字经济发展变化情况,从社会网络空间的视角研究分析我国各省数字经济联系网络的空间结构、演变趋势及其影响因素,基于空间关联性对区域数字经济空间进行细致划分,并定量分析了中国省域及各区域内数字经济空间关联性的溢
学位
活动识别作为人机交互的重要媒介,在智能家居、医疗看护等生活领域被广泛研究。由于无线感知领域中基于Wi-Fi信道状态信息(Channel State Information,CSI)的活动识别技术弥补了视频监控技术易侵犯人隐私和穿戴式设备需实时佩戴的缺点,近年来在被动式活动识别领域飞速发展。但基于Wi-Fi CSI的活动识别方案在更换场景和增加新用户后,存在识别精度不佳的问题。这是由于缺乏足够的新环
学位
财政作为政府的重要政策工具,在我国经济建设与发展的过程中发挥着至关重要的作用。2015年,出于经济形势考虑,中国选择实行“有力度的积极财政政策”,以实现宏观经济稳定目标。2020年,积极的财政政策在国家抗击疫情、风险防控的过程中发挥了重要作用。在财政地位提升的同时,我国各类财政风险也在逐渐凸显。为了防范化解各类公共风险,从而降低系统性公共风险、避免全局性公共危机、维持整个经济社会的稳定,适时适度地
学位
读图时代带来了图符信息过载问题,推荐系统能够有效地缓解信息过载,为用户提供个性化的推荐服务。推荐算法是推荐系统的灵魂,协同过滤算法是目前应用最为有效且经典的推荐算法之一,但仍然面临着用户-项目数据稀疏问题、冷启动问题、用户兴趣变化问题。针对协同过滤算法存在的上述问题以及进行图符推荐应用的需要,本文对协同过滤算法及其在图符推荐系统中的应用进行了研究,主要研究内容如下:1.针对用户数据稀疏问题以及未能
学位
数字化技术在文物保护领域占有关键地位。传统的数字化技术主要利用三维激光扫描对文物表面建模,无法得知文物内部的结构、材质以及缺损信息等。计算机断层成像(Computed Tomography,CT)技术凭借其高精度、无损检测物体内部构造等优点,逐渐被文物数字化保护领域采用。重建算法是CT技术的核心,代数重建算法(Algebraic Reconstruction Techniques,ART)作为典型
学位
灰度图像彩色化技术一直是国内外学者研究的重要课题,将彩色化技术应用于兵马俑图像的色彩复原中具有一定的科学价值和历史意义。现有的兵马俑色彩复原方法大多是基于传统算法进行处理,色彩复原准确率较低,且传统算法对于处理低分辨率图像效果很差。针对上述问题本文基于生成对抗网络,对兵马俑全自动着色算法进行了研究。主要研究进展包括:(1)彩色兵马俑数据集建立。目前还没有可用的彩色兵马俑数据集。我们通过各种途径收集
学位