面向CUDA程序的线程放置优化策略研究

来源 :哈尔滨工业大学 | 被引量 : 0次 | 上传用户:bigcat8194
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
GPU具备强大的数据并行处理与浮点计算能力,因而被越来越广泛地应用于数值模拟和科学计算等领域。但面对GPU的复杂硬件结构和完全不同于CPU的多线程编程模型,提高GPU上程序开发效率以及程序的性能就显得尤为重要,线程放置策略是其中重要的一环。线程放置策略比较复杂,传统的线程放置策略包括参考指导建议、穷举参数等。本文在程序静态信息和运行时信息基础上,使用机器学习算法建立了CUDA程序线程放置优化模型。本文首先对具有较强代表性的程序核心信息做了总结,并设计了基于nvprof工具采集对应的运行时信息的方法。但采集运行时信息存在耗时过长的弊端,采集过程需要反复运行程序导致时耗成倍增长。为此,本文进而提出了采集静态程序信息替代部分运行时信息的思路。本文通过使用LLVM框架将CUDA程序转化为中间表示形式,编写分析pass统计源程序的循环信息、指令信息、存储信息等,综合实现了CUDA程序静态信息的采集,大大减少了程序信息采集的耗时。本文还提出了全面反映程序性能变化的设置标签算法。经过筛选,本文确定了多个机器学习算法参与训练,并使用网格搜索方法、交叉验证方式完成参数调优的工作。在实验分析中,本文在三个公开程序集上选取程序建立训练集,共设计完成了三组实验。通过静态信息替代效果分析实验,验证了静态信息对运行时信息有较好拟合效果,可以在保证模型训练精度前提下,使信息采集时耗减少23.2%。通过机器学习算法对比实验,发现了支持向量机算法对本模型具有更好的训练效果。通过与已有模型在同等条件下展开测试,证明本文提出的模型相比已有模型提高精度3.7%、降低时耗51.8%,拥有更好的训练效果与时间优势。
其他文献
目前,癌症光动力治疗凭借其微创、重复给药和低毒副作用等优点引起研究者的广泛关注。光动力治疗利用光敏剂在光照条件下将能量传递给分子氧而产生活性氧(主要为单线态氧),进而导致肿瘤细胞凋亡。但肿瘤组织缺氧以及光敏药物肿瘤富集效果差等问题会限制单线态氧的产率,从而影响光动力治疗效果。为了实时监测光动力治疗进程,及时反馈单线态氧产生状况,本文设计了掺杂1,3-二苯基异苯并呋喃(DPBF)的单线态氧纳米探针,
随着网络流量数据量和种类的不断增加,传统的网络流量分类方法已经难以满足需求,基于机器学习的网络流量分类方法成为了网络流量分类的研究热点。但是机器学习模型的开发是个循环的过程,需要多次优化。在实际应用中,针对基于机器学习的网络流量分类模型的开发涉及多方面的工作,传统的开发手段就显得效率较低。现阶段国内外公开的机器学习管理平台有很多,但是还没有发现专门针对网络流量分类的机器学习管理平台。为此,本文设计
随着云计算技术的日益普及,以云存储为代表的数据外包服务正凭借其价格低廉、管理简化等特点而愈加的受到人们的欢迎。然而,数据外包服务也同时产生了许多问题与矛盾。一方面
习主席在党史学习教育动员大会上强调,要进一步感悟思想伟力,增强用党的创新理论武装全党的政治自觉。从基层实际看,把理论武装当口号喊、装点门面做做样子、不真学真用的问题仍然突出,需要各级紧贴青年官兵的思想实际和认知特点改进学习、深化武装,着力破除与真学真用不相适应的突出问题,不断推进党的创新理论武装在基层走深走实。
自2011年至2016年,我国进出口贸易总额增速持续下滑,贸易形势严峻。而“一带一路”倡议、人民币入国际货币篮子、外商投资法等一系列政策出台释放“制度红利”;2017年和2018年进出口总额增速大幅回升,贸易出现复苏迹象。如何提升对外贸易质量、推动贸易发展方式转型升级,以谋求我国在国际分工体系中的新地位,成为各界关注的重点课题。因此,本文以“一带一路”沿线41个国家(地区)为样本,探究国际分工视域
随着大数据与人工智能技术的广泛应用,数据背后蕴藏的巨大价值得以挖掘,同时带来也带来了不容小觑的隐私泄漏问题。如何在保障数据安全的前提下,实现大数据开放共享、高效挖掘日益成为重要的研究领域。为了应对数据挖掘中存在的隐私泄露风险,本文通过对大数据隐私保护技术进行深入研究,设计并实现了两种针对非结构化数据的隐私保护数据挖掘模型,能够有效地实现数据安全性与可用性之间的平衡。论文的主要创新性工作如下:(1)
“居住需要”是指人们能够较长时间住在一个地方的倾向,也是人对居住生活的愿望和要求。居住是人之于“生活世界”的重要维度。“居”不仅关涉人对空间的占有,还展现人的本质力量,也是人在现实生活中的居住体验和居住面貌,更是理解和把握现实人居住实践和生存境遇的重要路径。居住本质上是人的对象化的活动。海德格尔曾指出“人与空间的关系就是居住”的命题。作为人类首要的日常生活行为方式之一,人在一定的非居住空间和居住空
由于工厂企业生产过程不规范、保障措施不够健全,粉尘爆炸事故时有发生。通过火花监控设备探测点火源并将其快速消灭,是非常高效的预防措施。完善监管流程,建立远程实时监控平台,将火花监控设备接入网络进行统一管理,可以进一步保障安全生产。然而目前市场上的监控设备都没有加入网络功能,难以满足要求。本文设计并实现了一个以分布式、嵌入式为基础的管道火花自动监测控制系统,实时监控生产管道中的火花和设备运行状态等信息
近年来,文化翻译受到众多学者和译者的关注。乡土文学中的地方特色,不仅使得文学作品凸显地方风味,更会使得作品的文化价值得到提升。翻译乡土文学,既能让人们牢记地方文化,
新闻流行度预测是对新闻在未来时刻的点击量、评论数或者转发量的预测,通过对流行度的预测能够进行新闻质量评估,新闻排名,新闻推荐以及新闻检索等。新闻流行度的预测还能够缓解当今网络及社交媒体飞速发展带来的信息爆炸和信息过载问题。但是由于新闻存在时效性且生命周期较短为发布后的预测带来局限性,而发布前预测由于影响因素的多样性和难定义性也面临巨大的挑战。已有工作中对新闻进行发布前的流行度预测存在无法处理多源粗