针对NVIDIA Maxwell GPGPU应用的控制流发散软件优化方案

来源 :东南大学 | 被引量 : 0次 | 上传用户:wwqq1200
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,GPU计算能力不断提升,可编程性大大增强,大量通用应用被移植到GPU平台上运行。由于GPU硬件的SIMD执行特性,通用应用执行中广泛存在控制流发散问题。控制流发散问题降低了 GPU中SIMD单元的利用率,对应用性能产生了负面影响。在已知三大关键信息,即控制流发散造成的性能影响、线程原始控制流信息和分支指令对应软件源码的基础上,通过修改软件源码实现线程重组的软件优化策略有望改善控制流发散问题,但是现存的获取这三大关键信息的途径各自存在实施难度大、获取时间长、信息不完整等缺陷。因此,特别针对控制流发散造成的性能瓶颈,本文设计了基于二进制插桩分析、控制流图分析和调试信息分析的信息获取方案和相应的控制流发散优化方案,快速定位瓶颈,实施优化。对于控制流发散造成的性能影响,本文借助定量分析将其拆分为分支指令处的一系列运行时信息和分支路径长度信息,再进一步通过插桩分析和控制流图分析分别获取这两类信息。对于线程原始控制流信息,本文通过插桩分析的方式获取,并在最终结果中保留了线程束的编号和分支指令执行次数信息以满足线程重组方案推导的需求。对于分支指令对应的软件源码,本文结合分支指令的地址和调试信息中指令地址与源码位置的对应关系,获取特定分支指令对应的软件源码。在此基础上,本文阐述了借助本文获取的信息实现控制流发散软件优化的具体方案。本文在NVIDIA Maxwell架构的GTX 960 GPU平台上进行了方案实现,对Rodinia基准应用测试集中的24个应用进行了信息获取和相应的数据验证,并且对Rodinia中控制流发散问题较为显著的Back Propagation应用借助获取实验中获取的信息实施了软件优化。实验结果显示,本文的信息获取方案获取的信息与程序独立分析的结果完全吻合,本文中对Back Propagation程序实施的控制流发散软件优化策略使内核程序中的控制流发散分支减少了 76.7%,内核程序IPC相应地提升了 19.5%。由此可见,本文设计的方案可以快速可靠地获取实现控制流发散软件优化所需的三大关键信息并实现相应的软件优化,改善应用中的控制流发散问题,提升应用性能。
其他文献
随着建筑工业化进程的不断推进,钢骨混凝土结构开始广泛地应用于房屋、桥梁结构中。预应力桁架式钢骨混凝土中钢骨桁架是将弦杆、腹杆、节点板等用焊接的方式连接成一个整体,
摘要:【目的】明確广西鸡源H9N2亚型禽流感病毒(AIV)的分子遗传变异规律及其对公共卫生安全的影响,为H9亚型禽流感(AI)的防控提供参考依据。【方法】从广西某肉鸡养殖场采集病料,经SPF鸡胚接种进行病毒分离,对初步鉴定为H9亚型AIV分离株的HA、NA、PB2、PB1、PA、NP、M和NS等8个基因片段进行克隆测定及遗传进化分析,同时对分离毒株的生物学特性进行测定。【结果】从广西发病鸡群中分离
如何让就医者在医院里节省时间?在医院建筑的改扩建工程的设计和布局时,如何进行医疗功能流程的重组?从事医院建筑管理多年的北京市海淀区政府公共服务委员会的专家李劲涛,向记者
在“劳动光荣、技能宝贵”的良好时代风尚背景下,我国的中等职业教育也迎来了发展的春天,但要想大步向前迈进,就急需解决当前中等职业教育在课程教学方面的诸多问题。而职业技能大赛作为职业教育改革与发展的一项重要制度设计,在推动中等职业教育专业教学改革、检验和提高教学质量方面发挥着重要的作用。本研究立足于大赛视角,依托中等职业学校当中的《餐饮服务与管理》这一具体课程,运用定性与定量分析、规范和实证分析的研究
目的分析不同剂量质子泵抑制剂(PPI)序贯疗法治疗幽门螺杆菌(Hp)阳性消化性溃疡的临床效果及安全性。方法选取2017年1月至2018年5月上海市嘉定区南翔医院收治的Hp阳性消化性
为了提高医疗电源配电的可靠性,分析了配电线路切换的工作过程,指出了不足之处,给出了利用S7-200PLC在配电室两路电源自动切换中的应用,并对PLC的外部接线、编程及工作原理作了进
【目的】调查了解广西荔枝主产区荔枝中的农药残留情况,并进行农药残留风险评估,为荔枝生产上安全合理使用农药及荔枝农药最大残留限量制定提供参考依据。【方法】对在广西荔枝
讨论了建筑工业中的质量保证问题.这忡质量可理解为旨往使产品符合ISO9000标准的有计划的系统的行动。近年来,具有产品质量证明书的公司显著增长。例如,1992年中期美国只有400家
[目的]B-Raf(V600E)激酶是目前最具吸引力的抗肿瘤靶标之一,其抑制剂有Ⅰ型、ⅡA型和ⅡB型,其中ⅡB型抑制剂有着特异性抑制和低毒性的优点而成为开发热点。近年来,有诸多的ⅡB
目的:对比三种AI类药物治疗对绝经后乳腺癌患者血脂代谢的影响。方法:通过回顾性研究方法,根据患者雌孕激素受体阳性情况选取新疆医科大学第一附属医院乳腺外科2015-2018年术后辅助内分泌治疗的绝经后乳腺癌患者88例,将其共分为3个组,分别为A组,B组和C组,分开分别检测患者在服用药物之前及服药后3个月、6个月、1年的甘油三酯(TG)、总胆固醇(TC)、高密度脂蛋白胆固醇(HDL-C)、低密度脂蛋白