基于OpenCL的深度卷积神经网络推理加速与性能模型研究

来源 :西安电子科技大学 | 被引量 : 0次 | 上传用户:sqlservermaintenance
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,随着深度卷积神经网络算法的发展,出现了越来越多的复杂网络,在提高算法各方面性能表现的同时,也为算法的落实应用带来了新的要求和挑战。同时随着硬件的发展,出现了众多的异构计算设备,如CPU、GPU、FPGA和MIC等,在不同硬件上加速深度卷积神经网络推理阶段已经成为了研究热潮。设计一种跨平台的并行加速深度卷积神经网络推理算法可以为算法的移植带来极大的方便,为深度卷积神经网络在应用过程中适应不同设备提供基础,在实际应用中具有重要意义。同时由于不同厂商生产的硬件根据应用场景的不同在其架构、性能、功耗方面存在很大差异,在将算法根据实际要求来应用到合适的硬件上也面临着硬件选择难题,针对以上问题,本文完成的主要研究内容如下:本文为了研究跨平台的并行加速深度卷积神经网络推理算法,提出了基于OpenCL的并行深度卷积神经网络推理算法。分析了传统卷积与深度可分离卷积的并行性,设计并实施了并行OpenCL内核代码,通过结合clBLAS实现的并行矩阵乘法,并行加速传统卷积与深度可分离卷积,通过实验与Caffe和对角线重构实现的深度可分离卷积方法进行了性能对比,验证了本文提出方法的有效性。接着设计并实施了深度卷积神经网络推理阶段中其他操作算子的OpenCL并行内核代码,实现了使用OpenCL加速Mobilenet v1网络和残差网络的推理阶段,并进一步通过内核融合与增加全局任务量的方法提升性能。最终在AMD Radeon Vega Frontier GPU上加速两种网络相比于Caffe GPU并行分别取得了40.16和1.67倍的加速比,在NVIDIA GTX1070 GPU上分别取得了14.95和1.11倍的加速比,验证了OpenCL代码的性能可移植性。本文为了解决深度卷积神经网络算法推理应用过程中对硬件的选择问题,提出了基于多层感知器的深度卷积神经网络推理性能模型,用于预测深度卷积神经网络算法在不同硬件平台上的推理时间,从而指导深度卷积神经网络算法在应用过程中对硬件的选择。研究了影响深度卷积神经网络推理阶段中各种算子在不同硬件平台上性能表现的因素,包括网络算子自身结构和所使用硬件平台软硬件方面的影响,构造特征,确定特征取值范围,使用Caffe软件框架获取每种算子在NVIDIA和AMD GPU上取不同特征值情况下的运行时间,作为标签,构造数据集。为每种算子使用相应的数据集分别训练针对单一硬件平台和针对多种硬件平台的多层感知器,使用多层感知器来预测深度卷积神经网络各个算子在不同硬件上的运行时间,通过组合算子运行时间获得深度卷积神经网络在目标硬件上的推理时间。最终预测VGG16网络在不同批次与使用不同硬件情况下推理时间的平均相对误差为6.32%,验证了性能模型的有效性。
其他文献
我们每天用鼻子呼吸.吸入空气中的大量灰尘、细菌、二氧化硫等各种废气和病毒。虽然鼻腔黏膜有一定的过滤、清洁作用。但如果经常洗鼻,可及时清除鼻腔内干痂,会使鼻腔更好地发挥
引入分析力学,泛函分析和变分原理,对系统危险性进行分析,在系统安全理论和泛涵的基础上建立了危险评价的突变模型,发展了事故分析及危险评价的更高层次的突变理论,称之为危险评价
试卷讲评课作为高中地理课程中的重要课型之一,在地理教学中起到诊断、弥补、指导和提高的作用。当前试卷讲评课的研究主要集中在数学、英语、物理等科目,研究阶段多是整个高
网络借贷是互联网金融的一种新兴业态,随着互联网金融普及和推广,网络借贷在我国逐渐发展兴盛起来。网络借贷行业经过早年的野蛮发展,也暴露出发展停滞、大量平台清退、平台倒闭集中爆雷等一系列问题。监管层面自2016年来开始大刀阔斧对网络借贷行业进行整改和规范,但在2018年中网络借贷平台依然出现大量倒闭跑路事件。本文通过对e租宝事件、三农资本事件以及钱宝网事件三个典型案例分析发现,我国网络借贷发展存在的问
农村居民收入较快增长带来的庞大储蓄规模、农业产业升级带动的巨额资金需求、农村土地流转催生的资产格局重组等,处处孕育着银行业新的利润增长点。潜心拓荒者,将来必定“蛙满
期刊
随着我国城市化和工业化的不断深入,城市供水规模也日趋增长。对于较为缺乏地表江河的一些城市,水库和湖泊成了主要的供水水源。它们作为主要的给水水源,受到自然和人为因素影响较大,加上水库和湖泊自身的自净能力比一般的江河要差。因此,对给水水源采取净化水质的措施很有必要。本论文研究的对象是某水库的取水工程。主要基于CFD商用软件Fluent对水泵在水库中取水时,水库的中下层液体流场和基质分布进行数值模拟,并
当前大数据技术的不断发展与进步,逐步推动社会发展迈入新阶段,也推动政府审计方式发生转变,甚至对传统的审计思路进行了转变。国家重大政策措施落实情况跟踪审计开始于2014年8月,自此以来,审计署组织全国审计机关持续跟踪审计各地方、各部门贯彻落实中央政策措施情况及效果,密切关注打好三大攻坚战、供给侧结构性改革、“放管服”推进、营改增实施、重大项目落地、金融服务实体经济等情况,着力推动稳增长、促改革、调结
采用有限差分和二维稳态层流模型,应用边界适体坐标(BFC)技术对异么双辊薄带铸轧熔池中的钢液的流动进行限数值仿真,分析了铸辊转速液在宽度、浇注区宽度浇注位置等操作和设计参数对
新经济是以知识为基础的经济,它正以前扎未有的冲击力影响着我们的经济、政治、社会、文化,尤其是企业经营战略与策略。文章分析地新经济的特征以及对企业文化的影响,对新经济条
媒介的每次革新都会给知识领域带来深刻的结构性变化,以互联网为核心的新媒介快速更迭,对知识生产及知识形态的冲击尤为剧烈。知识付费是近年来互联网知识生产中的一种新形态,其创下的收益神话和引发的媒介奇观,改变了大众对于互联网中知识是免费共享的固有印象,让互联网中知识的价值回归到知识与知识产品本身,这也刺激了专业生产知识产品的古老但又不断寻求互联网转型的出版行业。互联网音频类知识付费产品作为知识付费领域中