支持国产计算平台的深度学习加速技术研究

来源 :中国电子科技集团公司电子科学研究院 | 被引量 : 0次 | 上传用户:gfjgds
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
深度学习作为人工智能技术中的重要组成部分,在各类行业中有着广泛的应用场景,而计算装备的国产化,在当前的国际形势下具有十分重要的战略意义。国产计算平台下的深度学习目前缺乏可用的计算加速设备,导致应用推广较为困难。针对此问题,本文深入研究了深度学习中训练与推理两个过程,实现了两种支持国产计算平台的深度学习的加速技术:国产计算平台的GPU加速技术和国产FPGA卷积神经网络优化技术。这两项技术对于支撑国产计算平台上的深度学习应用具有重大意义。本文主要的工作如下:第一,通过阅读文献资料,了解深度学习在国产计算平台上的加速环境与加速硬件的现状及存在的问题,明确了两种加速技术的实现途径。第二,研究主流GPU通用运算平台的技术结构,针对国产计算平台的特点,选择合适的GPU,通过交叉编译、内核模块替换与系统环境变量设置等技术途径,实现了从源码级别构建支持国产计算平台的GPU通用运算环境。第三,针对国产FPGA逻辑资源不足与深度学习计算需求之间的矛盾,通过矩阵压缩与数据量化两种方法对深度学习中的卷积神经网络进行优化处理,在国产FPGA上实现了对VGG卷积神经网络的优化。实验表明,在国产计算平台上使用GPU加速技术和国产FPGA加速技术,二者的计算效率相较国产CPU分别提升了 48倍与284倍,成功地实现了深度学习的加速计算,推进了深度学习在国产计算平台上广泛应用的进程。
其他文献
本文通过分析编制差别报告的必要性,从对内对外财务报告的差异、对内财务报告使用者的差异、不同使用者对对外财务报告的需求差异三个方面,论证了差别财务报告的主要表现形式
高级氧化技术是一种可以有效缓解水污染问题的手段,其中,以过一硫酸盐(Peroxymonosulfate,PMS)为氧化剂的反应因能产生强氧化性的硫酸根自由基(SO4·-,氧化还原电位2.5-3.1 V)逐
检索语言是用于查检寻找有序化事物的工具,是实现书目数据检索功能的主要形式,通过选择揭示文献主题的题名、分类、叙词、关键词等数种检索语言进行比较, 提出对文献检索语言进
温度是限制植物生长发育过程和地域分布界限的重要非生物胁迫因子之一,每年因低温冻害造成的农作物产量损失巨大,因此,研究植物尤其是农作物和经济作物的抗冻机理和抗冻人工
介绍了克里金模型的基本理论,并采用以克里金模型为近似模型的贝叶斯分析算法,对函数关系复杂、难以计算情况下的全局优化问题进行求解.该算法使用实验设计的方法选取初始样
总结50例麻风病院疗养患者临终关怀的护理体会。组建由医生、护士、病友和志愿者或家属等组成的临终关怀小组,在对患者进行护理评估后,给予姑息治疗、生活照顾、心理护理、残