基于CPU-FPGA异构多核平台的卷积神经网络并行加速研究

被引量 : 0次 | 上传用户:qwe8056
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着深度学习的发展,卷积神经网络的网络规模及计算复杂度不断增大,通用CPU无法满足性能需求,使用专用硬件处理器来加速计算过程成为一种行之有效的方法。由于FPGA具有可编程的特点,可以灵活配置硬件资源,具有高效能比、可重构能力以及快速设计周期的优势,成为加速卷积神经网络计算过程的理想硬件平台。本文研究了卷积神经网络前向过程的并行性,提出了相应的并行方案。本文使用HLS高级综合工具对前行过程中负载较大的卷积层和全连接层进行了实现,搭建了一个基于CPU-FPGA的多核异构系统进行方案验证。实验结果表明该异构多核并行加速系统性能的比基于CPU的卷积神经网络框架提高了14倍。
其他文献
随着社会生产力的进步和科技水平的提高,在人们的日常生产生活中,已经普遍的使用大数据,尤其是企业的人力部门在进行人力资源管理的时候更是依赖于大数据的"挖掘"。在我国,大
本文阐述了中国剩余定理在数学史上的地位并介绍了它的几种解法.
<正>3月25日,中石化发布2017年年报,按照国际财务报告准则,2017年中石化实现营业额及其他经营收入2.36万亿元,同比增长22.2%,实现归属于母公司股东的净利润511.19亿元,较上年
本文报告了我们自制的扫描隧道显微镜的原理、结构及解决的几个关键技术问题,如样品和针尖间距的粗调和细调,三维扫描和控制压电陶瓷管,针尖的制备,减震阻尼系统和电子线路,
本文基于1995和2015年的Landsat系列遥感影像,利用主成分分析法确定绿度、湿度、干度、热度4个指标的权重,采用遥感生态指数(RSEI)评价模型,对渭南市1995—2015年的生态环境
针对航天用高强度不锈钢常规冷却切削出现的表面质量难保证、刀具磨损剧烈、切削效率低等问题,基于液氮喷淋冷却方式,探究了航天用高强度不锈钢的低温铣削性能以及刀具切削磨
为了提高地铁施工风险预控管理水平,以地铁施工阶段险兆事件的危险源为研究对象,从人-物-环境-管理4个方面对危险源进行分类,明确险兆事件的致因因素,基于解释结构模型法对地
目的:探讨凉血消庀汤加减联合西药对寻常型银屑病患者疗效、安全性、情绪及转归的影响。方法:选择80例寻常型银屑病患者,按照随机数字表法分为两组,每组40例,对照组予西医常
【目的】探索益生性酿酒酵母菌对绵羊瘤胃上皮细胞β-防御素-1(sheep beta-defensin-1,SBD-1)表达的调节作用,为在分子水平上揭示益生菌对防御素的调控机理提供一定的理论基
孤独症(Autism)因其复杂性和不可治愈性,阻碍了儿童的成长与发展,为家庭带来严峻考验,对家庭生活质量造成负面影响,使家庭长期处于弱势状态,在客观层面缺乏养育儿童的资源和能力,形成主观“无权感”。家庭增权概念的出现,标志着对孤独症儿童家庭的研究取向由“弱势视角”转变为“优势视角”,能够反映家庭获得知识、技能和资源从而积极控制生活的状态,并体验到“权能感”。然而,国内有关孤独症儿童家庭增权的研究尚