【摘 要】
:
用FPGA加速深度学习算法的训练过程通常需要较长的开发周期和丰富的硬件设计经验.为了应对这一挑战,设计了一种基于自适应模板技术的深度学习算法训练加速框架,在应用规模、并行调度策略、资源使用和功能扩展上进行了深入的研究并提出了相应的优化策略.采用CPU-FPGA异构加速模板技术,提出了自适应的上层模型编译框架实现与不同硬件加速资源的适配.这种基于定制模板的软硬件协同设计可以很好地适配不同的FPGA芯
【机 构】
:
北京航空航天大学集成电路科学与工程学院,北京深维科技有限公司
【基金项目】
:
北京市自然科学基金(4192035),北京市首都科技创新项目(XM20200028-C).
论文部分内容阅读
用FPGA加速深度学习算法的训练过程通常需要较长的开发周期和丰富的硬件设计经验.为了应对这一挑战,设计了一种基于自适应模板技术的深度学习算法训练加速框架,在应用规模、并行调度策略、资源使用和功能扩展上进行了深入的研究并提出了相应的优化策略.采用CPU-FPGA异构加速模板技术,提出了自适应的上层模型编译框架实现与不同硬件加速资源的适配.这种基于定制模板的软硬件协同设计可以很好地适配不同的FPGA芯片并支持算法的快速迭代.用图神经网络算法数据进行加速对比实验,实现了与CPU相比7~41倍的速度提升.
其他文献
通过研究大气中过氧乙酰硝酸酯(PAN)的浓度变化特征,为光化学污染防治提供依据。采用PAN在线分析仪对2019年7月18日~8月31日北京市大兴区的大气PAN进行观测。结果显示:观测期间PAN摩尔分数日均值在0.26~1.83 nmol/mol之间,晴天中PAN浓度相对较高,阴雨天PAN浓度相对较低;夏季PAN浓度日变化规律显著,呈典型单峰形态,最高值通常出现在下午13:00~15:00;PAN浓度与O3浓度变化趋势基本一致,具有较强的相关性,导致PAN生成的VOCs物种在总反应性VOCs中所占比例持续降
高邮湖湖心区断面作为国控断面,是考核高邮湖水质的关键考核断面,近年来其水质总是难以达到Ⅲ类水质的标准,通过湖心区及入湖河道的水质监测历史数据分析高邮总磷污染的现状,并以EFDC水环境动力学模型为平台,建立高邮湖流域各条入湖河流污染源与考核断面水质的因果定量响应关联,求解出高邮湖主要入湖河流对湖心区断面的总磷贡献比例,为高邮湖水环境污染防治工作的开展奠定了一定的基础。
污水处理设施尾水作为水体污染物重要来源之-一,其对水环境恶化造成的影响受到广泛关注,生物滤池是污水深度处理的常用工艺,系统分析其对尾水的处理作用具有重要意义。研究介绍污水处理设施尾水现状及我国受纳水体总体情况,并简要说明尾水对受纳水体的影响,阐述滤池对尾水中营养盐、有机物及悬浮物等污染物的去除效果,探讨水力负荷等运行参数和碳氮比等水质参数对滤池处理效果的影响。最后根据国内外研究现状提出了未来需要深入研究的方向。
对江苏省28所民办高校党建工作考核的结果表明,民办高校党建工作总体情况较好,规范化、制度化水平得到有效提升,但部分民办高校还存在思想认识有偏差、管理体制不够顺畅、运行机制不够健全等问题。要进一步增强民办高校党建工作的紧迫感和责任感,健全完善党建工作制度和保障体系,加强民办高校党建工作研究,努力提升民办高校党建工作水平。
现有的基于草图的三维模型检索工作往往将数据视为静态输入,并使用卷积神经网络进行特征提取,忽略了数据的动态属性,造成了有益信息的部分丢失,进而影响了以此为基础的检索效果.为解决这一问题,提出一种基于时空信息联合嵌入的端到端三维模型草图检索算法.首先,将草图表征为动态绘制序列,体现其绘制过程中所包含的时序信息;将三维模型表征为多视图序列,体现视图间的位置关联;然后,构建包含静态空间特征提取和动态时序特
为揭示徐州市大气降水化学成分特征及污染来源,于2020年1~12月期间采集了徐州市城区大气降水样品,分析其pH值、电导率及主要阴、阳离子(K+,Na+,Ca2+,Mg2+,F-,SO42-,Cl-,NO3-)浓度的变化特征。结果显示:徐州市大气降水的pH值在6.69~7.61,电导率变化在29.67~249.3
针对大场景遥感图像内容复杂,并且具有目标种类较多、尺度不一、方向多变等特点,导致遥感图像中目标多类多尺度多方向的问题,提出一种基于多尺度注意力特征金字塔网络(MAFPN)以及滑动顶点回归(GVR)机制的遥感图像目标检测方法.首先利用骨干网络提取多层特征作为MAFPN的输入,MAFPN结合特征融合和注意力机制,在融合多个尺度的特征映射的基础上使用通道域注意力和空间域注意力机制来抑制噪声,增强有效特征
病理切片中肾小球的识别和分类是诊断肾脏病变程度和病变类型的关键,为解决肾小球的识别和分类问题,从中检测出肾小球并进行分类,设计了一个基于深度学习的完整的肾小球检测及分类框架.该框架包括肾小球识别的4个阶段,第1阶段的扫描窗生成中,设计一种网络框架RGNet,用于初步判断肾小球可能出现的位置;第2阶段的检测和粗分类中,针对肾小球数据改进了Faster R-CNN;第3阶段基于NMS算法设计了NMS-
现有基于深度学习的缺陷检测方法通常采用强监督学习策略,检测效果依赖于样本的数量和标注的质量.针对上述问题,提出弱监督学习下融合注意力机制的神经网络算法,仅使用图像级别标签便可同时预测缺陷的位置和概率.首先对多尺度感受野模块提取的特征应用特征融合网络,获取更多边缘细节信息;然后通过多层次的自编码器挖掘特征的深层语义信息;同时通过三线性全局注意力模块进一步细化浅层特征的空间位置信息;最后对浅层边缘特征
跨模态哈希检索以其较高的检索效率和较低的存储成本,在跨模态检索领域受到了广泛的关注.现有的跨模态哈希大多直接从多模态数据中学习哈希码,不能充分利用数据的语义信息,因此无法保证数据低维特征在模态间的分布一致性,解决这个问题的关键之一是要准确地度量多模态数据之间的相似度.为此,提出一种基于对抗投影学习的哈希(adversarial projection learning based Hashing f