【摘 要】
:
随着硬件计算能力的提升,卷积神经网络(CNN)在数字图像处理等多领域都做出了重要贡献,与此同时,二值卷积神经网络(BCNN)以无需进行乘法操作提取特征的优势在轻量级方面倍受关注。但二值算法特点使设计面向硬件的高效BCNN结构并不简单,其中最大的问题在于,通过改进网络结构弥补二值化带来损失的算法并不一定有利于硬件实现。本文的研究目标就是克服这一难题,从二值算法和硬件加速两个方面协同对二值网络进行研究
【基金项目】
:
中央高校基本科研业务费专项资金; 二值神经网络深度优化设计,江苏省研究生科研与实践创新计划项目(SJCX18_0056),2018-07至2020-05;
论文部分内容阅读
随着硬件计算能力的提升,卷积神经网络(CNN)在数字图像处理等多领域都做出了重要贡献,与此同时,二值卷积神经网络(BCNN)以无需进行乘法操作提取特征的优势在轻量级方面倍受关注。但二值算法特点使设计面向硬件的高效BCNN结构并不简单,其中最大的问题在于,通过改进网络结构弥补二值化带来损失的算法并不一定有利于硬件实现。本文的研究目标就是克服这一难题,从二值算法和硬件加速两个方面协同对二值网络进行研究。本文在算法层面上设计了一种有利于硬件映射的高效多层二值神经网络方案。该方案主要是将传统的二值卷积改进为二值分组卷积和二值深度卷积的双层卷积,并在分组前向传播过程中采用改进的通道重排和累加设计以实现高效映射,经过以上改进进一步减少了权重的存储并有效解决硬件加速器特征存储问题,其在CIFRA-10、MNIST数据集上分别取得了不低于86.5%和95%的识别正确率。本文还对改进的算法进行硬件映射,将多层网络采用层间流水和组间复用方式进行硬件加速,并用三输入并行同或计算代替传统二输入串行同或计算以获得更低的硬件资源消耗。与此同时,为提高硬件资源利用效率将所有的双层卷积操作采用查找表进行计算。最终设计的加速器在FPGA上对中小型图像的处理速度达到了542.5 FPS,IP核功耗仅有1.255 W,满足论文的设计要求。本文设计的轻量级二值神经网络加速器在资源数量较少的FPGA平台上也能取得较高的处理帧率,完全满足实时识别应用的要求,可以在终端设备上使用本文加速器构建出有实际应用价值的图片识别系统。
其他文献
在传统能源日益短缺、污染问题愈发严峻的今天,线损管理在一个国家的电网节能发展中起着重要作用,同时也对电网发展规划、降损措施制定起到指导作用。随着智能电表的推广和北斗卫星导航系统的不断完善,电力大数据时代已经到来,但现有的线损数据分析和异常用电行为识别方法多基于人力,线损数据统计、用电信息采集、用户电量监测等在时效性和准确性方面存在局限性。因此,如何结合北斗卫星导航系统、大数据技术,将电力数据的实时
大学校园中心区作为大学校园的重要功能区域之一,是展现校园特色、促进师生交流的活力空间。中心区外部空间作为建筑内部教学交往空间的延伸,空间使用频率较高,其环境的热舒适性是决定使用者活动交往质量和对外部空间品质评价的重要指标之一,尤其在以夏热冬冷为主要气候特点的江南地区,通过空间环境热舒适性的提升,对改善大学校园外部空间的环境品质具有积极作用。本文以南京地区大学校园中心区空间形态为研究对象,利用城市设
目的:总结20-40岁肝癌患者术前临床资料特征,筛选影响患者术后生存时间和复发的危险因素,为20-40岁肝癌患者的临床诊疗提供循证医学依据。方法:回顾性收集2013年1月至2017年12月期间于东南大学附属中大医院、山东大学附属齐鲁医院,青岛大学医学院附属医院住院择期行肝切除术的20-40岁原发性肝癌患者的基线资料。采用Kaplan-Meier(Log-rank检验)进行生存分析和单因素分析,Co
为节省芯片功耗,大多数传感器节点芯片采用周期性休眠的工作模式,因此芯片中的部分电路需要周期性唤醒,其中包括芯片的时钟电路。晶体振荡器因为稳定的频率特性,常作为芯片的时钟源,但晶体振荡器从开始唤醒到输出稳定频率需要数百微秒的时间,这段时间内芯片处于上电等待状态。因此起振时间越长,等待状态浪费的能耗越大。为了在减少晶体振荡器起振时间的同时减小能量损耗,本文基于恒定频率注入的方法提出了自追踪能量注入的电
在图像处理技术日新月异的今天,人们对于视频图像质量提出了更高的要求,然而视频画面抖动、成像质量下降成为了用户的痛点。在科研工作领域,不稳定的视频序列影响目标跟踪和行人识别的准确率;在日常生活当中,视频抖动直接导致用户观感体验下降,所以视频稳像技术具有深刻的研究价值和广泛的应用场景。但是目前稳像技术研究面临着不少挑战,如特征跟踪算法准确率受画面亮度影响、视频局部运动干扰大、运动滤波自适应性差等,以上
很明显,光最常用于构成建筑中的固体和空隙。自建筑史开始以来,光与空间相互作用。这种相互作用反映了地理条件,社会结构,信仰,宗教,经济甚至政治所塑造的设计动态。光还用于在建筑中创造心理和生理效应。在历史上几乎所有文化中,光也被用来象征神在神圣建筑中的存在。本文提出了一种方法,可以克服纯粹限制在神圣建筑中充分采光的经典方法的局限性。第一部分提供有关不同宗教和神圣建筑以及现有文献的一般信息(第1章)。这
时间序列是常见的数据形式,例如股票价格趋势、用电数据、病人的指标数据等。时间序列聚类研究是数据挖掘中重要组成部分,备受人们关注。现实场景下的时间序列数据具有高维、高频噪声等特点,因此,无监督的时间序列聚类研究极具挑战性。现有的时间序列聚类算法大致可以分为两类:基于原始数据的方法和基于特征的方法。基于原始数据的方法思想是在原始的输入数据上,针对不同的数据场景,根据特定领域的先验知识,设计出相似性衡量
计算机、网络和多媒体技术飞速发展推动了视频会议的诞生,视频会议是一种高效而灵活的会议方式被广泛应用于医疗、军事、商贸等各个领域,而会议视频是视频会议这种会议方式中由会场摄像设备录制下来的视频。如今,视频会议系统正成为各行业的重要通信业务,与此同时,会议视频的视频质量也逐渐引起重视。会议视频在录制时由于网络带宽或者其他录制硬件的限制,可能无法以原生高分辨率录制会议视频,直接观看视觉效果较差,这就需要
目的:肠道菌群失调被认为与多种内分泌疾病相关,但甲状腺机能亢进与肠道菌群之间的关联性尚不明确。本研究旨在探讨肠道菌群与Graves’甲亢的免疫机理、临床表现及功能状态的相关性。方法:以14名健康志愿者作为对照组,15例初发Graves’甲亢患者作为研究组,研究组经甲巯咪唑(Thyrozol,Merck公司)口服治疗3-5月后,如复查甲状腺功能FT3、FT4基本正常则再次收集标本作为治疗组。采用Il
互联网经多年的发展,传统的TCP/IP网络架构已无法满足多用户、大流量、易运维的需求,SDN以转发与控制分离、网络灵活控制等优点应运而生。近年SDN网络在科学研究和企业的生产应用都取得较大的发展,随着云产业的发展和繁荣,SDN的市场迎来新的浪潮。园区网络控制器是华为推出的一款高效统一管理网络的产品,该产品以开源SDN控制器原型,经公司自主研发,以云管理的服务模式为切入点,实现网络规划、部署和运维。