【摘 要】
:
近年来,卷积神经网络被广泛应用于各个领域。为了提高网络的性能,研究者们通常会加深或加宽网络。然而,网络性能在提高的同时,网络整体的计算量和参数数量也在快速增加,这极大阻碍其在资源有限的移动端上的应用。二值化是解决上述问题的一种较好的方法,但由于二值化直接将网络的权重和卷积层的输入特征映射为1bit数据,造成网络精度的大幅下降,导致其难以投入实际应用。基于此,本文在Res Net-18网络结构的基础
论文部分内容阅读
近年来,卷积神经网络被广泛应用于各个领域。为了提高网络的性能,研究者们通常会加深或加宽网络。然而,网络性能在提高的同时,网络整体的计算量和参数数量也在快速增加,这极大阻碍其在资源有限的移动端上的应用。二值化是解决上述问题的一种较好的方法,但由于二值化直接将网络的权重和卷积层的输入特征映射为1bit数据,造成网络精度的大幅下降,导致其难以投入实际应用。基于此,本文在Res Net-18网络结构的基础上进行修改,提出了BNSC-Net(Binary Convolutional Neural Network with Numerous Skip Connections)网络,提升了二值卷积神经网络的精度。并且,为了充分发挥二值卷积神经网络的优势,本文针对二值卷积神经网络中各个模块,提出了不同的硬件优化方法,最后分别在FPGA上进行仿真验证。为提升二值卷积神经网络的性能,本文基于Res Net-18网络结构,做出以下四点改进:(1)将网络中的3×3卷积核分解为3×1和1×3卷积核的串接,并将每个卷积层的输入特征与输出特征进行跳接操作;(2)引入特征堆叠操作,将网络中每个Unit的输入特征与输出特征进行通道堆叠操作,使特征得到重复利用;(3)引入通道注意力和空间注意力机制,使得BNSC-Net能够在有限的特征信息中充分利用重要的特征;(4)将STE(StraightThrough-Estimator)的更新区间从[-1,1]扩大到[-2,2],使得网络中更多的权重得到更新。基于上述四个改进方法,本文所提出的BNSC-Net在CIFAR-10和Image Net数据集上取得较高的准确率。同时,为分析BNSC-Net在实际工业场景数据上的分类能力,本文在NEUCLS数据集上进行验证,结果表明BNSC-Net可对NEU-CLS实现较好的分类。此外,本文对二值卷积神经网络在FPGA上的实现方法进行初步尝试。具体地,本文基于HLS开发方式,利用Xilinx SDx开发工具,在FPGA上对二值卷积神经网络中的各个模块进行仿真验证。针对不同的模块,本文采用了不同的优化方法。具体的,在二值卷积层,为充分利用资源并降低二值卷积层的整体计算时间,本文采用三种优化方法:8通道并行计算、输入特征复用和流水线优化方法。在Batch Norm层,通过化简整合表达式,将4个全精度的参数数量整合为2个,可降低Batch Norm层的整体资源消耗和运行时间,提高了加速比。本文针对二值卷积神经网络的性能改进方法,在Image Net数据集上取得了59.9%的TOP-1准确率,相比于近几年其它的二值卷积神经网络,提升了2.6%。此外,本文在FPGA上初步尝试实现二值卷积神经网络,通过仿真结果验证了二值卷积神经网络硬件实现方法的可行性,为后续网络的部署奠定基础。
其他文献
神经形态计算可以实现计算中心和存储中心一体化,能够提供一种速度快、效率高、能耗低的并行数据处理方式,有望成为下一代计算机体系。研发能够模拟生物突触学习与记忆行为的人工突触器件是实现神经形态计算的关键。忆阻器的阻值受到流经的历史电流所控制,这一特性与生物突触可塑性相似,因此被广泛应用于人工突触器件制备和神经形态计算研究当中。到目前为止已有多种材料体系被应用于人工突触器件的开发,比如氧化物、二维材料、
柔性铜锌锡硫硒(CZTSSe)太阳能电池因可弯折便于携带而拥有更广阔的发展前景,但柔性CZTSSe太阳能电池效率的提升受到背界面问题的制约,其主要原因是在高温硒化过程中CZTSSe与Mo之间发生分解反应,在界面处产生二次相、孔洞等,并生成较厚的Mo Se2层,使得空穴易于被复合损耗而难以传输至背电极。本论文将系统研究柔性CZTSSe太阳能电池背界面问题,改善背界面接触。针对柔性CZTSSe太阳能电
近些年,信息技术不断推陈出新,给我们的社会、经济以及生活带来了前所未有的变化。在信息化浪潮的推动下,网络数据呈现爆发式的增长,信息过载的问题逐渐凸显出来,此时,最大限度地提高这些资源的利用率显得尤为重要。为了解决上述问题,越来越多的研究开始关注利用个性化推荐技术向用户提供他们真正想要的信息,避免用户浪费过多的时间在不必要的信息搜寻工作上。本文在个性化推荐技术的基础上,引入知识图谱作进一步的研究,并
动静脉分离有助于肺部疾病的早期筛查与病理状态诊断,为肺部手术的术前规划、术中导航、术后评估等提供有效的参考,具有重要的临床意义。动静脉在CT图像上灰度和形态十分相近且部分动静脉分支相互黏连,而且一例肺部CT影像序列可包含数百层影像,熟练的医师重建一例患者动静脉一般需要耗时数个小时,过程繁琐复杂且容易出错。若能通过计算机辅助的方式自动、快速、准确地分离出动静脉血管树,可以减轻医生的工作量,合理规划肺
近年来,高清视频监控得到了广泛应用。对视频中人体的异常行为进行自动识别可切实有效地保护人身及财产的安全,因此具有重要的应用价值。常见的人体异常行为识别方法主要通过提取运动目标的特征来进行建模。然而,实际监控场景存在背景复杂、运动目标数量不固定、异常行为的定义与具体的应用场景有关难以统一界定等各式各样的问题,增加了对人体异常行为识别的难度,使人体异常行为识别成为具有挑战性和研究意义的任务。本文设计一
语义分割作为计算机视觉领域的热门研究课题,目标是对图像中的每个像素点进行正确分类。然而,现有的分割数据普遍存在像素分布不平衡的问题,即类别间的像素分布呈现“长拖尾”现象。这将导致训练模型仅在极个别样本集中的类别上表现突出,而大多数类别性能欠佳,整体精度受限,严重阻碍了多分类分割的应用化进程。本文首先针对普通场景语义分割中的像素分布不均问题开展研究,提出了一种基于数据层面和算法层面的非均衡数据分割方
近年来,随着民用无人机技术的不断发展,无人机的应用场景越来越广泛。围绕无人机的组合导航算法,众多研究者进行了深入研究,并取得了诸多显著成果。然而,目前大部分无人机系统在工作时仅采用GPS全球定位系统实现自定位。当无人机位于高层障碍物附近,或位于强电磁干扰区时,GPS信号可能丢失,从而导致无人机定位信息失效。因此,急需一种能够在无GPS信号条件下可靠、实时、稳定、高精度地为无人机提供定位数据的无人机
量子点(quantum dots,QDs)具有优异的光电特性、可靠的光稳定性以及普遍较高的荧光量子产率,兼具高性能和低成本的量子点在光学防伪标签领域具有广泛应用前景,是一种理想的发光防伪材料。本文根据使用的不同量子点材料的特性,采用了喷墨打印、丝网印刷和光刻工艺分别对量子点墨水、量子点粉体和原位合成的钙钛矿量子点制备的薄膜进行了图案化处理,并对图案化的薄膜的形貌结构、发光特性进行了表征,实现了不同
随着科技的高速发展,自动驾驶技术与高级辅助驾驶系统成为了各国研究的热点,车道线检测则是自动驾驶技术与高级辅助驾驶系统的重要组成部分,具有许多值得研究的问题。由于不同复杂交通场景之间差异较大,拥挤场景会出现车道线被遮挡,光照条件不好会造成车道线模糊等问题,使得现有的车道线检测方法在实际应用时,存在准确性与鲁棒性等方面的不足。针对以上问题,本文在福建省与福州市重点科技项目(2018H0018,2020
超分辨率简称超分,是计算机视觉中的经典任务,其目的是重建低分辨率图像中丢失的高频信息。在过去几十年间,我们见证了超分技术快速发展的历程。特别是深度学习技术的进步,极大地促进了超分领域的发展。目前,超分技术被广泛应于众多领域中。尽管如此,基于深度学习的超分模型需要配对的高—低分辨率图像对来进行训练。然而,在真实世界中,这样的配对图像通常存在获取难度大、获取成本高的问题。为解决这个问题,研究者们通常利