基于图信号处理的卷积神经网络模型加速研究设计及硬件实现

来源 :福州大学 | 被引量 : 0次 | 上传用户:laopengtou
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着深度学习的兴起,卷积神经网络(Convolutional Neural Networks,CNNs)在图像分类、检测、分割和重构等计算机视觉任务中都取得了巨大的成功。早期CNNs的训练和推理均在服务器端进行。近年来,物联网技术的广泛应用促使CNNs逐渐从服务器端向嵌入式移动终端转移。但由于CNNs是典型的计算密集、存储密集的网络模型,资源有限的嵌入式移动终端设备常常不能满足CNNs对计算和存储资源的大量需求。因此,网络模型压缩和加速成为CNNs模型部署的关键所在。目前常见的CNNs模型压缩加速方法主要有低秩分解近似、网络剪枝、权重量化和知识蒸馏等。但是这些方法都没有考虑计算负载分布不均、网络结构不规则等问题。本文针对GPU嵌入式平台Jetson AGX Xavier上的CNNs部署问题,开展了以下三个方面的工作:第一,对于CNNs中计算负载分布不均,直接卷积计算方式延迟高的问题,本文提出利用图信号,将输入、卷积层和全连接层等都表示成图域的形式,构建基于图信号的CNNs的方法。然后使用图信号处理相关技术来处理各层,使各层都变成矩阵-矩阵乘或矩阵-向量乘的统一计算方式。通过转换使得整个网络规则化,更容易被GPU并行化加速,而且有利于硬件优化策略的使用。第二,对于不同卷积核之间可能存在的相似关系所造成的权值冗余问题,本文分别在空域和频域上使用聚类量化的方法对卷积层进行压缩。该方法与传统的标量量化方法不同,针对的是以卷积核为对象的矢量量化。首先对多个卷积核进行聚类,然后对聚类得到的每组卷积核进行量化,最后用量化得到的结果去近似表示原有卷积核以达到压缩的目的。量化后的卷积层参数存储需求和计算量都将减少。第三,对于GPU硬件平台虽然并行单元众多,但不同内存之间访问速度差别较大的问题,本文提出基于脉动架构思想的访问优化以及基于异步传输的数据传输方法,有效减少内存访问时间和数据传输时间。优化后的模型在嵌入式GPU设备上能够更好地利用硬件资源,实现加速。本文以面向图像分类的VGGNet和面向图像重构的AUTOMAP为例,对本文所提出的方法进行了验证。实验结果表明,本文方法可以使两类基于图信号的CNNs获得与原始模型相当的性能。为了有效压缩网络模型,本文利用聚类量化方法成功地将CNNs的卷积层参数压缩为原有的一半。无论是VGGNet还是复杂度更高的AUTOMAP网络都可以在嵌入式设备Jetson AGX Xavier上良好运行。
其他文献
经过几十年的蓬勃发展,有机发光二极管(OLED)在平板显示和固态照明领域已经成功商业化。伴随着技术的不断革新,显示器的便携性,灵活性越来越受到大众的关注,而OLED所具有的自发光、响应速度快、高对比度等特点是制备新型柔性显示器的最优选择。然而,目前柔性OLED器件主要依赖于真空蒸发沉积技术,这使得制备大面积柔性器件和降低生产成本变得困难。喷墨打印技术,具有材料利用率高、图案精度高、便于大规模生产等
学位
心血管疾病一直是全球所面临的严峻医疗问题之一,在我国心血管疾病死亡率甚至超过了由癌症导致的死亡率,已成为致使国民总死亡的首位因素。不断加剧的患病负担,导致医疗资源严重失衡,优质的医疗资源无法得到最大化利用,实现智能化诊疗迫在眉睫。随着医疗研究的不断进步,心电领域的智能化诊疗也成为可能。心电图作为医护人员监护心脏健康情况最直接的工具,加速心电图判读工作可以大幅提高医生的工作效率,使得现有医疗资源紧缺
学位
近年来中国的法院面临着司法资源紧张,人少案多的问题。最高人民法院提出了建设智慧法院的意见,要求充分发挥人工智能等新技术的优势辅助法官办案,减轻办案人员的负担,促进法官同案同判和量刑规范,提升司法公信力。因此,本文通过对基于深度学习模型的相似文本计算方法进行研究,设计了案例推荐系统。类案推荐是人工智能技术在司法领域的应用之一,通过将查找相关案例的操作交给系统完成,一方面有助于提高法官办案的效率,缓解
学位
目前,物联网技术飞速发展。它通过众多的终端设备不断进行信息的收集并将数据传输到数据处理中心。大量的数据采集导致以香农采样定理为基础的信息系统给模拟数字转换器(Analog to Digital Converter,ADC)的处理能力带来巨大的挑战。近年来,针对连续时间稀疏信号,在采样的同时完成冗余数据压缩的模拟信息转换器(Analog to Information,AIC)成为ADC的替代方案。A
学位
物联网时代的到来和便携式电子设备的蓬勃发展对可应用于集成电路的、具有高能量密度和长循环寿命的全固态薄膜微电池提出了新的要求。目前,钴酸锂正极已被成功应用于全固态薄膜锂离子微电池中,但其理论比容量低(~71μAh/cm~2μm),且在制备过程中需要高温退火处理(>500℃),这与集成电路制造不兼容。因此,亟需开发出可低温制备的高性能全固态薄膜锂离子微电池正极制备工艺。在过渡金属硫化物中,硫化铜因其理
学位
三维拓扑绝缘体因具有特殊拓扑性质的表面态而在众多领域受到广泛关注。其中,在三维拓扑绝缘体的光电实验研究中,自旋极化电子和空穴各自对自旋光电流的贡献一直没有得到很好的区分,而区分自旋极化电子和空穴的作用及影响对自旋电子器件研制中载流子类型选择具有重要意义。此外,同样具有拓扑性质的三维拓扑绝缘体侧表面态的自旋输运研究还有待开展。针对以上问题,我们进行了相关光电实验研究。主要研究内容和结果如下:1、研究
学位
当前社会,人口老龄化速度明显加快,提醒老人吃药逐渐成为了全社会都面临的一个难题。基于以上现状和目前市面上产品存在的不足,本文设计了一种基于ARM的新型智能药箱系统,智能药箱硬件平台作为实现提醒患者服药的主设备端,通过有线以太网通信与无线通信向远程平台传输数据,用户可通过互联网访问远程平台获取智能药箱的实时数据,实现了整个系统的端云一体化设计。本文选用了STM32F103ZET6作为智能药箱系统的主
学位
随着生活越来越美好,人们对于自身健康情况愈发重视。本文从生物医疗领域的应用背景出发,设计了一款应用于体温监测的RFID芯片。通过调研带温度测量功能的RFID芯片历史以及近几年的发展现状,在麦克斯韦方程的前提下,首先介绍了UHF RFID工作原理,分析RFID系统是如何进行通信,分析了RFID中的能量和数据传输原理。在电路设计方面,设计了一种适合UHF RFID系统的基准电源电路,并且LDO的反馈网
学位
双目三维重建技术以其精度高、实时性好、可以稳定恢复目标场景三维信息的优点,被广泛应用于机器人定位与导航、工业测量以及医学图像处理等领域。立体匹配算法作为双目三维重建技术的核心,受到广大研究人员的关注。本文针对立体匹配算法抗噪声干扰能力差、在深度不连续区域匹配精度较低等问题,设计了一种基于改进局部立体匹配算法的室内场景三维重建系统。在匹配代价计算中,为了提高代价空间对噪声的鲁棒性,提出了一种融合的匹
学位
可靠的防伪手段对有效防范日益猖獗的假冒伪劣至关重要,具有物理不可克隆特点的防伪标签的制备和识别成为研究热点。本文基于原子层沉积技术制备随机褶皱图案作为防伪标签,并围绕标签的识别方法展开研究,旨在获得一种具有极高防伪性能的办法,具体研究内容和结果包括:(1)随机褶皱图案的制备工艺研究。采用丝网印刷制备PDMS图案,作为初级防伪标识;采用原子层沉积(Atomic Layer Deposition,AL
学位