论文部分内容阅读
在图像分类、目标检测以及人体姿态识别领域,传统的卷积神经网络由于其计算复杂度过高、模型尺寸较大等不足,使得卷积神经网络技术很难部署到移动终端中。为了克服这些困难,研究人员提出了基于移动终端的卷积神经网络。该网络通过采用效率较高的卷积方式来适配计算能力以及存储空间受限的移动终端设备。虽然在图像分类领域,基于移动终端的卷积神经网络已经取得不错的成果,但是在目标检测以及人体姿态识别领域,依然存在着前向运算速度较慢的问题。为了解决上述问题,本文重点研究了基于移动终端的轻量级卷积神经网络。首先,本论文在目标检测以及人体姿态识别领域,重构了一组基于移动终端的轻量级卷积神经网络架构,构造方式如下:1)使用深度可分离卷积替换常规卷积。深度可分离卷积是一种轻量级的卷积计算技术,它是将常规卷积在空间维度进行分离,这一技术不仅降低了卷积操作的计算复杂度,而且减少了参数数量,因此它是一种效率较高的卷积方式;2)将不同层级特征图进行融合。由卷积神经网络的特性所决定,不同层级的特征图所表达信息是不同的,因此通过融合不同层级的特征图信息,可以有效提高神经网络的表达能力;3)近似线性层的引入。由于传统的校正线性模块对负值不响应,当输入数据维度较低时,输出数据丢失比例较为严重,因此本文引入了一种近似线性模块,该模块不仅减少了数据信息丢失比例,而且保证了神经网络的非线性特性;4)批规范化层的等效替换。批规范化层在前向运算过程中的运算方式可以通过修改相关卷积层的偏置参数来等效替换。通过这样的替换方式,可以减少卷积神经网络的计算量。然后,为了进一步加快模型的前向运算速度,本论文设计并实现了基于移动终端的轻量级卷积神经网络的并行加速平台,其主要工作内容如下:1)通过多线程技术对卷积神经网络的前向运算进行加速。由于卷积计算非常易于并行化,并且当前移动终端的处理器核心数都在不断增加,通过多线程编程技术可以对多核进行充分调度,减少卷积操作耗时,提升前向运算速度;2)通过单指令多数据技术加速卷积神经网络的前向运算。单指令多数据技术是一种在单个指令周期内处理多组数据的指令集集合。通过该项技术,可以有效提高处理器的数据吞吐量,减少内存开销,进一步减少了前向运算时间。最后,根据实验可知,本论文重构的基于VOC数据集的目标检测算法比Google在2017年提出的MobilenetV1-SSD算法在VOC07 VAL数据集的mAP值上提升了2.3,运算速度提升了5%左右。本论文重构的基于COCO数据集的目标检测算法比MobilenetV1-SSD算法运行速度提升了15%左右,在COCO2017 test-dev数据集上的mAP比MobilenetV1-SSD算法高了0.1个百分点。本论文重构的人体姿态识别算法比OpenPose算法运算速度提升了10倍,模型尺寸减少了近7倍。基于它们在移动终端优良的表现,可以将这一组轻量级卷积神经网络算法应用在智能机器人或者无人机等产品中。