论文部分内容阅读
大数据时代的到来和计算机计算能力的迅速提高,促进了图像识别技术向着更先进的方向发展,基于深度学习的图像识别技术已经成为当前人工智能领域的研究热点。卷积神经网络作为深度学习的算法之一,在图像识别领域由于其性能表现优越已经被广泛使用。与传统图像识别方法相比,卷积神经网络不再需要人工选择特征,它能够自行学习归纳出可以表示图像信息的特征,取得的图像识别率有的持平于甚至已经超越了人类的肉眼识别水平。在如今大数据时代背景下,面对海量图像的识别和分类,卷积神经网络显然是比较好的选择。卷积神经网络可以有几亿个参数,比如在大规模视觉识别挑战赛中表现较好的卷积神经网络AlexNet、VGGNet、GoogLeNet等,这些网络需要训练大量的参数,不仅对计算平台要求高,而且需要大量的图像数据。在诸如Caltech-256和Food-101这种小规模图像数据集上直接训练这些复杂的网络是不现实的,它们无法给这些大规模网络提供足够的参数学习空间。虽然可以采用迁移学习的方法将这些网络应用于小规模图像的识别,但是这些网络层次往往比较深,网络也比较复杂,参数量也比较多,无法部署在一些硬件平台较低的环境。针对这个问题,本文设计了能够兼顾模型大小和准确率的卷积神经网络,适用于小规模图像的识别,方便部署在一些硬件平台较低的环境。本文的主要研究内容与创新点如下:(1)总结卷积神经网络的优化方法和防止过拟合技术,分析经典卷积网络的设计方法,期望用更精简的网络参数和模型规模达到在小规模图像识别中同类方法的准确率水平,甚至超越同类方法。(2)设计轻量型和超轻量型的卷积神经网络,在选定的小规模图像数据集上评估所设计网络的性能并和现存方法进行对比,以此来说明所设计的网络在小规模图像识别上具有的优势。(3)以经典的ALexNet网络为改进基础,采用并行卷积结构设计了基于跃层连接的并行级联型卷积网络用于小规模图像识别。并行卷积是利用不同尺度的卷积核并行提取特征,并将不同尺度提取到的特征进行级联融合。为了进一步提升准确率,通过添加跃层连接优化网络,在Caltech-256和Food-101数据集上评测了网络性能。结果表明,与经典AlexNet网络相比,基于跃层连接构建的网络RPCNet分别提高了6.12%和12.28%的准确率,并且该网络规模仅为ALexNet网络的1/15。(4)面向大分辨率的小规模图像数据集设计了基于分组残差结构的轻量型卷积神经网络架构GResNet。其核心是利用三个卷积层的瓶颈结构将上层输出特征图分为数量相等的四组,并分别在组内的瓶颈模块和组外相邻模块加入了残差映射,从而设计了轻量型卷积神经网络。实验阶段,在小规模数据集Caltech-256、Food-101和GTSRB上评测了网络的性能。实验结果表明,与传统卷积神经网络相比,GResNet能在网络参数较少的情况下,具有同样、甚至更优越的识别性能,适合部署在一些硬件平台较低的环境。(5)面向小分辨率的小规模图像的识别设计了超轻量型卷积神经网络架构。方法是利用所设计的二维分解卷积和深度可分卷积结构对基准网络BasictNet进行优化。实验阶段,在Cifar10和Fashion-mnist数据集上评估了网络性能。结果表明,与基准网络BasictNet相比,基于二维分解的卷积网络TwoNet在准确率上分别提高了1.08%和0.32%;基于深度可分的卷积网络DwNet,计算量是BasictNet的1/3,但是在两个数据集上只损失了1.43%和0.32%的准确率,网络的模型大小不足2M;与之相对的去除了深度可分操作的多尺度网络DwNet+Ms可以提升1.35%和0.56%的准确率。与现存的一些网络模型相比,这些网络能够以不足1M的参数量达到一些先进网络的识别精度,并将模型规模降低了100倍以上,具有一定的应用价值。