论文部分内容阅读
近年来,随着移动互联网、社交网络的快速发展,包括图像、视频在内的视觉数据快速增长。从这些视觉数据中提取有用信息仍是一个难题。之前人们试图通过传统机器学习算法来提取、利用这些信息,但是始终无法有效地解决该问题;深度卷积神经网络的出现为有效地解决该问题提供了方法。本文基于深度学习算法、局部弹性势能特征对目标识别方法、目标检测方法进行深入研究。本文主要工作以及结论如下:1.本文研究了Dense Net网络、Res Net网络等经典神经网络,并基于Dense Net网络和Res Net网络提出残差模块阵列来改进已有神经网络的识别精度。利用残差模块阵列,本文设计了二维卷积网络并用Tensorflow1.4.0实现之。本文从实验的角度将二维卷积网络与Res Net网络等经典网络在误识别率等方面进行了对比分析。实验结果表明二维卷积网络具有更低的误识别率。同时本文从实验的角度分析了残差模块阵列的深度、宽度以及增长数对二维卷积网络的识别性能的影响。仿真结果表明,适当地增加深度、宽度以及增长数可有效地提升二维卷积网络的识别性能。除了分析二维卷积网络在目标识别任务中的性能,本文还分析了二维卷积网络在目标检测任务中的性能,可视化结果和实验数据都表明二维卷积网络可提取出适用于目标检测任务的特征,在检测精度上优于Faster RCNN、SPPnet、SSD等经典目标检测算法。2.为了进一步改进二维卷积网络的识别精度,本文基于Dense Net网络和分组卷积方法设计了双路结构,双路结构主要包括主路结构和支路结构。本文从实验的角度将基于双路结构的神经网络与Res Net网络、Dense Net网络等经典卷积网络在误识别率、参数效率、计算效率等方面进行了对比分析。仿真结果表明,基于双路结构的神经网络仅增加少量参数即可实现明显优于Dense Net网络的识别精度。同时本文从实验的角度分析了增长数和融合方法对基于双路结构的神经网络的性能的影响。仿真实验结果表明增加增长数可有效地改善该网络的性能,不同的特征融合方法亦会对该网络的性能有所影响。此外,本文对该网络的抗过拟合能力作了分析,分析结果表明该网络具有良好的抗过拟合能力。同时本文通过计算平均L1范数的大小分析了支路结构是否在该网络中真正地发挥作用。仿真结果表明,支路结构在该网络中发挥了作用。随后本文分析了该网络在目标检测任务中的性能,可视化结果和数据分析表明,所提网络可提取出适用于目标检测任务的特征,优于经典的目标检测算法。3.本文对常用的传统特征描述子进行了研究。为了对传统的特征描述子的检测精度进行改进,本文引入局部弹性势能特征,并从理论上对其性质进行分析和论证。同时,基于凸优化方法提出了确定弹性系数的方法。同时设计了级联分类器,其中每个基分类器都采用了5个Ada Boost分类器。这些Ada Boost分类器是基于不同尺度的局部弹性势能特征向量训练所得。随后通过仿真实验对局部弹性势能特征的性能作了论证和分析。仿真结果表明局部弹性势能特征适用于目标检测任务。