论文部分内容阅读
视觉物体识别技术是人工智能领域的一个重要研究方向,是机器通过摄像机感知周边环境的基础。它可以在给定的图像或视频序列中识别出特定目标对象,其识别过程一般包含三个步骤:区域选择、特征表达和目标分类。传统物体识别方法往往依靠人工设计的特征,而基于深度神经网络的物体识别方法可以通过端对端的学习自动地获取物体特征的表达。基于深度神经网络的物体识别方法近些年来得到了迅速发展,其识别性能远远超越了传统物体识别方法,因而在安防监控、信息安全、智能交通、自动驾驶汽车、人机交互等众多领域得到了广泛的应用。本论文提出了深度卷积神经网络的多尺度模型参数共享机制与子块滤波器级联机制,分别用来提高神经网络的识别效率和识别准确度。在此基础上又提出了弹性非线性激活函数来进一步提升神经网络的识别准确度。总的来说,本论文取得了以下三项有意义的研究成果。1、在神经网络特征迁移方面,本论文提出了深度卷积神经网络多尺度模型参数共享方法。将该方法用于物体检测任务时,可以有效减少提取物体多尺度特征的计算量,从而提高物体检测速度。实验结果表明,本论文提出的物体多尺度模型参数共享方法可以在保证检测准确度的情况下有效地提高检测速度。2、在神经网络架构设计方面,本论文通过对卷积神经网络中卷积层的研究,提出了一种基于级联子块滤波器的卷积神经网络架构。该方法通过对局部图像块进行多级子块滤波变换来增强特征的表达能力,从而提升整个神经网络的识别性能。实验结果表明,该方法可以在不增加神经网络计算复杂度的情况下有效地提高物体识别性能。3、在神经网络激活函数方面,本论文提出了一种弹性非线性激活函数。神经网络的激活函数一般都是非线性函数,它是网络具备非线性建模能力的基础。该弹性非线性激活函数除了具备非线性变换功能之外,还可以被看作是一种随机正则化方法,可以有效地提升神经网络的泛化能力。实验结果表明,该方法能够在不增加网络参数情况下有效地提高神经网络的识别性能。