论文部分内容阅读
目标检测技术是机器人通过视觉感知外界信息并与外界交互的关键技术之一,是机器人实现场景理解等高阶视觉任务的基础。本文对现有的目标检测算法进行了探讨与研究,重点研究了基于卷积神经网络的目标检测算法,具体研究内容包括:卷积神经网络的结构与优化方法、基于卷积神经网络的特征提取网络、目标检测算法的改进与实验评估。首先对卷积神经网络的典型结构进行深入分析,构建了一种典型的卷积神经网络模型。在构建的卷积神经网络模型基础上对卷积神经网络的激活函数、迭代算法、以及卷积神经网络的正则化方案进行了研究,并通过实验在CIFAR-10数据集上进行了验证。其次,在对Vgg16网络模型研究的基础上,提出了一个计算量与参数规模均大幅减少的图像分类模型,并通过ImageNet数据集加以训练。在该测试集中获得了72.4%的分类正确率,可以验证,此模型在计算量以及参数规模大幅降低的情况下依然可以获得和现有模型相当的图像分类正确率,为提高目标检测的实时性奠定了基础。最后在提出的图像分类模型的基础上结合SSD目标检测模型提出了一种改进的目标检测模型,并使用PASCAL VOC数据集对其进行了训练与评估,结果表明提出的改进模型相比SSD目标检测模型在检测精确率相差不大的情况下,大幅提高了实时性,为机器人视觉感知系统智能化的研究奠定了良好的基础。本文方案在不降低精确率的情况下通过降低特征提取网络的计算量与参数规模等方式对SSD目标检测模型加以改进,研究内容对加速提升机器人的智能化程度具有较重要的意义。