论文部分内容阅读
近些年来,目标检测在深度学习技术的加持下已经成为了感知智能在计算机视觉领域中的发展重点,并广泛应用在诸多领域中,同时为学术界和工业界列为研究热门。目标检测的发展在人们的生活中有着重要的社会意义,以其作为核心基础所衍生出的智能应用对人们的生活模式产生了重要影响。作为感知智能中视觉的重要基石,它在研究和应用过程中的问题与挑战成为了学术界所研究的重点课题,同时也从学术界的验证性研究转向工业界的实践性应用。针对目标检测现有的研究工作进行整理总结可以发现,当前目标检测在训练样本标签分配、特殊场景目标识别和物体表达形式方面的相关研究较多。虽然目标检测作为感知智能视觉领域中的基础研究课题发展多年,但在工业界不断深入实用化的过程中仍然面临着诸多问题和挑战。本文在工作中分析了当前目标检测的若干关键问题,总结了目标检测发展的路径及其当前的研究现状;并在此基础上,针对训练样本划分、复杂样本学习、样本的形式表达这三个关键问题进行了分析研究并给出了对应解决方案。本文的主要工作包含以下三方面:1.提出基于深度强化学习的训练样本自适应目标检测算法RTSA(Reinforcement Training Sample Adaptation):对于目标检测方法中正负样本类别不平衡引发的问题,训练样本划分的策略作为一个研究方向对于目标检测模型的性能产生了重大的影响,训练样本的合理划分可以使得目标检测模型更加专注于图像中的目标实例本身从而提升模型性能。作为被检测目标实例的前景,相比于背景在图像中的所占空间比例较低,密集预测作为当前目标检测所用的主要方式生成了大量的负训练样本,导致了模型训练效果更偏向简单的负样本而无法检测到应该关注的目标实例,这种问题在诸如医疗图像背景复杂物体实例规模小的专业应用上更加严重。为了解决这个问题,本文提出了一种基于深度强化学习控制的训练样本划分策略RTSA。在这种策略的支持下,正负训练样本划分的阈值将根据生成锚框集合的统计属性动态生成确定,并且可以通过深度强化学习控制下的智能体对负训练样本锚框进行形变操作来优化提升正训练样本比例,从而针对性的化解正负样本不平衡带来的难题。该工作中所提出的方法在腹腔镜医疗数据集上进行了验证,并通过消融实验进一步验证了方法不同设置对于方法性能表现的有效性的影响。2.提出了基于深度强化学习的旋转目标检测算法RL-RPN(Reinforcement Learning Region Proposal Network):旋转目标检测在背景信息含量高的图像中面临着背景干扰过多的问题,因此复杂样本学习作为一个研究方向对目标检测模型的性能有着重大的影响。水平目标检测对于任意朝向的目标进行检测时存在着边界框内冗余信息过多的情况,这导致了模型的网络训练需要更多的训练数据和时间来提升对干扰信息的鲁棒性。为了解决这个问题,该工作提出了一种基于深度强化学习控制优化的目标检测方法ORL-RPN,将目标检测任务由通常的回归问题转换为控制一系列分解图像检测动作的序列决策任务,通过引入强化学习机制,智能体可以采用动态的策略来对旋转目标进行精准采样。为了验证样本复杂性对于目标检测模型的影响,我们采用了专用的旋转目标检测数据集,并在这些数据集上进行对比实验。通过实验,本文验证了由旋转目标带来的样本复杂性对于目标检测的影响,并证实了所提目标检测方法ORLRPN的有效性。3.提出了基于深度强化学习的关键点目标检测算法RLRep Points(Reinforcement Learning Rep Points):图像中物体实例的表达方式在目标检测任务中作为一个关键研究主题,一直为学术领域的人所关注。样本的表达,即物体实例的表达方式的定义,决定了目标检测方法在模型上的设计和实现,对目标检测有着重要影响。受目标检测传统方法的影响,边界框在样本表达上一直占据着统治地位。人们通过框作为参照物,利用回归方法对目标实例进行预测,以达到将物体包含在边界框内的目的。但随着目标检测领域的发展,这种边界框的样本表达方式成为了目标检测方法性能提升的瓶颈,边界框只能表达出框内物体的分类信息和粗略的位置信息,且边界框的表达方式因为受限对于物体形状的表达而提升了图像位置搜索难度。为了解决这个问题,当前学术界发展出了基于关键点的表达方式来替代原本基于边界框的表达方式。但表达目标实例的关键点在分布方式和数量上仍然面临着次优问题,为此该工作提出了一种基于深度强化学习控制关键点表达的目标检测模型RLRep Points。通过实验,本文验证了在深度强化学习算法的优化下,对于样本进行表达的点自适应到最优状态和增强目标检测模型的稳定性。样本学习作为目标检测方法的重要环节,对模型性能的表现起到了关键作用。本文的工作从训练样本划分、复杂样本、样本形式表达这三个方面来分析样本学习对目标检测模型产生的影响,同时在现有目标检测模型的基础上加入深度强化学习模块,最终通过实验验证强化学习机制在目标检测任务中的有效性。