论文部分内容阅读
目标检测是计算机视觉领域一个热门问题,它不仅广泛地应用于工业检测和智能驾驶等实际场景,也对解决人脸检测和实例分割等更复杂的视觉问题有着重要的作用。
近年来,随着深度学习的发展,深度神经网络凭借其强大的特征提取能力和优异的表现性能被广泛地应用于目标检测任务当中,诞生了一些经典算法,并在相关领域展现出了巨大的应用价值。然而,尽管目标检测算法已经取得了巨大的成功,却仍然在尺度变化、采样等方面存在着巨大问题:第一,目标尺度的变化对特征融合问题提出了新的要求。但是,常见的特征融合方法缺少对特征的选择,融合方式较为简单,不同层次特征间信息传递困难,有一定局限;第二,无锚框目标检测算法近年来成为新的研究热点。但是,由于无锚框检测算法发展并不成熟,仍然存在着边缘样本质量不佳、损失函数无法差异化处理某些场景等弊端。这些问题限制了算法性能的进一步提升。
为了解决上述问题,本文提出了一种用于特征增强的基于注意力机制的全内联特征金字塔网络,并在多任务、损失函数设计和采样策略等方面进行改良,得到了一个优异的无锚框检测器,本文主要工作如下:
1、提出了基于注意力机制的全内联特征金字塔网络IFPN,用于特征增强。它可以在特征融合时实现良好的特征选择,并使得不同层次的特征可以自由地融合。此外,它可以同时作用于基于锚框与无锚框的检测算法,迁移性较好。
2、提出了一种基于中心采样的目标检测算法C-FCOS。它使用更加准确的复合置信度来指导非极大值抑制过程,同时采取基于收缩初始化和动态权重的改进损失函数,并使用边缘过滤的中心点采样策略来提高样本的质量。
3、本文对模型输入进行了优化,并使用加速库进行数据预处理和推理的加速,从而极大地提高了算法的实时检测速度,增加了算法的实用性。
本文涉及到了基于锚框的多阶段和单阶段检测算法,以及最新的无锚框检测算法,并在MS COCO数据集上进行了大量的实验,证明了IFPN的有效性库与C-FCOS的良好效果。在此基础上,本文改进了算法的效率,具有广泛的应用价值。
近年来,随着深度学习的发展,深度神经网络凭借其强大的特征提取能力和优异的表现性能被广泛地应用于目标检测任务当中,诞生了一些经典算法,并在相关领域展现出了巨大的应用价值。然而,尽管目标检测算法已经取得了巨大的成功,却仍然在尺度变化、采样等方面存在着巨大问题:第一,目标尺度的变化对特征融合问题提出了新的要求。但是,常见的特征融合方法缺少对特征的选择,融合方式较为简单,不同层次特征间信息传递困难,有一定局限;第二,无锚框目标检测算法近年来成为新的研究热点。但是,由于无锚框检测算法发展并不成熟,仍然存在着边缘样本质量不佳、损失函数无法差异化处理某些场景等弊端。这些问题限制了算法性能的进一步提升。
为了解决上述问题,本文提出了一种用于特征增强的基于注意力机制的全内联特征金字塔网络,并在多任务、损失函数设计和采样策略等方面进行改良,得到了一个优异的无锚框检测器,本文主要工作如下:
1、提出了基于注意力机制的全内联特征金字塔网络IFPN,用于特征增强。它可以在特征融合时实现良好的特征选择,并使得不同层次的特征可以自由地融合。此外,它可以同时作用于基于锚框与无锚框的检测算法,迁移性较好。
2、提出了一种基于中心采样的目标检测算法C-FCOS。它使用更加准确的复合置信度来指导非极大值抑制过程,同时采取基于收缩初始化和动态权重的改进损失函数,并使用边缘过滤的中心点采样策略来提高样本的质量。
3、本文对模型输入进行了优化,并使用加速库进行数据预处理和推理的加速,从而极大地提高了算法的实时检测速度,增加了算法的实用性。
本文涉及到了基于锚框的多阶段和单阶段检测算法,以及最新的无锚框检测算法,并在MS COCO数据集上进行了大量的实验,证明了IFPN的有效性库与C-FCOS的良好效果。在此基础上,本文改进了算法的效率,具有广泛的应用价值。