基于特征增强与中心采样的无锚框目标检测算法研究

来源 :东南大学 | 被引量 : 0次 | 上传用户:fdazhyy
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
目标检测是计算机视觉领域一个热门问题,它不仅广泛地应用于工业检测和智能驾驶等实际场景,也对解决人脸检测和实例分割等更复杂的视觉问题有着重要的作用。
  近年来,随着深度学习的发展,深度神经网络凭借其强大的特征提取能力和优异的表现性能被广泛地应用于目标检测任务当中,诞生了一些经典算法,并在相关领域展现出了巨大的应用价值。然而,尽管目标检测算法已经取得了巨大的成功,却仍然在尺度变化、采样等方面存在着巨大问题:第一,目标尺度的变化对特征融合问题提出了新的要求。但是,常见的特征融合方法缺少对特征的选择,融合方式较为简单,不同层次特征间信息传递困难,有一定局限;第二,无锚框目标检测算法近年来成为新的研究热点。但是,由于无锚框检测算法发展并不成熟,仍然存在着边缘样本质量不佳、损失函数无法差异化处理某些场景等弊端。这些问题限制了算法性能的进一步提升。
  为了解决上述问题,本文提出了一种用于特征增强的基于注意力机制的全内联特征金字塔网络,并在多任务、损失函数设计和采样策略等方面进行改良,得到了一个优异的无锚框检测器,本文主要工作如下:
  1、提出了基于注意力机制的全内联特征金字塔网络IFPN,用于特征增强。它可以在特征融合时实现良好的特征选择,并使得不同层次的特征可以自由地融合。此外,它可以同时作用于基于锚框与无锚框的检测算法,迁移性较好。
  2、提出了一种基于中心采样的目标检测算法C-FCOS。它使用更加准确的复合置信度来指导非极大值抑制过程,同时采取基于收缩初始化和动态权重的改进损失函数,并使用边缘过滤的中心点采样策略来提高样本的质量。
  3、本文对模型输入进行了优化,并使用加速库进行数据预处理和推理的加速,从而极大地提高了算法的实时检测速度,增加了算法的实用性。
  本文涉及到了基于锚框的多阶段和单阶段检测算法,以及最新的无锚框检测算法,并在MS COCO数据集上进行了大量的实验,证明了IFPN的有效性库与C-FCOS的良好效果。在此基础上,本文改进了算法的效率,具有广泛的应用价值。
其他文献
近年来,以机器人为代表的智能制造掀起了世界范围内生产技术领域的风暴。物联网、大数据、云计算、人工智能等信息技术的重大突破,使得机器人的应用范围从工业制造向医疗健康、军事、农业等领域不断扩展。有着中国版“工业4.0”规划之称的《中国制造2025》将机器人产业列入重点战略,但是因为机器人产业涵盖了机械、电子、传感检测、计算机、生命科学等多个学科,对机器人设计提出了较高的要求。  目前,基于知识图谱的问
学位
随着计算机网络控制技术的发展,控制设计人员不仅要解决底层设备的实时控制问题,还要解决上层数据集成管理所带来的综合自动化问题。港口调度与管理是保证港口装卸作业按计划组织实施而进行的一系列部署、指挥、检查、监督、协调和平衡的总称,直接影响企业的经济效益。本文针对我国某内陆港口生产作业环节多,作业流程复杂,建立了散杂货码头和油港码头多资源协同调度优化问题的数学模型,对四种现代启发式求解算法进行了实验研究
随着通信、计算机和人工智能相关技术的发展,以及任务场景复杂度的加深,多智能体(Multi-agent)系统的编队包围控制已经成为了一个热门的研究领域。多智能体的编队包围控制要求智能体的状态保持一致,并且系统对特定感兴趣的目标形成一定的编队队形。目前,基于测量的编队包围控制存在以下问题:忽略了部分智能体不能够测量到与目标间的相对位置信息这种情况。而在该情况下,已有的编队包围控制器难以满足编队包围的要
学位
随着科技的迅猛发展和信息化时代的到来,图像描述生成任务在跨模态内容检索、人机交互、机器人导航等研究领域和电子商务、儿童教育等应用领域具有深远的研究意义和广阔的应用价值。传统的图像单句话描述生成模型由于单句话涵盖能力有限具有细节描述缺失和个体偏差的问题,密集字幕生成模型由于分立短语关联性弱具有物体间关系缺失和无法高效人机互动的问题,故本文将研究重点放在段落级的图像描述生成上,旨在解决上述问题,生成细
学位
近年来,生物特征识别技术已经受到越来越多的研究和关注,它可以为我们提供一种有效且可靠的个人身份识别方法。作为一种相对较新的生物特征,掌纹识别由于具有分辨力强、对用户友好、特征丰富等特点近来受到越来越多的国内外学者的关注。虽然二维掌纹识别具有易于采集、成本低的优点,但是二维掌纹图像容易受光照变化、角度翻转以及表面脏污的影响且可能被伪造的假手掌欺骗。三维掌纹识别技术在一定程度上克服了上述二维掌纹识别技
学位
闸机作为城市轨道交通线网运营管理中重要的交互设备之一,其通行控制的性能直接关系到乘客的出行体验和企业的票务收益。随着城市轨道交通迈入“网络化运营”时期,城市轨道交通承担着越来越繁重的城市客运工作。现有的基于红外传感器的闸机乘客通行行为识别算法已经难以满足复杂场景下的检测需求。如何高效地提取出更为完整的乘客通行时的姿态特征,从中检测并识别出乘客的通行行为,以避免客流量较大时的各种问题和风险,具有重要
学位
随着科学的发展和技术的进步,人工智能成为最热门的科技话题之一,越来越多的人工智能产品从理论研究走向实际应用。家庭生活的各个角落也都出现了人工智能的踪迹,从手机到电视,从音箱到冰箱,从扫地机器人到服务机器人,人们的生活发生了翻天覆地的变化。语音交互作为一种重要的人机交互形式,常被用到智能家居中。为了使智能家居产品实现更加自然、高效的人机交互,让其能够感受和分辨人的情感,家庭环境中语音情感识别的实现具
随着计算机技术的飞速发展,深度学习技术在各领域的应用日益广泛,但是对抗样本的出现,给人工智能安全领域敲响了警钟。研究表明:深度神经网络具有天然的漏洞,非常容易受到对抗样本的攻击。精心设计的对抗扰动可以让图片产生人眼难以辨别的差异,但却会令神经网络面模型做出错误的分类。早期的对抗攻击技术仅局限于数字世界中,近几年,以对抗补丁为代表的对抗攻击技术正向物理世界中发展,攻击的目标也由分类模型向目标检测模型
学位