【摘 要】
:
目标检测算法作为深度学习和计算机视觉领域最重要的研究方向之一,有众多的研究成果被相继提出。但是当这些算法被应用到实际的视频图像中检测时,检测效果往往不太理想。原因主要分为外源性和内源性两种,外源性原因是目标检测模型普遍在遇到低分辨率图像时检测准确度会大幅下降,而内源性原因是不同的目标检测算法本身的缺陷,导致模型在极端尺寸以及相似的密集分布目标等非常规类型检测对象上出现检测准确度大幅下降的情况。这些
论文部分内容阅读
目标检测算法作为深度学习和计算机视觉领域最重要的研究方向之一,有众多的研究成果被相继提出。但是当这些算法被应用到实际的视频图像中检测时,检测效果往往不太理想。原因主要分为外源性和内源性两种,外源性原因是目标检测模型普遍在遇到低分辨率图像时检测准确度会大幅下降,而内源性原因是不同的目标检测算法本身的缺陷,导致模型在极端尺寸以及相似的密集分布目标等非常规类型检测对象上出现检测准确度大幅下降的情况。这些问题正在成为推动目标检测模型应用的障碍。为了解决上述问题,本文主要开展了如下工作:(1)针对在低分辨率图片上目标检测精度受到显著影响的问题,提出了一种目标检测模型与超分辨率算法有机结合的方法。该方法首先设计了一种能以任意倍率对图像进行放大和缩小的反馈式超分辨率网络。其次,利用超分辨率网络能以任意倍率对图像进行放大和缩小的特点,在超分辨率网络与目标检测网络中间层之间建立信息通信,并进行联合训练,使超分辨率网络结构成为目标检测模型的一部分,从而提高目标检测模型在低分辨率图像上的检测效果。实验结果显示,目标检测模型在结合超分辨率算法前,在4倍及8倍下采样的视频图像上检测精度下降分别为8%以及24%,结合超分辨率算法后该降幅缩小为3%以及9%。(2)在上一个工作基础上,研究了如何在不额外增加网络结构的前提下,提升轻量级目标检测模型在低分辨率图像上的检测精度。本部分工作主要是提出了一种多尺度特征传递的知识蒸馏算法,该方法主要思路是分别在高分辨率和低分辨率图像上训练教师和学生网络模型,学生网络的中间层受到多层教师网络中间层的监督,使得学生网络学习教师网络的目标检测能力。同时设计了一种结合池化与全链接的网络结构,用于判断教师网络在监督时传递的知识哪些重要和冗余,以提高知识蒸馏的效率。实验结果显示,通过使用本文提出的多尺度知识蒸馏算法训练出的轻量级目标检测模型,在4倍和8倍下采样的视频图像数据集上的精度降幅从原来的14%和49%,缩小为了8%以及39%。(3)除了图像分辨率这种导致目标检测模型性能下降的外源性原因外,算法本身的缺陷导致模型在一些特定目标上检测效果下降的情况就是内源性原因了。例如,在极大以及极小等异常尺寸的目标上检测时,采用Anchor-Based路径实现的目标检测模型的检测精度下降明显。针对这一问题,本文提出了一种能够自适应学习Anchor大小的算法。该算法通过动态地为特征图上各个像素位置预测一个任意大小的Anchor的方式来实现目标检测任务。算法整体流程可以分为位置预测、特征过滤以及Anchor大小预测三个步骤,在进行检测时,只需要为有限数量的像素位置预测一个Anchor就能够完成目标检测流程,而不需要像普通Anchor-Based模型一样,为特征图上每一个位置都放置Anchor,大大减少计算负担。实验结果表明,本方法由于预测Anchor大小的不固定性,使得其能够向任意大小的目标进行拟合,使得模型在视频图像数据集上能够获得约3%左右的精度提升。(4)除了Anchor-Based模型的问题之外,部分使用Anchor-Free路径实现的目标检测模型,在实际应用中常常遇到的密集相似目标上也表现出检测效果不佳的问题。为此,本文提出了一种基于预测中心位置划分的关键点匹配算法。与部分Anchor-Free模型采用外观信息来匹配关键点的方法不同,本方法通过将预测关键点组成的框,与真实目标框之间的空间信息进行充分考虑的方法,来完成关键点的匹配和目标检测任务。在检测的过程中,一部分预测框能够找到与之中心距离相近的真实目标框,针对这类目标框设计一种损失函数,从而在这部分预测目标框上进行回归得到定位结果,并对其进行二次分类得到更准确的分类结果。而另一部分的预测目标框与任何真实目标框的中心点距离都较远,为此另外设计了一个损失函数,从而使得这部分预测目标框的数量尽可能少,并且让预测出的这类目标框也应该尽可能远离其他类型的目标框,以免对网络模型产生混淆。实验表明,使用基于预测中心位置划分的关键点匹配方式,能够让使用普通关键点匹配方法的模型提升5%左右的检测精度。
其他文献
众多实证研究表明,家庭社会经济地位是影响儿童汉语阅读能力发展的重要因素,然而已有研究结论存在分歧。采用元分析的方法,筛选出发表于2002-2022年的48篇实证研究并进行效应值统计,主效应检验结果表明,家庭社会经济地位综合指标及其各单项指标与儿童汉语阅读能力均显著相关。学段的调节效应检验结果表明,与小学阶段相比,学前阶段儿童父母的职业和家庭收入与儿童汉语阅读能力的相关关系更强;汉语阅读能力测量类型
热带太平洋地区在年际和年代际时间尺度上都存在显著的气候变率。当前,对年际厄尔尼诺与南方涛动(El Ni(?)o-Southern Oscillation,ENSO)现象的认识和理解为短期气候预测业务奠定了坚实的物理基础;然而,以往对年代际变率的研究大多着眼于热带外少数几个统计主导模态,对热带区域的关注度较少。热带太平洋年代际变率作为太平洋年代际变率的重要组成部分,其关键时空特征及主导物理过程目前并
良好的溶解度是口服固体制剂药效发挥的前提条件。目前,40%的上市药物和75%的候选药物是难溶性药物,这限制了它们的口服吸收和治疗效果。因此,如何改善难溶性药物的溶解度是药物研发人员面临的主要问题。药物共晶通过引入共晶配体,修饰药物的晶体结构以改善其理化性质,具有结构可调、性质可控的优势而被广泛应用于制药领域。本文通过共晶技术提高了难溶性药物阿昔替尼的溶解度;通过制备吉非替尼和中药活性成分药物-药物
低温等离子体由于高电子温度,低气体温度的特性,在医疗手术、杀菌消毒、伤口愈合及材料表面处理等领域被广泛研究。微波等离子体相比传统的高压直流或射频等离子体具有更好的安全性,更高的电子密度等优异性能,受到越来越多的重视。特别是固态微波器件的发展,使得低温微波等离子体系统可以大幅缩小体积,实现可手持,从而进一步扩展了低温微波等离子体系统的应用前景。低温微波等离子体系统,主要包括了微波源及传输线,阻抗调配
随着脉宽调制(Pulse Width Modulation PWM,)技术的广泛应用,电机驱动系统的传导与辐射电磁干扰更加明显。在电子设备密集的封闭空间,大功率电机产生的高强度电磁辐射会严重影响敏感元器件的电气性能,降低设备可靠性。为了定量评估电机驱动系统的辐射危害,需要准确预测系统电磁辐射强度,以采取整改措施对辐射干扰进行有效抑制。为此,本文开展了PWM电机驱动系统的辐射干扰预测方法研究,具体内
光学频率梳是指一系列离散的、等间隔分布的且具有稳定相位关系的频率分量组成的光谱。自2005年获得诺贝尔物理学奖以来,其前所未有的测量能力为精密测量领域带来了变革性的技术革新,在天文学、微波光子学、精密光谱学、原子钟、分子指纹测量、通信和传感等领域展现出了巨大的应用潜力。光学频率梳主要包含光纤激光频率梳、电光频率梳和基于微腔的克尔频率梳。与激光频率梳和电光频率梳需要额外的饱和吸收体或电光调制器不同,
随着计算力的提升,机器智能的发展,人类能够利用海量的信息训练模型。然而,机器想要准确地利用信息,需要准确的标注信息,否则杂乱的信息与噪声无异,学习模型的任务也无从谈起。同时,人们所拥有的少量标注数据和将要被处理的未标注数据,有时只是在观感上相似,实际却并不属于同一个概率分布。在这种情形下,传统的基于同分布的监督学习,无法解决标注数据与未标注数据的分布差异。如果无视分布差异,将标注数据学习到的模型强
D-T聚变由于原料资源充足、安全可靠且不会产生大量废弃物,被认为最有希望彻底解决人类的能源问题。为了达成这一目的,中国、欧盟、美国、韩国、日本、俄罗斯和印度合作签署了影响深远的能源项目,共同建设世界最大的磁约束聚变设施,即国际热核聚变实验堆(International Thermonuclear Experimental Reactor,ITER)。我国为了弥补 ITER 和聚变示范堆(Demon
上转换发光生物传感器以上转换纳米颗粒(Upconversion Nanoparticles,UCNPs)为标记物,主要由上转换纳米探针、免疫层析试条和上转换检测仪组成。上转换发光生物传感器具有操作简单、反应快速、灵敏度高、稳定性好等优点,在疾病诊断、食品安全、环境保护和国家安全等领域具有广阔的应用前景。本文以上转换发光生物传感器检测大分子心肌标志物——心肌肌钙蛋白I(Cardiac Troponi
本研究采用亲子互动和情绪社会性量表对哈尔滨市139个家庭施测,将亲子互动分为亲密回应性和引导性两个维度,将情绪社会性分为外显行为域、内隐行为域、失调域和能力域四个维度进行考察。研究结果显示:亲子互动的亲密回应程度可预测婴幼儿外显行为域和能力域得分,即父母的亲密回应程度越高,婴幼儿的外显行为问题越少,且能力越强;独生状况是亲密回应性与外显行为域的调节变量,且独生子女家庭的亲密回应程度越高,婴幼儿的外