【摘 要】
:
小目标检测是目标检测领域一个颇具挑战性的分支,因图像分辨率较低或在空间上占据的像素数较少,这些目标的定位和分类的难度都大大增加了。在自动驾驶,视频监控,航拍等实际应用中,小目标在总的目标中占据大多数,这使得在主流目标检测数据集训练的模型在应用过程中,会存在域迁移的问题,导致较大的偏差。此外,由于以上领域对目标检测实时性的要求较高,出于速度和精度的折衷,多使用单阶段目标检测器。本文旨在提出具有可移植
论文部分内容阅读
小目标检测是目标检测领域一个颇具挑战性的分支,因图像分辨率较低或在空间上占据的像素数较少,这些目标的定位和分类的难度都大大增加了。在自动驾驶,视频监控,航拍等实际应用中,小目标在总的目标中占据大多数,这使得在主流目标检测数据集训练的模型在应用过程中,会存在域迁移的问题,导致较大的偏差。此外,由于以上领域对目标检测实时性的要求较高,出于速度和精度的折衷,多使用单阶段目标检测器。本文旨在提出具有可移植性的提升单阶段目标检测器的模块化方法,提升这些模型对于小目标的检测能力。本文探索了基于单阶段网络的小目标检测问题,在主流的单阶段检测网络Retina Net的基础上进行了研究。小目标检测的难点在于,需要高的空间分辨率来获得细粒度特征,同时也需要生成高质量的候选边界框。此文提出了几种创新的模块化改良方法,针对性地解决以上难题,增强了单阶段目标检测器Retina Net对于小目标的检测能力。我们将论文的贡献总结如下:第一点,在残差网络中增加了空洞卷积,在增大感受野的同时保留了图像细节,有利于小目标的判别与分类。第二点,提出了一种创新的特征融合方法,可以直接融合语义信息与低层特征。第三点,用ASL1损失函数作为边界框回归损失,这提升了原点附近损失函数的梯度,可以生成更高质量的候选边界框。在小目标数据集MOCOD进行验证,m AP相比原来获得了5.1的大幅提升。我们提出的方法可以很容易地迁移到其他具有特征金字塔结构的骨干网络,来增强它们检测小目标的能力。
其他文献
学者是科学研究的主体,是推动科技进步的重要贡献者。对学者进行影响力评价可以评估学者的科研水平、衡量机构的人才队伍建设情况以及发现学科领军人物,进而促进个人、机构和学科的良性发展。因此,如何构建一套有效公正的学者影响力评价体系成为学术评价界较为关注的话题。随着学者学术交流方式的变化,传统的以文献计量方法为代表的学者影响力评价方法逐渐展露局限性,新型学者影响力评价方式亟待被探寻。Altmetrics是
人工智能技术的发展给需要大量重复性劳动的客服行业带来了希望,用于客户服务的机器人客服应运而生,这一趋势改变了整个客服行业的劳动力结构和工作方式。电子商务领域是机器人客服应用最广泛的领域之一,不少主流电子商务平台引入甚至自主研发了服务于平台商家的机器人客服。然而,由于目前技术的局限性,机器人客服无法像人工客服一样灵活应对各种复杂的用户问题。业界目前的方法是让机器人客服和人工客服协同接待顾客,然而目前
2020年初,新冠肺炎病毒(COVID-19)疫情爆发,并迅速席卷全球。伴随着疫情的到来和扩散,民众的健康意识和健康素养水平逐渐提升,对于主动健康管理的诉求被进一步激发,越来越多的人尝试借助现代科技来实现更加精细和高效的运动健康管理。在这一背景下,智能可穿戴设备逐渐走入大众视野,被越来越多的人关注和使用。智能可穿戴设备作为一种高效便捷的健康管理终端,在自主运动健康管理、早期疾病的发现和预防中可以发
读者既是高校图书馆的服务对象,也是一种活态资源。在“以读者为中心”的图书馆发展理念与后疫情时代图书馆经费紧缩、采购模式转型的趋势下,读者参与高校图书馆文献信息资源建设成为一种必然。然而,国内高校图书馆的参与实践十分有限,主要以传统的读者荐购与新兴的“准读者决策采购”模式为主;读者荐购存在参与度不够、效率低下等问题;准读者决策参与模式则存在缺乏控制、过于分散等问题。理论研究方面,现有研究多从图书馆的
学术期刊作为学术成果发表的重要载体,是当下科学研究以及教育体系的重要组成部分,在个人评价、职位晋升、项目申请、机构评价等评价活动中扮演着重要角色。自学术期刊诞生以来,围绕学术期刊评价开展的研究已相当丰富。目前,期刊评价方法可分为两类,即基于定性分析的同行评议法以及基于定量分析的文献计量法。同行评议法通常选取特定领域的专家对其领域内的期刊质量进行评估,是当下期刊评价的主流方法。不过,同行评议也存在诸
随着我国综合国力的不断增强,整体的医疗服务能力以及医疗安全水准也在不断提高,然而医疗资源的供给不足与分配不均等问题仍然存在,医患矛盾仍在不断产生。众多研究表明,患者对于医生或医院提供的医疗服务不满意是导致医患矛盾的主要根源。而大批在线医疗社区相继出现,使得患者可以在远程享受医疗服务的同时对医疗服务进行自主评价,在线分享就医经验,由此产生了大量患者对医生和医院评价的在线医评信息,这些医评信息的合理利
动圈式扬声器单元是目前使用量最大的扬声器单元,是声系统设备中基础而重要的一环,其表现直接影响了声重放的质量。然而扬声器内生的非线性失真限制了它在低频的重放表现,劣化了音质。降低或控制失真带来的影响,是提升扬声器性能的重要课题,其核心是对非线性扬声器进行系统识别。本文给出了动圈式扬声器非线性系统识别方法,包含离散时间模型与对应的参数辨识算法。基于离散时间模型的输出信号,参数辨识算法可以对扬声器的非线
信息化时代为图书情报研究及发展不断提供机遇和挑战,也使数字资源得以骤增,给人文学者利用数字技术进行人文研究提供了便利,数字人文研究领域成为一门新兴学科,并逐渐成为现阶段的前沿研究领域。数字人文学科是一个典型的交叉学科领域,其具有创新性强的特点,一方面可以给人文学科的教研带来新方法,促进人文学科的知识传播与普及;另一方面可以使学者不再被基础工作所累,从而有更多的精力开展知识发现的研究。数字资源以其存
近年来,传统电子商务的流量红利逐渐减少,电子商务用户增速放缓,“直播+电商”的形式出现并被越来越多的消费者选择采纳。尽管采纳直播电商的消费者呈不断增长的趋势,但消费者对于直播电商每个环节的平均满意度并不高,并且消费问题频发。为了维护消费者权益,促进直播电商行业健康有序发展,把握消费者视角下的直播电商风险的构成具有重要意义。本研究通过对直播电商相关研究和电子商务消费者感知风险相关研究进行总结,发现目
档案馆作为收集、保管档案的机构,作为国家的公共文化事业单位,肩负着宣传历史、传承并弘扬传统文化的重担,有责任、有义务利用馆藏档案展开公众教育、传播科学文化知识。在各种档案利用服务中,展览是最为全面、生动、高效的方式。如今,档案馆充分意识到了展览的重要意义,在各个重要时间节点如火如荼地筹备办展,以期促进档案事业的发展,并为党和政府的中心工作服务。新《中华人民共和国档案法》(以下简称新《档案法》)明确