【摘 要】
:
近年来,由于数据量的快速增长和计算机性能的发展,深度学习已经广泛应用于许多领域,包括安防监控、计算机视觉和推荐系统等场景。目标检测是机器视觉领域中的重点研究方向之一,不断地改变着人类的生活方式,在智慧医疗、异常事件检测和交通流量监控等方面有重要的研究价值。YOLOv5s作为目前最流行的目标检测器之一,存在特征表达能力不足的问题。针对该问题,本文设计了一种基于特征优化的目标检测方案,提出了一种基于特
论文部分内容阅读
近年来,由于数据量的快速增长和计算机性能的发展,深度学习已经广泛应用于许多领域,包括安防监控、计算机视觉和推荐系统等场景。目标检测是机器视觉领域中的重点研究方向之一,不断地改变着人类的生活方式,在智慧医疗、异常事件检测和交通流量监控等方面有重要的研究价值。YOLOv5s作为目前最流行的目标检测器之一,存在特征表达能力不足的问题。针对该问题,本文设计了一种基于特征优化的目标检测方案,提出了一种基于特征增强和注意力机制的新型目标检测器(Feature Enhancement and Attentional Mechanism Detector,FEAMD),增强了特征的表达能力,提升了通用目标检测器的检测性能。本文的主要工作如下:(1)为了丰富目标检测器的特征空间,本文提出了基于CBMA的空间特征增强模块(Center and Scale Prediction with Spatial Enhancement,CSPSE)。CSPSE模块通过平均池化、1×1卷积和顺序卷积(1×1卷积和3×3卷积)组合的四种不同分支结合BN层进行相加,提供了丰富的上下文特征,扩大网络的感受野。CSPSE模块很好地利用了多样性的连接和训练时间非线性,增强特征的空间表达能力的同时没有增加额外的推理时间,提升了检测的性能。(2)为了更好地捕获网络中的通道信息和空间信息,增强网络的特征表示能力,本文提出了一个基于通道和空间信息的注意力机制(Coordinate Attention with Meta-ACON,CAMA)。为了避免空间信息的丢失,CAMA将全局池化分解为水平和垂直两个方向的池化操作。通过这种方法既可以获取空间上的依赖关系,又可以获取较为丰富的位置信息,最后沿着这两个方向融合特征,使得特征的表达能力加强。(3)为了进一步优化FEAMD模型的检测性能,本文设计了一种基于FEAMD的知识蒸馏方案FEAMD-dis,提出了一种具有MSE蒸馏损失的直接logit匹配方案,促进FEAMD模型更充分地利用特征信息进行检测。通过更复杂的教师网络对FEAMD进行知识蒸馏,FEAMD-dis可以学习到更丰富的特征信息,减少出现错检和漏检的问题,在保持速度的同时FEAMD-dis精度进一步提升。
其他文献
目前监控视频被越来越广泛的使用在政府、教育、文娱、医疗等领域,因此监控视频中的运动目标识别与跟踪研究这一课题具有非常重要的意义和价值。针对目前运动目标识别与跟踪算法中存在准确性和实时性难以平衡的状况,本文对目标检测、跟踪算法、空间信息、外观信息以及数据关联方面进行深入研究,分别设计了监控视频的目标检测算法和目标跟踪算法。本文主要完成以下几个方面的任务:首先,本文完成目标检测算法的设计。对比分析了主
随着虚拟现实和增强现实等计算和数据密集型应用的发展,对网络的服务能力提出了更高的要求。传统的云计算将计算任务卸载到远端数据中心导致整个任务的处理时延难以得到保证,因此移动边缘计算应运而生。移动边缘计算将计算和存储放到网络边缘进行,边缘缓存可以通过存储内容来降低用户访问延迟和减少核心网的流量压力。然而,移动边缘缓存网络是个复杂的缓存系统,理论建模和分析非常复杂,这使得实施高效的移动边缘网络缓存系统配
针对传统米波天线单元带宽窄、尺寸大的问题,设计一种新型全金属结构的Vivaldi天线单元形式,该天线单元结构紧凑、体积小巧;经仿真设计、参数优化、实物验证、组阵测试等过程,验证其性能满足工程应用。
航空发动机的装配是航空发动机制造的最后一个阶段,也是对整机性能和系统功能进行验证的手段。发动机装配过程不是零件简单地堆积,而是按规定的技术标准、要求将若干个零件、部件、组件、单元体、附件装配成整机。航空发动机装配水平的高低对飞机性能、企业生产效率及效益均有着重要的影响,因而对于航空发动机装配车间生产计划与调度优化问题进行研究具有十分重要的意义。影响航空发动机装配效率的不确定性因素有诸如需求变化、生
深度学习技术在医学图像领域中的应用广泛,但医学图像数据的私密性和病理图像的稀缺性,使得大数量级样本深度学习方法的应用受到极大制约。基于传统图像处理的数据集扩充方式合成的图像数据冗余度较高。生成对抗网络(GAN)与其变体模型采用了对抗学习方法,利用编码映射的方式表达数据集的样本分布,在多种真实数据集的生成质量与多样性上超越了基于传统图像处理的数据扩充方法。然而由于传统GAN模型本身学习动力不足与某些
红外目标检测技术是红外搜索与跟踪系统中的一个基本功能,在红外预警、制导和反导等领域具有举足轻重的作用。目前的检测算法存在检测目标失真、不能很好地抑制稀疏边缘和噪声等问题。近年来,张量恢复理论逐渐被应用于红外目标检测,取得了良好的效果。而结构张量作为一种新的图像局部结构表征方法,可以用来提取目标和背景的特征,作为张量恢复的补充,融合进红外目标检测方法中。基于这一思路,本文结合局部结构张量提取先验信息
心脏振动描记(Seismocardiography,SCG)是一种用于记录和分析心脏运动过程中产生的微弱振动的技术,其波形的基准点可以有效地反映如主动脉瓣打开、二尖瓣打开、等容收缩等心脏微动事件。与现有心脏检测技术心电图相比,心脏振动描记有着同样的医疗价值,甚至在某种程度上它比心电图所反映的心动状态信息还要更加丰富。但是在过去的几十年由于检测设备的笨重以及检测算法的精度限制,心脏振动描记没有得到有
经过几代航天科技工作者们60多年的不懈奋斗,我国已跻身世界航天大国行列。随着载人航天、空间探索的不断深入以及航天任务的多样化,作为地空运输主要载具的运载火箭也在不断革新,新一代运载火箭被世界各国提上发射日程。我国新一代运载火箭大多是采用液体推进剂的中重型运载火箭,相比于传统火箭,其运载能力高,结构更加细长且采用多个助推器与芯级发动机并联参与姿态控制,这使得箭体动力学特性更加复杂,参数不确定性和刚体
随着现代社会的飞速发展,精密测量技术在军事、工业及医学等各大领域发挥着越来越重要的作用,而传统的脉冲法以及相位法等测量技术由于各自的缺陷较难满足高精度与高灵敏度的测量需求。调频连续波(Frequency Modulated Continuous Wave,FMCW)激光测量技术具有灵敏度高、精度高、抗干扰能力强等优点,成为近年来精密测量领域的研究热点。本文以FMCW激光测距为基础,以提高测距分辨率
特发性肺纤维化是成人最常见的一种间质性肺疾病,患者预后性较差,中位生存期为3-4年。对特发性肺纤维化进行早期诊断,可以引导抗纤维化治疗,从而延长患者生存期,减少急性恶化。现有的人工诊断方式,需要医生具有较高的专业知识和丰富的临床经验,并且阅读大量数据对医生的注意力和精力来说是个很大的挑战。目前学术界特发性肺纤维化自动检测相关研究较少,尚无可用在临床上的计算机辅助检测系统。特发性肺纤维化病变区域大小