基于深度学习的视频小目标检测算法研究

来源 :贵州大学 | 被引量 : 0次 | 上传用户:fanjolly
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着计算机视觉技术的不断发展,目标检测技术已经广泛应用于自动驾驶、视频监控、人机交互、人脸检测等领域,受到学界与工业界的密切关注。传统的目标检测技术其特征多为手工设计,工作量巨大,算法鲁棒性较差,不能满足实际场景下的视频小目标检测需求。而基于深度学习的目标检测技术能够根据不同场景自适应提取图像特征,达到更好的检测效果。因此,研究基于深度学习的视频小目标检测技术具有极其重要的理论意义和应用价值。针对小目标尺寸较小、分辨率低、特征不明显问题,提出一种基于改进FPN和空间金字塔池化的小目标检测网络。改进原网络中的FPN结构,增大网络的预测尺度,同时,在检测层前加入空间金字塔池化模块。实验结果表明,改进后的YOLOv3网络其检测精度在三个尺度下分别提升8.3%,6.1%,4.3%,在FPS变化不大的情况下,召回率和准确率都有明显提升。针对小目标样本分布不均匀、正负样本不平衡、深层特征信息较少问题,提出一种基于改进密集连接和分布排序损失的小目标检测网络。使用Stitcher数据增强解决小目标样本分布不均匀的问题,提出一种新的基础网络VOVDarknet-53后,改进YOLOv3中的分类损失函数。实验结果表明,改进后的YOLOv3算法对小目标和中目标的检测精确度分别提升了7.2%、2.1%,在平均单张图片处理时间几乎不变的情况下,平均检测精度(m AP)提升4.1%。针对实际场景下小目标检测算法部署算力缺乏、资源不足的问题,提出一种基于改进通道和层剪枝的模型剪枝方法,通过设置自适应局部安全阈值以改进通道剪枝,同时通过综合评价整个残差结构的方法进行层剪枝,并将模型剪枝方法用于小目标检测。实验结果表明,剪枝后的模型其检测性价比更高,更适合实际场景下部署小目标检测。
其他文献
随着影视行业的飞速发展,网络平台已成为大众获取影视信息的重要手段,但普遍存在信息过载的问题。个性化电影推荐可以帮助用户过滤冗余数据,从海量影视信息中获取高质量的电影信息,发掘感兴趣的电影。传统的推荐算法在解决数据稀疏和冷启动问题上仍有很大的改进空间,所以在推荐算法中使用一些辅助信息改善上述问题成为如今推荐系统研究的热点。知识图谱作为一种新兴的辅助方法,为推荐系统的改进提供了新途径。因此,本文针对电
本文通过研究传统推荐算法存在的不足,针对商品个性化推荐的特殊场景,提出离线推荐与实时推荐相结合的混合推荐算法,从而有效地解决推荐系统中存在的数据稀疏性、实时性和冷启动等问题。本文主要的研究内容如下:(1)离线推荐中,首先针对基于物品的协同过滤算法(Item CF)在大规模数据中难以计算物品相似度的问题,设计了基于用户贡献度的相似度计算方法,该方法基于置信度并引入TF-IDF思想,计算用户贡献度,然
行人检测和姿态估计是深度学习的重要研究内容。行人检测是任何智能视频监控系统中必不可少的重要任务,因为它为对视频片段的语义理解提供了基本信息。由于有可能改进安全系统,它对汽车应用有明显的扩展性。人体姿势估计也是一种基于计算机视觉的技术,可以检测和分析人的姿势。人体姿势估计作为计算机视觉中一个相对基础的任务,是人体行为分析、动作识别、人机交互等的前置任务。近几年,随着深度学习的发展,行人检测和人体姿态
癫痫是目前临床医学上患病人数较多且患者分布范围较广的颅脑神经系统疾病之一,核磁共振成像(Magnetic Resonance Imaging,MRI)是癫痫诊断的一种重要手段,但实际上还存在一定的缺点:临床上存在很大比例患者的MRI颅脑检查表现为常规“MRI阴性”,医生无法明显发现异常结构,所以利用现在非常流行的图像处理技术智能后处理MRI阴性影像,并与机器学习技术相融合,以形成智能化、客观化的辅
转型升级是监理企业生存与发展的必由之路。在国家和地方都在开展全过程工程咨询的背景下,监理企业应抓住参与全过程工程咨询服务的机遇,拓展服务模式,增强盈利能力和竞争力,最终转型升级为全过程工程咨询企业,这不仅有利于监理企业的可持续发展,对于我国工程咨询行业的发展也具有深远的意义。本文首先阐述了监理企业转型的背景,并分析了监理企业转型的优势,以及转型的目的,明确了本文的研究内容。其次通过国内外文献的阅读
在迈入现代化社会的今天,电能已经是人们高度依赖的能源。全社会的用电量屡创新高的同时,电气火灾事故的发生也屡见不鲜,电气火灾的频繁发生严重危害了人民的生命与财产安全。本文的目的就是结合国标中关于电气火灾监控系统的相关规范,设计一款能够实时监控现场电气回路状态的电气火灾监控系统。所做的工作总体概括如下:(1)分析了电气火灾事故频发的现状,阐述了电气火灾监控系统的研究背景与意义,同时引出本文的研究内容,
机器阅读理解(Machine Reading Comprehension,MRC)是一项用于测试机器是否能够理解输入语料的任务,它要求机器根据输入语料来回答给定的问题。近年来随着各种深度学习技术的结合,MRC引起了国内外学者越来越多的关注。例如在实际搜索应用中,使用MRC技术的搜索引擎可以更加准确地返回用户所提出问题的正确答案。此外,配备MRC系统的智能助理可以帮助阅读文档,为用户提供高质量的咨询
随着近年来科学技术的不断进步,四旋翼无人机取得突飞猛进的发展。四旋翼无人机正在快速的应用于生活与军事等各个领域,同时四旋翼无人机集成度高,体积小,负载能力强,灵活度高等特点被广泛应用于遥感监测、航拍、灾后救援等人类很难涉足的区域,但是这些区域通常都会伴随着强风的干扰。风的影响主要体现在对四旋翼无人机姿态控制等多方面的影响,是对四旋翼无人机稳定性能的巨大考验。因此对四旋翼无人机抗风扰动、稳定性研究至
随着新能源并网技术快速发展,光伏发电在电网系统中所占比率在逐年提高。但光伏输出功率存在较强的随机性和波动性,单一的储能器件不能够充分地体现储能优势来吞吐光伏输出的能量,采用混合储能系统合理分配各元件的输出功率是目前研究的重点及难点;同时,为提高并网效率,电网采用了大量的电力变换器,从而引起电网系统频率抗干扰能力及电压耐受能力变低,给电力系统并网的稳定运行带来另一突出问题。针对以上两个问题,通过对储
光学相干断层扫描血管造影(optical coherence tomography angiography,OCTA)是一种基于OCT功能的新兴成像技术,是当前眼科、心脑血管和多种脏器的重要临床研究及应用工具。OCTA技术能够在非侵入和无需注射造影剂的情况下,区分毛细血管级的血流灌注与静态组织。其发展的重要趋势是通过更高清的成像技术来观察早期视网膜病变特征。现有的商业化OCTA设备成像的定位、优化