基于深度强化学习的目标检测算法与应用研究

来源 :吉林大学 | 被引量 : 0次 | 上传用户:aaatzh
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近些年来,目标检测在深度学习技术的加持下已经成为了感知智能在计算机视觉领域中的发展重点,并广泛应用在诸多领域中,同时为学术界和工业界列为研究热门。目标检测的发展在人们的生活中有着重要的社会意义,以其作为核心基础所衍生出的智能应用对人们的生活模式产生了重要影响。作为感知智能中视觉的重要基石,它在研究和应用过程中的问题与挑战成为了学术界所研究的重点课题,同时也从学术界的验证性研究转向工业界的实践性应用。针对目标检测现有的研究工作进行整理总结可以发现,当前目标检测在训练样本标签分配、特殊场景目标识别和物体表达形式方面的相关研究较多。虽然目标检测作为感知智能视觉领域中的基础研究课题发展多年,但在工业界不断深入实用化的过程中仍然面临着诸多问题和挑战。本文在工作中分析了当前目标检测的若干关键问题,总结了目标检测发展的路径及其当前的研究现状;并在此基础上,针对训练样本划分、复杂样本学习、样本的形式表达这三个关键问题进行了分析研究并给出了对应解决方案。本文的主要工作包含以下三方面:1.提出基于深度强化学习的训练样本自适应目标检测算法RTSA(Reinforcement Training Sample Adaptation):对于目标检测方法中正负样本类别不平衡引发的问题,训练样本划分的策略作为一个研究方向对于目标检测模型的性能产生了重大的影响,训练样本的合理划分可以使得目标检测模型更加专注于图像中的目标实例本身从而提升模型性能。作为被检测目标实例的前景,相比于背景在图像中的所占空间比例较低,密集预测作为当前目标检测所用的主要方式生成了大量的负训练样本,导致了模型训练效果更偏向简单的负样本而无法检测到应该关注的目标实例,这种问题在诸如医疗图像背景复杂物体实例规模小的专业应用上更加严重。为了解决这个问题,本文提出了一种基于深度强化学习控制的训练样本划分策略RTSA。在这种策略的支持下,正负训练样本划分的阈值将根据生成锚框集合的统计属性动态生成确定,并且可以通过深度强化学习控制下的智能体对负训练样本锚框进行形变操作来优化提升正训练样本比例,从而针对性的化解正负样本不平衡带来的难题。该工作中所提出的方法在腹腔镜医疗数据集上进行了验证,并通过消融实验进一步验证了方法不同设置对于方法性能表现的有效性的影响。2.提出了基于深度强化学习的旋转目标检测算法RL-RPN(Reinforcement Learning Region Proposal Network):旋转目标检测在背景信息含量高的图像中面临着背景干扰过多的问题,因此复杂样本学习作为一个研究方向对目标检测模型的性能有着重大的影响。水平目标检测对于任意朝向的目标进行检测时存在着边界框内冗余信息过多的情况,这导致了模型的网络训练需要更多的训练数据和时间来提升对干扰信息的鲁棒性。为了解决这个问题,该工作提出了一种基于深度强化学习控制优化的目标检测方法ORL-RPN,将目标检测任务由通常的回归问题转换为控制一系列分解图像检测动作的序列决策任务,通过引入强化学习机制,智能体可以采用动态的策略来对旋转目标进行精准采样。为了验证样本复杂性对于目标检测模型的影响,我们采用了专用的旋转目标检测数据集,并在这些数据集上进行对比实验。通过实验,本文验证了由旋转目标带来的样本复杂性对于目标检测的影响,并证实了所提目标检测方法ORLRPN的有效性。3.提出了基于深度强化学习的关键点目标检测算法RLRep Points(Reinforcement Learning Rep Points):图像中物体实例的表达方式在目标检测任务中作为一个关键研究主题,一直为学术领域的人所关注。样本的表达,即物体实例的表达方式的定义,决定了目标检测方法在模型上的设计和实现,对目标检测有着重要影响。受目标检测传统方法的影响,边界框在样本表达上一直占据着统治地位。人们通过框作为参照物,利用回归方法对目标实例进行预测,以达到将物体包含在边界框内的目的。但随着目标检测领域的发展,这种边界框的样本表达方式成为了目标检测方法性能提升的瓶颈,边界框只能表达出框内物体的分类信息和粗略的位置信息,且边界框的表达方式因为受限对于物体形状的表达而提升了图像位置搜索难度。为了解决这个问题,当前学术界发展出了基于关键点的表达方式来替代原本基于边界框的表达方式。但表达目标实例的关键点在分布方式和数量上仍然面临着次优问题,为此该工作提出了一种基于深度强化学习控制关键点表达的目标检测模型RLRep Points。通过实验,本文验证了在深度强化学习算法的优化下,对于样本进行表达的点自适应到最优状态和增强目标检测模型的稳定性。样本学习作为目标检测方法的重要环节,对模型性能的表现起到了关键作用。本文的工作从训练样本划分、复杂样本、样本形式表达这三个方面来分析样本学习对目标检测模型产生的影响,同时在现有目标检测模型的基础上加入深度强化学习模块,最终通过实验验证强化学习机制在目标检测任务中的有效性。
其他文献
元宇宙吸引全球大型科技公司的巨额投入,Facebook创始人扎克伯格誓言在5年内把该公司转型为元宇宙公司,而中国的腾讯公司、字节跳动等同样拥有这样的雄心壮志。元宇宙发展现状如何?让我们梳理一下各国的元宇宙发展现状。美国:率先提出“元界”概念美国人的想象力非常的丰富,对于未来的信心和乐观情绪,推动着美国人不断探索创新。正是这些要素为元宇宙创造了率先在美国生根发芽的土壤。
期刊
河北省沧州市黄骅市环渤海低平原区,干旱少雨,缺少人工灌溉条件,土壤中轻度盐碱(含盐量0.3%左右),通过选用抗旱耐盐丰产小麦新品种,推行重施基肥、缩行增密、精细播种、重度镇压、春季追施水溶肥等雨养旱作高效种植管理模式,有效提高了旱碱地小麦产量,促进了农业增效和农民增收。
作为互联网数字媒介融合发展的未来传播形态,元宇宙传播无缝衔接虚拟与现实空间,使用户置身于临场感更强的新媒介图景中。这种新的传播模式能给国际传播带来新路径,重构国际舆论生态格局。基于当下元宇宙发展的实际,我国国际传播需要从用户体验、科技思维和内容生产三方面重构场景,从而为元宇宙场景下的国际传播提供新路径。
目的:探讨循环质控中医健康服务理念应用于产科病区安全管理中的效果。方法:选择2021年3月—2021年9月温州医科大学附属平阳医院产科孕妇78例为研究对象,随机均分为对照组与观察组39例。对照组给予常规管理,观察组给予循环控制的中医健康服务理念管理。比较两组孕妇管理前后的管理质量评分,统计两组孕妇分娩方式及并发症发生情况,比较两组孕妇的满意率。结果:管理后两组孕妇的专科管理、风险评估、健康教育、应
固化稳定化可以降低土壤中重金属的迁移,被广泛应用于重金属污染土壤修复工程中,是处置重金属污染土壤最常用的技术之一。文章通过调研国内外文献,对固化稳定化的研究进行综述,总结了常用固化稳定化材料,如水泥、碱性材料、黏土矿物质、磷酸盐类材料、金属氧化物和生物炭的研究进展,阐明这些修复材料固化稳定化重金属的基本原理,论述效果评估技术的适用性及局限性,并提出未来研究需求,为以后的固化稳定化修复重金属污染土壤
智慧课堂在信息化、智能化技术高速发展的背景下成为人们关注的热点。利用互联网、云计算、大数据、人工智能等技术构建的智慧课堂,以人的认知能力高效发展为宗旨,以不断升级的智能技术为支撑,借助技术的力量实现对教学过程的精确预设、精准调控。而人文观照的智慧课堂以促进人的全面发展为目的,以教师的教学智慧为依托,其教学过程尊重人之为人的生命特性,是不断变化、动态发展的过程。在智能化技术“一路高歌”的背景下,智慧
期刊
城市主干道交通运行情况会对其联系的各个区域产生重要的影响。针对主干道改善研究构建一套基于对策研究、仿真评估的闭环反馈技术路线,首先,针对片区拥堵道路或节点,从出行特征、交通组织、基础设施设计、信号配时等方面分析拥堵原因,并制定相应改善策略;其次,为了验证拥堵原因以及评估改善策略的合理性,构建了精细化的车道级仿真模型,依托现状模型及改善模型进行对比评估,以此验证相应改善策略是否合理,形成一个闭环的评
全面预算绩效管理是起源于企业内部控制的一种管理方法,在现代企业广泛应用后,被逐步引入到行政事业单位的预算管理中,但在实际执行中多停留在事后评价,缺乏事前控制、事中监督和事后评价的应用。2021年国务院意见,对行政事业单位全面预算绩效管理提出更高的要求,将公用支出纳入运转类项目库管理,旨在实现项目绩效全流程、全方位、全覆盖管理。本文基于对全面预算绩效管理的解读,明确全面预算绩效管理的内涵和重要意义,
深度强化学习可以实现自主交互循环决策,从而迭代提高目标解释算法的准确性,在图像智能分析领域具有重要的应用价值。结合遥感数据的特点,提出了一种基于深度强化学习的遥感图像目标检测算法。针对复杂背景下检测任务定位不准确的问题,设计了一种循环迭代目标定位方法,该方法根据预先定义的方法对目标检测中的定位任务进行迭代搜索。构建了深度强化学习定位代理的决策过程,定位代理通过感知当前遥感图像和下一个需要关注的子区
随着“国家信息化教学改革实验区”试点学校建设工作的逐步深入,学校通过智慧课堂建设,引领课堂走向深入,学生不仅能在课堂中获得学科知识,更能充分体验、参与学习过程,在活动、交流、展示中促进对知识的深度思考和理解,让学生真正成为学习的主体。智慧课堂引领课堂深度学习。在“教”的层面,教师基于智慧教学平台,优化课程内容与教学过程,实现学科课程再造;制作适合学情的优质微课程、导学案、任务单等教学资源包,
期刊