【摘 要】
:
目标检测是计算机视觉领域的重要任务之一,其目的是准确高效地找出图像中关注的物体,确定物体的类别信息和位置信息。近年来,随着深度学习技术的应用,目标检测算法迎来了新的发展阶段,然而,多数算法往往只关注图像中各物体的区域特征信息,忽略了物体所处场景的信息如场景类别、物体间联系等因素对检测结果的影响,对于图像信息的利用率偏低。因此,本文进行了基于场景理解的目标检测方法的研究。本文的研究内容分为以下方面:
论文部分内容阅读
目标检测是计算机视觉领域的重要任务之一,其目的是准确高效地找出图像中关注的物体,确定物体的类别信息和位置信息。近年来,随着深度学习技术的应用,目标检测算法迎来了新的发展阶段,然而,多数算法往往只关注图像中各物体的区域特征信息,忽略了物体所处场景的信息如场景类别、物体间联系等因素对检测结果的影响,对于图像信息的利用率偏低。因此,本文进行了基于场景理解的目标检测方法的研究。本文的研究内容分为以下方面:提出一种基于多尺度特征融合的场景分类方法。首先,针对性地选用不同的网络模型,将图像中的全局特征和语义特征提取出来;其次,通过将两种特征融合的方式,使模型掌握更多图像中的信息;最后,为解决两种特征之间参数量不平衡的问题,在特征融合阶段引入注意力机制,使算法关注重要信息,忽略无关信息。实验结果表明,在scene15数据集和MIT Indoor 67数据集上,本算法相比常见图像分类网络的准确率有所提升。提出一种基于场景理解的目标检测方法。首先,在目标检测算法中加入物间关系计算模块,通过图卷积神经网络处理图像中物体与物体的联系;同时,加入场景与物体关系计算模块,通过循环神经网络处理场景与物体的联系;最后,改进边界框回归方式,提高最终预测准确度。在以YOLOv5s为模型基础的条件下,对比本方法与现有目标检测网络。通过对比结果发现,本文提出的模型结构有着相对不错的目标检测效果。设计并实现了基于B/S架构的目标检测系统,对系统需求、功能设计、系统实现等进行详细规划,实现了系统相关功能。
其他文献
随着信息科技的不断进步,在万物互联的时代中对于位置信息的需求逐渐增多,卫星等定位技术在室外定位中发挥非常重要的作用,但在复杂的室内环境中表现不佳。随着5G基站愈来愈多,利用多基站的特性可以加强室内定位的精准度,能够为基于到达时间(Time of Arrival,TOA)和基于到达角度(Angle of Arrival,AOA)定位算法提供更精准的估计值。首先,通过查阅了无线定位技术算法的原理,引出
在媒介融合时代,电影除却与电视、互联网等新旧媒介的重组之外,还存在与其他文化空间的“合谋”,如美术馆。在电影从影院“抽离”并介入美术馆的过程中,电影媒介不仅受到美术馆外部空间形态的限制,还接受了其文化机制的根本改造。在经历“拆分”“重组”等适应性调整后,电影从叙事文本变成了影像展品,电影的传受方式从放映转向展览,电影的形态则从“文本”变为由影像、装置、展示空间三者组成的展示机制。由此,一类新的电影
光频梳作为一种等频率间距且功率近似相等的多载波光源,可广泛应用于信道化接收和波分复用等领域,近些年引起了国内外各研究团队的关注。在生成大量光频梳的基础上,如何提高光频梳的平坦度和边模抑制比,同时降低射频信号的功率成为了研究的重点和难点。本文围绕外调制器法产生光频梳技术路线开展相关研究,提出了两种不同的光频梳生成方案。而后针对光频梳在信道化接收中的应用,设计了两种基于光频梳的信道化接收瞬时频率测量方
双连接技术(dual connectivity,DC)能够融合多重制式网络构成“互通互补”的网络架构,可实现更短的系统端到端时延、成倍增长的吞吐量、更快的聚合速率和更高的鲁棒性,被认为是提升未来异构网络性能的潜在热门技术之一。然而,由于DC技术引入了不同的接入技术和服务质量评估系统,这将使网络环境更加复杂、多样化,为移动性管理带来了新的挑战。本文采用系统级仿真对双连接网络的移动性能进行了剖析,提出
深基坑是指开挖深度大于5 m(含5 m),或者开挖深度不足5 m但地质条件与周围环境极差、地下管线非常复杂的工程。在深基坑工程施工过程中,边坡支护技术直接关系着施工质量和施工安全。但就目前来看,在部分深基坑边坡支护工程项目中,设计、施工环节仍然存在一些不足。因此,本文以深基坑边坡支护工程项目现存问题为切入点,在分析深基坑边坡支护工程项目设计要点的基础上,提出加强施工检测管理等施工管理策略,以期为相
近年来,由于深度学习及其相关核心技术的迅速更迭,作为其核心,卷积神经网络算法在图像识别、目标检测等方向都得到了广泛应用,但是深度神经网络对硬件平台的要求也在日益提高。目前主要硬件平台有CPU、GPU、FPGA以及ASIC硬件芯片,但是CPU、GPU等平台实现目标检测过程中会存在计算效率低、功耗过大等缺陷,并且体积过大也使其难以应用到小结构平台中,而FPGA功耗低、灵活性高、体积小等优势可以弥补这些
近几年,深度学习技术飞速发展,不断有人工智能相关的概念或应用被提出来,如智慧城市、智慧安防、自动驾驶等,而行人实时跟踪则在其中扮演了重要角色。行人跟踪任务是多目标跟踪重要子任务之一,该任务的算法通常会将跟踪过程分为两个阶段,即检测与匹配阶段。测阶段的目的是将图像中包含的行人目标使用检测框标注出来,从而定位行人位置,而匹配部分则是负责将前后帧的行人目标关联起来,使得相同行人被赋予相同身份,不同的行人
随着第五代移动通信技术(The Fifth-Generation Mobile Communication Technology,5G)的问世,超密集网络(Ultra-Dense Networks,UDN)逐渐地走进人们的视野当中。UDN通过更加密集的网络基础设施部署,有效地改善了5G网络建设中频谱效率和容量不足的现状。但相比于传统的蜂窝网络,UDN中无线环境复杂且干扰多变。如何有效地对UDN进行
近年来,无线通信系统发展迅猛,其功能、性能得到了大幅度的提高。与此同时,人们对无线通信系统也提出了更严苛的要求。从整个射频链路来看,天线在无线通信中的作用十分重要,面对日益严峻的复杂的工作环境,如何设计出能够适应多环境、多功能的天线,成为了目前天线领域的研究重点。自可重构的概念被提出以来,各国研究人员为设计出具备优良性能的可重构天线投入了大量的人力物力,使得可重构天线成为了一个热门领域。可重构天线
<正>随着我国国民经济的飞速发展,矿产资源的开采强度不断加强,长期的矿产资源开发对矿区原有的地形地貌、地质构造、生态环境等造成的影响较大,使矿区的地质生态环境日趋恶化,主要表现为崩塌、滑坡、地面塌陷、地裂缝等矿山地质灾害。矿山地质灾害不但会造成严重的水土流失,也对生命安全及财产安全构成了严重威胁。