【摘 要】
:
随着人们对于自身安全以及公共安全的日益重视,视频监控系统遍布世界各地。海量的视频数据得以保存,如何快速地且智能化地分析和处理视频监控系统拍摄到的视频以及图像数据,是当下亟待解决的问题。作为智能监控系统中的一种不可或缺的技术,行人重识别(person Re-identification,Re-ID)受到了学术界的重视,其主要任务是在跨摄像头视域下匹配同一目标行人。近年来,随着深度学习技术的逐渐成熟,
论文部分内容阅读
随着人们对于自身安全以及公共安全的日益重视,视频监控系统遍布世界各地。海量的视频数据得以保存,如何快速地且智能化地分析和处理视频监控系统拍摄到的视频以及图像数据,是当下亟待解决的问题。作为智能监控系统中的一种不可或缺的技术,行人重识别(person Re-identification,Re-ID)受到了学术界的重视,其主要任务是在跨摄像头视域下匹配同一目标行人。近年来,随着深度学习技术的逐渐成熟,行人重识别领域取得了非常可观的研究成果。在现有的行人重识别研究中,大多数工作都集中在基于可见光图像的行人重识别方向,而该方向的方法非常容易受到光照条件的影响。例如,这些方法在光照不足的条件下其性能会大大降低。此外,针对大量的无标签图像数据,如果将在有标签数据集上训练的行人重识别模型直接应用于无标签数据集上,那么其在无标签数据集上的准确率非常低。针对这些问题,本文分别提出了一种掩模引导的双注意力感知网络和一种基于跨域混合和自适应深度连接注意力网络的方法来解决跨模态行人重识别和无监督跨域行人重识别问题。论文的主要研究内容总结如下:1.在跨模态行人重识别领域,本文主要研究了可见光-红外行人重识别(Visible-Infrared Person Re-ID,VI-REID)。为了提升该领域的识别精度,本文提出了一个掩模引导的双注意力感知网络,通过引入掩模图像增强行人的轮廓特征和外观特征,并且使用了残差注意力模块来捕捉行人的细粒度特征。该注意力模块通过自适应地标定通道维度和空间维度上的特征响应,从两种异质模态中学习更多的具有辨别性的行人特征。大量的实验表明,该方法有效的提高了VI-REID的识别效果。2.在无监督跨域行人重识别领域,为了提升模型从源域迁移到目标域时的识别效果,本文提出了一种基于跨域混合和自适应深度连接注意力网络的方法。该方法使用跨域混合算法在两个域之间引入混合值作为过渡状态来有效地缓解两个域之间的剧烈差异。此外,该方法引入了注意力机制使模型能够自适应地提取行人的具有辨别性的局部信息,从而增强了模型对于物体遮挡以及局部变化的鲁棒性。在目标域的训练过程中,该方法使用了自适应探索的算法来最大化目标域中所有行人图像之间的距离和最小化相似的行人图像之间的距离。该方法在Re-ID数据集上的一致性改进表明了其能够有效的提升跨域行人重识别领域的性能。
其他文献
现代工程结构日益大型化、轻柔化,其安全服役和动力灾变问题越来越突出。结构可靠度分析和结构健康监测是保障工程结构长期服役和安全运营的两个重要研究内容:一方面,结构可能直接承受作用强度远超其设计极限的极端自然灾害,导致结构体系失效,因此有必要对结构进行动力可靠度分析;另一方面,在漫长的服役期内,结构会因环境侵蚀和材料老化等因素的影响出现功能退化,致使服役性能不断下降,因此需要利用损伤识别等手段为结构安
近年来,神经网络已经应用在无人驾驶、医学、地质探测等各个领域。随着卷积神经网络的发展,从Le Net网络结构到VGG网络结构,网络越来越深,每层的规模也越来越大,随之而来的是计算量和参数量越来越大的问题。一般神经网络的训练计算由服务器端进行,再将训练好网络发送到终端进行推理计算,以满足终端的智能化需求。但该传输过程可能会造成用户一些隐私数据的泄露,缺乏安全性,同时终端也缺乏本地的自我训练调整的能力
随着科技的发展,以及人工智能领域各项技术的逐渐成熟,多智能体系统已成为人工智能一个热门研究方向。多智能体系统由分布式人工智能演变而来,其研究目的是解决大规模、复杂、实时和有不确定信息的现实问题,而这类问题是单个智能体所不能解决的。多智能体深度强化学习是解决多智能体问题的重要方法,但目前的多智能体深度强化学习方法主要针对只有数个智能体的环境,而在多智能体越来越庞大的环境中,智能体的策略变得更加重要也
“十四五”规划纲要提出,要加大对大数据,工业智能,区块链等新基础设施的投资,信息化程度将进一步加深。网络信息科技也随之提升,然而有的人却会利用技术对人们的隐私与财产安全带来巨大威胁。网络信息安全面临全新的,繁杂的挑战。入侵检测系统作为网络安全领域的一个重要组成,在面对异常入侵,用户误操以及内部攻击时提供及时的防护,所以研究入侵检测系统已经成为相关从业人员重点研究方向。近年来随着深度学习在语音识别、
在工业生产中安全是首要任务,但日益复杂的工业现场环境给安全生产带来了极大挑战。当前工业现场常用的安全监测方法有:基于人工的巡查方法、基于机器视觉三维成像的目标识别方法、基于卷积神经网络的目标识别方法。人工巡查的检测精度、频率和范围都是有限的,因此基于机器视觉三维成像和基于卷积神经网络的目标识别方法得到了广泛应用,并能够运用于极端恶劣环境中,但基于机器视觉的三维检测方法自动化程度仍然不高,往往需要辅
老年人口的快速增加是一个迫切的社会问题。近些年来,科研人员在研究如何能够让老人在家中安全养老付出过很多努力。研究发现,行为识别是判断一个人是否具有生活自理能力的重要评估方法。该方法通过监测老人的行为可以得知其认知水平和健康状况,并在必要时能够及时做出预警。这对于提高老人的健康水平和居家生活质量至关重要。然而,要想能够尽可能准确识别老人的行为,至少需要准确的数据、合适的特征和符合老人活动规律的模型。
无线传感器网络(Wireless Sensor Network,WSN)常被应用于灾害预警、医疗监测、工农业生产、国防军事等各个领域。在WSN中,一方面节点电池容量有限导致网络寿命有限,另一方面广播特性使得通信干扰严重、吞吐量低,这两点是制约WSN大规模部署的重要因素,然而这两个问题相重叠使得系统模型更为复杂。为了有效提高网络吞吐量、延长网络寿命,本文提出将串行干扰消除(Successive In
化工园区作为一个易燃、易爆、有毒重大危险源高度集中的区域,一旦发生火灾、爆炸或毒物泄漏扩散等事故,将造成一系列的连锁反应,并产生灾难性的后果。为此,利用大数据、人工智能等高新技术提高化工园区风险感知、监测预警、协同救援和应急处置的能力,已成为新发展格局下的重点领域之一。其中,化工园区应急物资分配是开展危化品事故应急救援的基础,是体现化工园区应急管理能力的一个基本要素。主要研究在危化品事故发生后,如
高分辨率SAR(Synthetic Aperture Radar)图像在卫星遥感、灾害监测等领域具有重要实际研究应用价值,但实际SAR成像分辨率往往难以满足应用需求。传统SAR图像超分辨率重建方法对模型和先验知识要求较高,重建效果往往不理想;无监督式生成对抗网络模型通过训练学习高低分辨率图像之间映射关系,减少先验知识依赖,重建图像效果明显优于传统方法,但博弈对抗式训练方法往往会使重建图像产生“伪影
互联网的迅速普及打破了信息传播的专业门槛,使得越来越多的人们可以通过社交媒体方便地获取信息、分享和表达观点,这极大的丰富了人们的日常生活。然而,由于社交媒体的用户数量巨大,出于各种目的捏造的虚假新闻层出不穷。再者,随着技术的进步,虚假新闻不再单纯的以文本的形式传播,更多是通过文本、图片和视频结合的方式进行扩散,极大地增强了虚假新闻的迷惑性,也使得以往仅仅依赖文本内容进行分析的虚假新闻检测方法不再适