【摘 要】
:
行人重识别技术旨在通过对多摄像头拍下的行人目标进行身份一致性匹配,从而实现对跨摄像头下行人运动轨迹的准确追踪,目前被广泛应用于安全监控、道路交通、智慧校园等领域。面对大量的监控数据时,使用行人重识别技术进行智能识别,可以实现更快、更高效的信息处理和信息分享,提高生活智能化水平,对维护社会稳定安全都具有重要的意义。由于摄像机获取的行人数据集存在光照变化、复杂背景、姿势差异和遮挡等问题,目前的方法往往
论文部分内容阅读
行人重识别技术旨在通过对多摄像头拍下的行人目标进行身份一致性匹配,从而实现对跨摄像头下行人运动轨迹的准确追踪,目前被广泛应用于安全监控、道路交通、智慧校园等领域。面对大量的监控数据时,使用行人重识别技术进行智能识别,可以实现更快、更高效的信息处理和信息分享,提高生活智能化水平,对维护社会稳定安全都具有重要的意义。由于摄像机获取的行人数据集存在光照变化、复杂背景、姿势差异和遮挡等问题,目前的方法往往侧重于解决单个问题,缺乏对各种复杂问题的综合考虑。因此,本文围绕能够适应多种复杂情况下行人重识别的网络架构展开相关研究,并提出了一种联合变换器(Transformer)和卷积神经网络的双向异构特征聚合网络架构(Bi-directional Heterogeneous Feature Aggregation Network Architecture,BHFAN)。具体研究工作如下:(1)针对行人图像数据集中的尺度差异和环境噪声,设计了一种多尺度信息监督器(Multi-scale Information Supervisor,MIS),可以迭代聚合不同层次的卷积神经网络特征,以增强网络浅层的语义信息和网络高层的纹理细节信息。此外,还可以提取图像的多尺度上下文信息,提高网络的鉴别能力。(2)针对Transformer存在固有感受野的缺陷,提出了一种新型的金字塔信息聚合编码器(Pyramid Information Aggregator,PIA),利用图像块金字塔信息去增强Transformer的感受野,同时能够更好地挖掘行人图像的多尺度细节线索。(3)针对行人图像数据集存在的行人遮挡问题,提出了一种新型特征分层模块(Feature Stratification Module,FSM),通过Transformer结构获取行人图像中不同局部区域的全局联系,同时卷积模块进一步增强邻域特征信息的交互,以促进模型提取更具细粒度和鲁棒性的特征。在理论研究的基础上,本文完成了骨干网络性能对比实验、消融实验和可视化实验。在六个主流行人重识别数据集上验证了该网络架构的性能。实验结果表明,与大多数最先进的方法相比,本文的方法可以实现更高的性能指标。
其他文献
结构健康监测(Structural Health Monitoring,SHM)是指利用传感器对工程结构的损伤进行检测和识别,作为物联网技术的重要应用领域之一,SHM已经在环境监测、应急管理等应用中得到广泛关注。对于部署在缺乏地面通信基础设施的特殊地区的SHM传感器,由于没有地面基站提供接入服务,要可靠地实现收发数据将变得十分困难。无人机和卫星由于具有灵活的机动性以及广阔的覆盖范围,被认为是实现此
随着电子技术的发展,视觉传感器被广泛应用于社会各个方面,如军事,安保和车载等领域,它可以让观察者在一定距离之外,不经过接触就能对物体有一定的观测和了解。摄像设备和计算机的联合促进了计算机视觉任务的快速发展,从而更好地解决各种场景下的环境观测问题。其中,在夜间等光线暗淡的环境下拍摄得到的图片像素低,噪声大,阻碍着后续的图像处理,所以低光图像的增强技术是计算机视觉领域不可或缺的一部分。而根据现有的研究
不平衡数据分类指对存在“某类样本数量远远大于另一类样本”现象的数据进行分类,广泛应用于医疗诊断、故障检测、信用贷款等领域。传统机器学习分类方法通常假设样本具有均匀的类分布和相同的误分代价,直接应用于不平衡数据时,分类器会偏向于多数类,导致少数类将被多数类淹没。而现有的不平衡数据分类方法主要侧重于解决数据的类失衡问题,忽略了已被相关研究证实对分类器性能负面影响更严重的类重叠问题。基于上述背景,本文分
随着生物信号检测与处理技术和神经医学等方面学科的飞速发展,对微弱信号高精度处理的需求与日俱增,而增量型Sigma-Delta ADC(Analog-to-Digital Converter,ADC)无需精确的模拟元件匹配就能实现高分辨率,因此得到了广泛的应用,但是增量型Sigma-Delta ADC的精度、面积和功耗在很大程度上取决于数字抽取滤波器的结构。本文针对以上问题,提出了一种面向增量型Si
近年来,随着汽车数量的急剧增加,交通事故发生率也在逐年上升。同时,无线通信技术也在飞速发展,第三代合作伙伴计划(3rd Generation Partnership Project,3GPP)提出基于长期演进的车到万物(Long Term Evolution-Vehicle to Everything,LTE-V2X)技术用于保证交通系统的安全运行。LTE-V2X运行在5.9GHz频段,支持上行链
面部表情蕴含着丰富的情感和行为信息,可以直观地反映出人的情绪和心理活动。表情识别技术在安全驾驶、临床医学、智慧教学等领域有着广泛的应用,已成为计算机视觉研究中的热点。传统基于欧式空间的表情特征提取方法将图像作为标准的网格类型数据处理,虽然能有效地提取表情的时间和空间特征,但忽略了面部图像中的丰富的结构和关联特征,从而导致其特征表达能力有限,不利于于进一步提升对人脸表情的识别效果。论文结合与重庆某汽
我国海上安全形势日趋复杂,海上军事争端越演越烈,能否快速准确地检测船舰目标极大地关系到战争的成败;因此,确保海域安全是我国现在以及今后军事战略的重点。近年来,随着合成孔径雷达(Synthetic Aperture Radar,SAR)成像技术的发展,对船舰目标的精细化观测水平越来越高,使得利用深度学习相关技术挖掘船舰目标的深层特征和精细化信息,进一步提高SAR船舰目标检测性能已成为可能,引起了国内
传统建筑业安全风险防控主要采用基于人工巡检的“人防”手段,存在不可回溯、可靠性差、人力成本高等问题。基于视频监控的“物防”手段在一定程度上可提升风险防控能力,但无法实现实时的风险要素识别和预警。随着人工智能技术的快速发展,基于智能化目标识别技术的智慧工地“技防”手段成为大势所趋。论文结合建筑工地环境复杂多变的实际情况,研究部署便捷、支持风险要素目标实时识别的轻量级目标检测算法和实现智慧工地风险监测
情绪是一种能够表达人的思想、感觉等的综合状态,在人们的交流中有着举足轻重的作用。尤其在人-机交互的研究中,若能准确识别情绪,人-机交互的应用就会更加智能且自然。研究发现,情绪识别的研究综合了认知心理学、计算机视觉、人工智能和脑科学等领域,现已成为一项重要的交叉学科研究课题。如何准确和快速地识别出情绪,一直是该交叉学科领域研究的关键科学问题。目前较成熟的情绪识别算法中,ESRs算法能有效减少剩余泛化
压缩感知理论不再约束于奈奎斯特-香农采样定理对采样频率的要求,其将采样过程和压缩过程进行有机结合,为如何进行有效的信号采样、传输和存储提供了新的模式,将压缩感知应用于图像处理领域,能够减少采样数据量且避免高速采样。从极少量的测量值中有效且高概率高质量恢复出原始信号是压缩感知图像重建研究的核心问题,学者们相继提出了传统和基于深度学习的压缩感知图像重建算法,传统算法基于数学推导是可解释的,但其重建质量