【摘 要】
:
行人重识别(Person Re-Identification,Re-ID)是图像检索领域的子问题,其利用计算机视觉方法确定特定行人是否出现在图像或者视频序列中。近年来,深度学习在计算机视觉任务上发展迅速,基于深度学习的行人重识别方法在智能安防、刑侦识别、智慧交通等领域均得到了广泛应用,但不免会受到自然场景中遮挡等不良因素的影响,例如行人互相遮挡、障碍物遮挡等,因此制约了行人重识别在实际场景中的应用
论文部分内容阅读
行人重识别(Person Re-Identification,Re-ID)是图像检索领域的子问题,其利用计算机视觉方法确定特定行人是否出现在图像或者视频序列中。近年来,深度学习在计算机视觉任务上发展迅速,基于深度学习的行人重识别方法在智能安防、刑侦识别、智慧交通等领域均得到了广泛应用,但不免会受到自然场景中遮挡等不良因素的影响,例如行人互相遮挡、障碍物遮挡等,因此制约了行人重识别在实际场景中的应用且带来了严峻的挑战。本文面向遮挡环境下的遮挡行人重识别问题,基于深度学习技术提出了一些相对应的解决方法,主要包含以下三个方面:(1)针对行人重识别数据集中图像数量不足与图像中存在的遮挡影响重识别准确率的问题,本文从图像自身所携带的像素信息可用性角度出发,提出了一种基于生成式对抗网络的遮挡行人图像修复算法(Pedestrian Image Inpainting GAN,PIIGAN)。该算法由生成器网络和判别器网络组成,生成器网络部分采用编解码结构,通过跳跃连接层与平移层捕捉图片整体结构语义信息,将已知区域的嵌入特征表达平移到未知区域进行修复。利用引导损失最小化解码器特征与遮挡图像的编码器特征之间的距离。通过实验验证,与传统的图像修复算法相比,PIIGAN修复得到的行人图像具有更清晰的语义特征和更精细的纹理特征,且修复后的图像可以实现对数据集的有效扩充,同时将修复后的数据用于重识别任务可以大幅提高重识别准确率。(2)针对遮挡重识别任务中传统三元组损失函数的不足,本文提出一种质心损失函数,将其点对点计算的形式扩展成点对集计算,通过样本集聚合对可能出现的异常值进行抑制。针对遮挡行人图像难以提取判别力特征问题,本文提出了一种联合非局部注意力网络与质心损失的重识别算法(Joint Non-local Attention and Centroid Loss Network,JACL-Net)。该算法将非局部注意力网络融入骨干网络学习不同距离像素之间的关系,利用质心损失与原有三元组中心损失进行融合从而使网络学习到更具辨别力的行人特征,最后通过提取全局特征进行相似性度量匹配。经过实验验证,在遮挡数据集Occluded-Duke上,Rank-1/mAP指标超过基准模型13.50%/10.30%;在遮挡数据集Occluded-ReID上,Rank-1/mAP指标超过基准模型8.20%/10.2%。与现有先进方法在遮挡与标准数据集上的性能相比,JACL-Net的Rank-1准确率与mAP也均有提升。实验验证表明,该算法可以对图像高判别力特征进行有效提取,在遮挡数据集与无遮挡数据集上具有较高的泛化性。与现有的先进行人重识别其他算法相比也具有一定的优越性。(3)在上述图像遮挡恢复和特征提取算法研究的基础上,为了进一步验证所提重识别算法的性能,本文设计并实现了一个行人重识别智能监控系统。系统通过用户上传待检索行人图片,将该图片经过本地行人重识别算法模型提取特征后,与数据库中的行人特征进行相似性度量匹配,最终检索出目标人员。实验验证,本文所提重识别算法具有较好的性能,且系统在实际场景下具有较强的实用价值。
其他文献
无人机的民用普及性给生产生活方式带来巨大变化,同时导致一些隐私安全问题,为实现对黑飞无人机的智能化管控与反制,急需开展对无人机目标的智能分析与监视技术研究。与可见光相比,红外传感器对光照变化不敏感,可以完成无人机长时监控任务。同时,红外图像只包含灰度信息,可以保护一些私密场景中的敏感信息。然而,远距离感知无人机红外视频图像存在复杂背景干扰、目标像素有限、特征点少等问题,相似度判别困难,导致现有算法
翠绿宝石晶体是一种宽带可调谐激光晶体,具有硬度高、热导率高、抗光学损伤能力强的优异光学性质。该晶体的发射光谱位于700-900 nm之间,在超短脉冲的产生与波长调谐等方面具有极大的优势,可被广泛应用于遥感雷达、光电对抗、激光美容、激光精密加工等领域。同时,翠绿宝石晶体的吸收光谱覆盖400-700 nm,蓝光、绿光、黄光和红光波段的光源均可选作翠绿宝石激光器的泵浦源。不同波段的泵浦源有不同的优势,选
信息时代发展至今,个人或企业数据的安全性、隐私性逐渐被重视,“数据可用不可见,用途可控可计量”是学术界和工业界对数据隐私的新要求。联邦学习保证各方数据不出本地私域的情况下实现联合建模,是打破数据孤岛,实现“数据不动价值动”的核心技术框架。但经过具体的学术研究和工业实践,联邦学习仍然存在一些隐私问题。首先,本地模型参数或者梯度更新可能会泄露一些原始数据集的信息,敌手可能采用重构攻击、成员推理攻击等反
在声学领域中回波作为目标的重要探测手段之一,广泛应用于现代化科技体系。对于复杂环境下不同目标的回波特性的研究在实际应用中越来越看重其仿真模拟结果的正确性以及速度。板块元算法因其精度高、计算时间短的优点广泛应用于物体声散射问题求解,但是在大尺度复杂目标的多次反射计算中传统板块元算法存在严重的遮挡问题导致计算成本极速增加。基于以上背景,本文提出了时域声场强度仿真加速算法,采用弹跳射线算法以及改进的时域
无线传感器网络(Wireless Sensor Network,WSN)在当今的物联网时代是一种发展和应用潜力巨大的技术。尤其在信息采集、安全检测等众多领域,无线传感器网络表现出极为优秀的使用价值和经济效益,因此在过去的数十年中始终引起国内外研究人员的普遍重视。此外,近几年无人机(Unmanned Aerial Vehicle,UAV)技术受到各国的重点关注,各国无人机的军用和民用需求也在逐年提高
目标检测作为视觉领域中一个充满挑战性的基础研究方向,被广泛应用到自动驾驶、医疗预诊、智慧城市等诸多领域。在目标检测算法中,将特征提取网络提取的具有不同语义信息的特征通过特征融合网络增强其表征能力,是提升检测性能的常用手段之一。但在实际场景中,大量待检测的感兴趣目标往往具有分辨率低、尺寸较小等特点,且易混淆在背景元素中,使得常规检测方法难以提取到有用的特征,导致大量误检和漏检,不能满足实际应用需求。
随着大数据时代的到来,各企业、部门组织间的数据资源共享量成倍增长,数据共享已成为各机构间交流合作的一种重要方式。数据共享的需求在不断增加,而实现数据共享的重要前提是要保证共享数据的安全可信。传统的数据存储模式通常采用集中式的架构进行访问控制管理,这种架构易受到黑客攻击,存在着用户信任、隐私泄露和单点故障等安全问题。此外集中式的架构使得数据共享方失去了对共享数据的控制权,如何加强数据共享方对数据的掌
随着数字化时代的到来,移动网络和多媒体也随之迅速发展,进入千家万户,除此之外,社交网络的建立,电子商务应用的普及,使得在网络上每天都会产生大量的多媒体数据,这部分数据包括视频、图像以及文本。因此,为了满足人们的生活和娱乐需求,图文检索已经成为需要重点解决的部分。但是相比较于单模态检索,图文检索中需要处理两种结构不同的数据,图像由像素点组成,文本由字词组成;语义层面不同,图像不包含语义信息,而文本包
图像在人们的生产生活中扮演着至关重要的角色,已成为最主要的信息载体之一。然而,易于获取的低分辨率图像存在模糊、细节不足等问题,因此图像的超分辨率重建技术具有重要的研究意义和应用价值。近十年来,深度学习取得了爆发式的发展,研究人员纷纷将其应用于图像的超分辨率重建领域,研究成果层出不穷。尽管现有算法能够获得相对清晰的超分辨率图像,但仍有许多不足之处,例如,生成的图像中存在结构失真、边缘模糊以及纹理细节
和谐社会的构建需要有一个稳定的社会价值体系做支撑。所谓“没有公平正义,就没有统一的评判标准,就无法构建一个和谐的社会”,如今的社会与虚拟网络社会混为一体,网络秩序的稳定直接关乎到整个社会环境。所以网民的正义表达不仅影响着网络环境的健康传播,还关系到整个社会的和谐发展。然而随着网络自媒体的发展,言论自由下形成的价值观体系不断遭受冲击,舆论热点事件的频发更是加剧了网民对于正义的的不理解和网民正义的模糊