论文部分内容阅读
自国家“十三五”开始,人工智能可以赋予安防系统任务更鲜明的选择和更完善的结果,目前已逐渐进入新的快车道。并从传统安防系统事发时的被动防御逐渐过渡到事发前的自主进行阻止和事发时自主报警的方向。随着经济的发展,国家有了更丰富的财力铺设范围更广、清晰度更高的视频监控摄像头,这些高清摄像头对于社会安全治安建设、城市平安建设、各相关部门信息化、卫生健康区域防护与溯源等领域都做出卓越贡献。特别是在疫情期间,以安防系统为辅助的密接人员溯源追查工作取得优秀的成果。由于摄像头往往无法正确清晰地抓拍到人的正脸,在一些现实的应用场景中,仅仅依靠人脸信息并不能满足实际工作需要,现阶段为了促进人工智能在安防领域的落地,必须使其能够利用诸如人体的姿态、服装等不同角度的全面信息特征,使行人身份的鉴别从单纯依靠人脸识别突破到认识一个“人”个体的阶段。对于行人重识别技术本身而言,其主要任务是从已有的大型图像数据库中检索出特定图像,是一种只针对行人这一主体的图像检索任务。行人重识别技术在从理论算法到实际落地应用的过程中,也面临重重困难。受到摄像头位置及摄像头视野的限制,单一的摄像头不可能对某片监控区域进行全方位覆盖。即使多个摄像头针对同一区域拍摄,也依然因为不同摄像头之间存在光照、角度、遮挡等诸多因素之间的差异,甚至不同规格和型号的摄像头也会带来清晰度和其他不可预测的实际问题,导致现有行人重识别算法无法走出实验室,达到可接受的落地应用精确性。虽然在全国铺设范围巨大的摄像头采集下,积累了海量的视频数据,然而这些数据中的大部分包含的有效行人信息是很少的,并且如此数量级的视频数据在没有人为标注的情况下几乎对于行人重识别任务没有任何帮助。数据量大、有效样本却不足,这是典型的大数据小样本问题。立足于解决复杂场景下行人重识别中存在的问题,本文做出了许多探索。从数据扩充的角度,探索了行人样本追踪模型和行人样本扩充方法。从模型改进角度,提出了自适应迭代方法。从系统优化角度,提出了时-空信息联合的行人重识别系统优化方法。主要创新点包括:(1)为了解决在行人追踪的任务中行人样本受遮挡的问题,本文提出一种基于半监督学习的稳定孪生网络追踪方法STWS(Shape Robust Siamese Network Tracking Based on Semi-Supervised Learning),目的是为了改善图像中目标的定位。现有大多数半监督方法只定位对象中具有最显著特征的区域,而不是目标的所有相关区域,这导致模型性能欠佳。本文提出的STWS方法核心思想是在训练数据中随机隐藏目标样本部分区域,从而生成基于原始行人样本的受遮挡行人样本,目的是为了将网络的关注重点平均分散于不同的局部区域,当具有最显著特征的区域被隐藏时,迫使网络寻找其它相关部分。本文提出的STWS模型能够有效将网络训练时的关注重点从少数重点位置扩散到目标图像全局,从而更好地解决图像遮挡问题。并且在STWS随机隐藏目标样本部分区域的过程中,大大丰富了受遮挡样本的数量,从而达到了扩充数据集的目的。(2)针对现有行人重识别视频数据的帧间信息挖掘不充分的问题,本文提出一种基于强化学习的渐进式行人重识别网络更新方法RLPU(Reinforcement Learning Progressive Update Network for Person Re ID)。通过行人追踪算法对视频帧间信息高效利用的特性和强化学习从环境状态映射到动作的特性。由行人追踪算法得到行人的轨迹片段,依托轨迹片段信息给行人分配伪标签,并由强化学习在行人重识别网络迭代更新的过程中,根据每轮迭代后行人重识别模型运行结果是否有明显提升判断当前更新策略的优劣,得到最优的伪标签更新策略,从而动态筛选伪标签。RLPU算法提高了现有基准的性能,并且具有较高的运行效率。(3)针对大规模数据集标注成本高问题,本文基于STWS算法和RLPU算法提出基于视频的半监督自适应分步行人重识别方法SSAS(Semi-Supervised Adaptive Stepwise Learning),在得到行人轨迹片段和部分伪标签的基础上,SSAS算法提出了一种更全局化的伪标签更新思想。区别于RLPU利用强化学习由行人重识别模型的迭代结果筛选伪标签的方法,SSAS利用了Kullback-Leibler散度的核心思路,从特征分布的角度对伪标签的优劣进行度量。逐步增加伪标签的复杂性,由简单样本开始,逐渐增加困难样本,与此同时删除效果较弱的样本进行更新。本文提出的SSAS方法通过动态的伪标签筛选策略,稳步提高了行人重识别任务的识别准确率,并通过实验证明了本方法的优越性。(4)针对行人背景复杂多变问题,本文基于以上几种方法做了更进一步的探索,提出了时-空信息联合的行人重识别系统优化方法OTSI(Optimization Method of Person Re-identification System Based on Time-Space Information)。利用行人追踪算法挖掘视频中的时间信息得到行人的轨迹片段,扩充伪标签视频片段数据集。同时在行人追踪算法因外界干扰丢失目标行人的情况下,利用行人重识别算法挖掘视频中的空间信息得到行人的位置片段,使行人追踪算法的精准度提高。两者相辅相成,得到行人图像数据动态字典,并由强化学习管理更新过程,得到行人追踪算法和行人重识别算法最优的更新管理策略,依靠这种时-空信息联合的系统优化方法,可出色地满足在复杂场景下的应用需求。