论文部分内容阅读
随着社会的日益发展,多级监控网络作为基建不可或缺的部分,在国家的大力推进下稳步落成且逐年扩大,监控视频数据量相应成指数倍增长。基于公共安全和商业服务的需求,仅靠人工在海量的视频数据中进行实时监控和行人追踪费时且低效。在需求的推动下,行人重识别作为智能视频分析技术中的关键一环逐渐成为研究热点。但实际监控场景下,摄像头成像差异、行人姿态、光照、遮挡、行人身份标签无法自动获取等因素使这项研究极具挑战性。如何提取具有鲁棒性和判别性的详细行人特征以及缺少行人标签作为监督信号的情况下,如何对样本进行可靠聚类是当前行人重识别领域研究需要重点关注的问题。围绕视频监控系统中的上述问题,本文主要研究工作如下:(1)针对局部特征提取网络常用硬切分方式来获取人体部位,割裂了局部与局部之间的空间连贯性和相关性,本文提出了结合一阶和二阶空间信息的行人重识别模型。该模型分为全局分支和局部分支,主干网络利用一阶空间掩模为全局特征重新分配空间权重,以减少背景噪声对远距离相关性建模的干扰;用二阶空间掩模对全局特征进行远距离依赖建模,并集成图像的局部信息。引入丢弃块(Drop Block)对行人特征进行成块擦除形成局部分支,避免网络模型过拟合的同时学习更具有判别性的局部特征。在训练阶段,用引入正样本中心的三元组损失联合标签平滑交叉熵损失对整个网络进行优化,使类间特征距离更大的同时保证类内样本特征具有更紧凑的空间分布。测试阶段将全局分支和局部分支的行人特征进行串联得到更为详细的特征描述符从而提升重识别精度。在Market-1501和Duke MTMC-re ID数据集上进行实验,表明本文算法提取的行人特征更具判别性和鲁棒性,能够有效提升行人重识别模型的性能。(2)针对偏差聚类方法忽视了对聚类样本数量的控制易导致超大集群,本文提出了一种基于偏差分层聚类和多样性约束的无监督行人重识别模型。该方法在初始化阶段为每一张行人图像赋予样本级的伪标签,对网络进行训练,根据网络提取出的图像特征,分别计算类内类间偏差作为聚类准则,更倾向于孤立点优先聚类,类内偏差较小的集群优先合并,有效削弱个别离异值在聚类初期对聚类效果的影响。同时引入了多样性约束来防止合并后的集群样本数量过大。在不断迭代中微调模型并更新聚类信息,直到网络模型性能不再提升。在行人重识别数据集Market-1501和Duke MTMC-re ID上进行算法的有效性验证和性能对比。实验结果表明,改进后的聚类准则聚类效果更好,超大集群数量有所减少,模型重识别性能得到了进一步提升。