论文部分内容阅读
随着社会信息化建设的不断发展,城市中监控摄设备的数量与监控视频数据正急剧增加,人工浏览并处理所有监控视频已变得费时费力,因此,如何利用计算机自动整合监控视频信息具有重要意义。行人重识别技术可以从多个摄像机拍摄视频中对指定行人进行检索,该技术在智能视频监控、智能交通、智能安防等领域均有广泛应用,但由于视频拍摄角度不同、行人运动姿态多变、行人背景变化复杂、摄像机拍摄质量参差不齐、大雾大雨恶劣天气等影响,使得目前行人重识别精度不高,距离实际应用仍然有一定的差距。目前主流的行人重识别解决方案由特征提取和相似度度量这两大部分构成,前者用于提取具有表征性和鲁棒性的行人特征,后者将行人特征投影到更易区分的分布空间,从而提高行人重识别模型的检索能力。综上所述,本文针对特征提取和相似度度量提出了三种优化方法:设计一种自适应特征聚类网络结构,用于提取具有较高表征能力与鲁棒性的行人特征。自适应特征聚类网络由基础特征提取网络、特征聚类模块和分类模块三部分组成,选取ResNet-50网络结构作为基础特征提取网络,在获得行人特征图后,使用自定义的平面对称填充和一层卷积层对特征图做像素级的分类,并将同类特征聚类通过最大池化获得该类特征向量,分类模块由全连接层、BN层、ReLU层、全连接层串联组成,用于将行人特征投影到类别标签,同时取残差网中层特征与整体网络末端的类别特征的交叉熵之和作为网络最终损失,实现网络多重度损失融合,最后通过实验证明自适应特征聚类网络拥有较高的行人重识别准确率。提出一种度量损失函数AC-Margin,代替原网络中的交叉熵损失,让自适应特征聚类网络提取的行人特征具有更好的空间分布,提高网络对行人图像的检索能力。度量损失函数A-softmax中对特征角度信息进行了压缩,而度量损失函数Cosine Margin则对特征置信度进行了压缩,AC-Margin正是同时结合了两者的优化特点,对角度和置信度同时进行空间压缩,让网络提取的行人特征空间分布更优,即拉近同类行人特征间距,扩大非同类行人特征间距;实验证明,加入AC-Margin损失后可明显提高原网络对于行人图像的检索准确率。基于CBAM模块中注意力机制的建模方式,即同时对通道维度和空间维度使用注意力机制,将注意力模型分别加入到基础特征提取网络和特征聚类模块中,使自适应特征聚类网络同时具有特征聚类模块和注意力机制模块,提高网络在提取特征时的指向性,最后通过实验证明,该方法让网络提取到的行人特征更具表征性和鲁棒性。