论文部分内容阅读
文章讨论了基于视频到视频的行人重识别的深度学习方法,提出的网络模型主要由特征表示子网络和相似性度量子网络两部分组成.首先利用残差网络提取视频的每帧图像的特征,再该特征输入到长短期记忆网络中获取时空特征,在长短期记忆网络层后添加权重模块,在该模块中使用帧质量注意力机制为视频的每一帧分配适当的权重.进一步将加权后的特征向量传入相似性度量子网络进行距离度量学习,在该框架中,将特征表示与相似性度量使用全连接层进行连接,同时学习和优化特征表示和相似度度量学习.最后在两个公共数据集上进行实验,通过一系列对比实验