论文部分内容阅读
行人重识别又称行人再识别,旨在通过匹配行人图像,联合部署在不同位置的非重叠监控摄像头来寻找特定行人,该技术对于智能视频监控的研究发展至关重要。利用注意力机制来优化行人重识别网络提供了一种有效且可并行化的特征强化方法。注意力机制可以在引入少量参数的情况下,实现对于特征中的关键信息进行加权强化,减少无关信息带来的干扰,进而提高行人特征的判别性。本课题针对注意力机制在行人重识别中的应用展开了研究,论文主要研究内容及成果如下。(1)本文提出了一个跨层级强化注意力网络(Cross-level Reinforced Attention CNN,CLRA-CNN),用以解决现有大多数注意力方法仅针对当前层级特征建模注意力关系,同时无意义信息仍占据一定权重而给模型训练带来干扰的问题。首先,设计了一个跨层级特征融合模块(Cross-level Feature Fusion,CLFF)自适应地融合不同层级特征来指导后续注意力模块的生成。其次,本文将软注意力与强注意力方法相结合设计了一个强化注意力模块(Reinforced Attention,RA),分别在空间和通道两个方面对于特征进行权重调整。最终,将CLFF模块与RA模块相结合,得到了跨层级强化注意力模块(Crosslevel Reinforced Attention,CLRA)集成到基础网络中以优化行人重识别任务。(2)本文提出了一个多尺度压缩强化注意力网络(Multi-scale Compressed Reinforced Attention CNN,MSCRA-CNN),用以解决大多数注意力方法仅针对固定尺度特征建模注意力关系的问题。首先本文设计了一个多尺度特征融合模块(Multi-scale Feature Fusion,MSFF),通过联合多尺度特征,使得模型能够根据输入自适应地调节感受野尺寸。其次,为了提高RA模块的实时性,提出了压缩强化注意力(Compressed Reinforced Attention,CRA),分别从空间和通道两个方面实现对于特征的压缩,并利用压缩后的特征来建模空间位置或通道间的相互依赖关系。最后将MSFF模块和CRA模块进行组合得到整体的多尺度压缩强化注意力(Multi-scale Compressed Reinforced Attention,MSCRA),并将其嵌入基础网络中实现对于行人特征的强化。(3)本文提出了一个多尺度注意力多分支网络(Multi-scale Attention Multi-branch CNN,MSAMB-CNN),针对大多数工作更多关注行人图像中最显著信息,而对于次显著细节信息关注不足的问题,实现图像显著信息及次显著信息的协调统筹。首先,本文将简化的多尺度特征融合方法与双重注意力机制相结合,设计了一个多尺度注意力模块(Multi-scale Attention module,MSA)实现对于全局特征的加权强化。其次,将MSA模块与批量特征丢弃方法相结合得到加权特征丢弃方法,实现对于局部特征的加权强化。进一步地,提出一个模糊图像切分策略与加权特征丢弃方法相结合获取更加细节丰富的局部特征。最后建立一个多分支网络,实现对于全局特征和多元局部特征的协调统一,得到更具判别性的特征用于最终识别。综上所述,本文提出了三种基于注意力机制的行人重识别网络:CLRA-CNN、MSCRA-CNN以及MSAMB-CNN,且在多个公开数据集上通过大量实验论证了本文所提算法的优良性能。