论文部分内容阅读
语义分割是计算机视觉任务的基础,其目的是将场景划分为不同的图像区域,并为场景中的每个像素分配一个对应的语义标签。该技术目前广泛应用于地学信息系统(GIS)、自动驾驶以及医学等诸多领域。同时,深度学习热潮也推动了语义分割发展。如何增强网络特征表示能力、减少图像细节的丢失以及减少模型计算代价已成为语义分割任务的重点。对于提高网络特征表述能力以及减少图像细节的丢失,提出了双边注意力网络。其中相关系数通道注意力模块获取通道响应间的信息,并以此为权重对各个通道间的信息进行加权融合,增加了特征的表征能力。在解码结构中提出的位置注意力模块增强了特征的空间信息,在与高维特征融合后,取得了较好的效果。与现有注意力机制相比,所提出注意力模块能捕获更多的上下文信息,因此能获得更好的结果。针对目前键值对注意力模式计算代价大的问题,提出了一种轻型注意力模块,该模块在减少计算代价的同时还能进一步的提升网络性能。此外,针对双线性差值上采样在图像边缘细节处理不当的问题,提出了改进的上采样模块。最后将两者结合提出新的网络。