论文部分内容阅读
近年来,随着深度学习和卷积神经网络模型的发展,计算机在视觉任务上(图像分类和识别,目标检测和语义分割等)的能力已经大大提高。深度模型通常需要依赖大量的可用标注数据做训练才能取得很好的效果。然而,对于海量数据的标注是一个费时费力的过程。为了降低标注成本,并且有效利用容易大量获取到的无标注测试数据,域适应技术通过将训练数据域(源域)和测试数据域(目标域)的分布进行对齐,使得训练数据上学习到的知识迁移到测试数据上,从而提高算法的整体性能。本论文将生成式对抗网络(GAN)中的对抗学习思想结合到无监督域适应问题中,在目标域没有标签的前提下,通过对抗训练的方式将源域图像通过一个生成网络转换为逼近目标域的图像,从而将转换后的图像分布和目标域分布对齐,最后根据生成图像和源域对应的标签训练目标分类器,得到在测试数据上有良好性能的模型。基于上述框架,论文提出两种改进算法。首先,提出基于注意力机制的对抗域适应算法。为了保持转换后图像仍然有和源域图像相似的语义,该算法定义了一个不需要额外标签或者掩模标注的语义一致性约束,分别从整体和细节上对图像的语义进行约束。该算法生成的图像不仅在整体上有和源域图像一样的预测标签,同时,在空间细节上,还有相似的注意力区域。受深度学习中视觉注意力对准机制启发,该算法提出的空间细节上的注意力约束提升了源域图像转换后的图像质量和结构稳定性。其次,提出基于Wasserstein距离的对抗域适应算法。该算法使用基于Wasserstein距离的对抗损失代替传统GAN目标函数。该算法直接使用源域和目标域数据分布估计经验Wasserstein距离,可以对源域和目标域差异作出更加准确的估计。基于Wasserstein距离的对抗域适应算法可以提升对抗学习的稳定性并有效改善模式崩塌现象。最后,论文在SVHN-MNIST以及Office-Home Product-Clipart两个域适应任务上评估了所提出的改进算法。实验结果表明,两种改进算法能有效提高生成样本的质量以及目标分类器的识别准确率且均优于现有的域适应算法,如迁移成分分析、域对抗神经网络等。同时,实验结果也表明:基于Wasserstein距离的对抗域适应算法在速度上更胜一筹,而基于注意力机制的对抗域适应算法则可以处理更加复杂的任务且更通用。