论文部分内容阅读
目标检测被广泛应用于行为识别、自动驾驶、航空航天等诸多领域。基于深度学习的目标检测算法的优秀性能离不开大量优质的数据集,如何制作优量的数据集仍是亟待解决的问题,样本增强是一个不错的解决思路。传统的样本增强方法受限于只是在原始图像上进行变换,往往效果不佳。随着生成对抗网络的出现,样本增强技术日渐趋于成熟,生成对抗网络通过对已有原始数据集的特征进行提取和组合,生成与原始样本不同的图像,为目标检测网络提供更多的图像特征。本文对近年来生成对抗网络的发展进行研究,以利用GAN的生成图像来增强数据集作为出发点,提出了一个适用于样本增强的算法框架。本文主要研究内容如下:1.对比用于图像生成的GAN,选取了DCGAN作为样本增强算法的基础网络。在DCGAN的网络中引入最小二乘损失函数、Wasserstein距离、Se LU激活函数和最佳噪声输入估计,提出了两套改进模型L-DCGAN和W-DCGAN。两个模型不仅在视觉上能够生成更高质量的图像样本,同时在生成效果的评价指标IS和FID上都要优于DCGAN。在MINST数据集上,同DCGAN的FID得分相比,W-DCGAN降低了44.6%,L-DCGAN降低了35.4%。在CIFAR-10数据集上,同DCGAN的FID得分相比,W-DCGAGAN降低了3.1%,L-DCGAN降低了7.1%,IS得分分别提升了4.3%和4.7%。在DOTA数据集上,同DCGAN的FID得分相比,W-DCGAN降低了10.1%,L-DCGAN降低了31.3%。2.在L-DCGAN的基础上设计了一套用于样本增强的算法框架,主要通过样本增广的方式实现数据增强。算法中设计了一种相似度匹配算法,该匹配算法通过对感知哈希、余弦距离和颜色直方图进行加权融合,寻找与生成图片最相似的真实图片。同时,基于Cycle GAN提出了一种图像风格转换方法,在Cycle GAN生成网络中的转换模块和解码模块中间加入自注意力模块,风格转换的效果有了显著提升。在DOTA数据集上,改进后的Cycle GAN的MMD评分相比于原始Cycle GAN降低了42.2%,horse2zebra数据集上降低了10.1%。3.最后将算法生成的增广数据集在主流目标检测网络上进行测试。相较于原始数据集,在m [email protected]指标上,最多提升了5.2%的性能,平均提升了3.75%的性能;在m [email protected]:0.95指标上,最多提升了5.5%的性能,平均提升了3.83%的性能。证明了这套算法框架通过样本增广来提升目标检测的性能是有效的。