论文部分内容阅读
抠图是图像合成的基础,在图像编辑、影视特效、虚拟现实等方面有着广泛的应用。本文围绕抠图存在的抠图精度低、抠图速度慢、依赖人工辅助三个痛点逐一展开研究;从启发式优化角度探索了求解自然图像抠图问题的新思路,提高了抠图精度;研究了多目标优化采样的抠图算法,实现了快速的高精度抠图;利用行人在红外成像中的先验知识研究了无需人工辅助的行人三分图全自动生成算法,实现了红外图像中行人的自动抠图。本文的主要研究内容包括:1)从启发式优化角度研究免采样抠图技术。将抠图问题建模为大规模的前景背景像素对(下文简称像素对)优化问题,利用启发式优化算法实现了免采样的抠图问题求解。针对启发式优化算法在大规模的像素对优化问题求解过程中容易陷入局部最优解的缺点,设计了自适应收敛速度控制器。利用像素对适应值和透明度遮罩相似程度的启发式信息准确度量个体竞争力及种群的收敛性,从而自适应地调节种群收敛速度,解决了启发式优化算法早熟的问题。2)利用像素对评价中单个准则的启发式信息以及局部像素相关的启发式信息,设计了基于模糊多准则评价与分解的多目标协同优化抠图算法,显著地提高了抠图精度。针对像素对评价中多个评价准则存在满足程度不确定的问题,提出了基于模糊逻辑的多准则前景背景像素对评价方法。通过对多准则单目标优化问题的分解充分利用每一个准则带来的启发式信息,通过像素邻域分组协同优化充分利用图像局部平滑先验信息,从而实现了精确的抠图。3)结合基于优化的抠图算法与基于采样的抠图算法,设计了像素级多目标全局采样算法。通过多目标优化采样的方式缩减大规模像素对优化问题的搜索空间,实现了高精度的快速抠图。通过将抠图多准则采样问题建模为多目标优化问题,并将多目标优化问题所有的帕累托最优解作为像素样本,克服了多个采样准则之间的冲突问题。通过提出的快速多目标优化算法实现了大量多目标优化问题的高效求解,从而达到了像素级采样的研究目标,避免了超像素级采样因聚类导致的最优像素对丢失问题。4)针对抠图所使用的三分图依赖人工标记的问题,本文以红外行人分类任务为例讨论了三分图的自动生成问题,探索了利用红外图像中行人成像的先验知识实现红外行人目标的三分图自动生成研究思路。在此基础上利用全自动行人抠图增强红外图像的前景轮廓并抑制杂乱的背景,并在红外行人分类任务上实现以较低计算代价获得深度学习算法性能的显著提升。