论文部分内容阅读
随着人工智能、概率图模型、机器学习的发展,计算机视觉有了重大突破,也使得图像实例分割成为了当今计算机视觉继语义分割、目标检测之后新的挑战任务。相比于传统计算机视觉任务,实例分割不仅要求区分图像中不同物体还要区分物体间不同个例,任务综合性很强。目前已有很多算法解决实例分割任务,这其中掩码区域卷积神经网络(Mask R-CNN)算法相对比较成熟,但Mask R-CNN还存在提高空间,尤其分割边界方面还存在比较大的误差。本文为解决Mask R-CNN边界问题做出了深入研究并提出改进方案,文章主要内容如下。
首先,对研究课题和背景做了综述,对实例分割相关原理进行说明,并阐述了近几年实例分割国内外研究进展,对经典分割模型做了详细介绍。
其次,为解决实例分割边界输出模糊问题,本文研究了Mask R-CNN和条件随机场结合的方法,该方法在掩码分支上使用卷积化条件随机场和全连接条件随机场来优化掩码分支对于候选区域的进一步分割,使得结果边界更为精确,并通过实验加以验证。
再次,为解决实例分割边框回归不准确导致边界掩码敏感问题,本文研究了改进的建议层,使得边界回归可以多保留一部分背景像素从而减少像素信息丢失情况,并通过实验证明其有效性。
最后,对于实例分割在数据选择、特征图、损失函数等方面的不平衡问题,本文使用平衡训练来改善最终模型,使得训练结果向更精确方向收敛,还提出模糊图像训练方式来进一步提高模型鲁棒性,并设计实验证明其可行性。
首先,对研究课题和背景做了综述,对实例分割相关原理进行说明,并阐述了近几年实例分割国内外研究进展,对经典分割模型做了详细介绍。
其次,为解决实例分割边界输出模糊问题,本文研究了Mask R-CNN和条件随机场结合的方法,该方法在掩码分支上使用卷积化条件随机场和全连接条件随机场来优化掩码分支对于候选区域的进一步分割,使得结果边界更为精确,并通过实验加以验证。
再次,为解决实例分割边框回归不准确导致边界掩码敏感问题,本文研究了改进的建议层,使得边界回归可以多保留一部分背景像素从而减少像素信息丢失情况,并通过实验证明其有效性。
最后,对于实例分割在数据选择、特征图、损失函数等方面的不平衡问题,本文使用平衡训练来改善最终模型,使得训练结果向更精确方向收敛,还提出模糊图像训练方式来进一步提高模型鲁棒性,并设计实验证明其可行性。