论文部分内容阅读
随着社交网络的兴起以及高清数码相机的普及,图像数据的数量正以指数级的速度增长,如何快速有效地检索和管理这些海量的图像数据成为当今计算机视觉和大数据领域的研究热点。图像自动标注技术作为图像理解和检索的基础,越来越受到研究人员的关注,然而当前绝大多数的图像自动标注算法以全图语义分析为基础,忽略了区域语义及其语义位置关联对图像内容深层次理解的重要性。 本文针对图像区域语义分析及区域位置关联分析,提出了两种网络图像的区域语义分析方法:基于半监督学习的图像区域标注算法,以及基于语义和位置上下文关系的图像区域标签修正算法。主要工作如下: 第一,提出了一种基于视觉语义关系图的网络图像区域标注算法。本文在已标注图像数据集上构建了一个涵盖图像全局相似性关联子图、图像区域相似性关联子图、图像区域标签语义关联子图,以及各子图之间的关联的三层的立体化视觉语义关系图。然后,通过对网络图像的上下文信息进行分析,将未标注图像插入视觉语义关系图,在新建立的视觉语义关系图上实现跨层次的随机游走,从而得到未标注图像区域的标签。此外,本文通过对网络图像的文本上下文的语义分析实现了对图像的全局标签扩展。实验证明,本文提出的半监督图像标注算法在提高图像区域标签准确性的同时,大大提升了图像全局标签的丰富度。 第二,提出了一种基于空间位置关系图的图像区域标签修正算法。本文构建了一种包含语义共现关系和空间位置关系的空间位置关系图来揭示图像区域之间的潜在语义关联。然后,采用增量迭代随机游走算法重构区域关系图,以此检测对图像标签上下文环境契合度低的非置信标签区域。最后,利用语义相关性分析和空间位置关系分析的子图配算法进行非置信标签重预测。在公共标准数据上的实验证明了本文提出的基于空间位置关系图的图像区域标签修正算法的有效性。