论文部分内容阅读
随着多媒体技术的不断进步和计算机网络技术的飞速发展,如何有效地管理和检索图像成为一种迫切的需求。图像自动标注在基于语义的图像检索系统中发挥着重要的作用。在图像自动标注中,仍然存在着一些问题需要进一步解决:图像的特征提取;标签之间的相关性;复杂标签的多义性。本文主要针对这三个问题展开研究,主要工作如下:(1)针对图像的特征提取和标签的相关性这两个问题,提出基于张量罚偏最小二乘(Tensor Penalized Partial Least Square,Tensor-PPLS)的图像自动标注算法。结合图像的底层特征和张量结构,将图像表示为张量,张量可以保持像素间的结构性和相关性。然后采用多线性主成分分析(MPCA)进行降维,去除冗余信息。最后采用Tensor-PPLS算法进行图像标注,Tensor-PPLS算法在保持标签相关性的同时,还考虑到标签的稀疏性。在Corel5K,IAPR TC-12,MIRFlicker这三个标准数据集上的实验结果表明,所提的算法标注性能良好,张量结构对图像标注有一定的帮助。(2)提出基于协方差描述子快速多示例多标签(Covariance Fast Multi-Instance MultiLabel,C-fastMIML)的图像自动标注算法,该算法考虑到了上述的三个问题。首先对图像进行分割,采用协方差特征描述每个区域。区域协方差矩阵可以融合多种特征,很好地表示图像中的对象信息,并且拥有较低的维度。然后在MIML框架下提出C-fastMIML算法,进行图像标注。C-fastMIML算法考虑到了标签的相关性以及复杂标签的多义性问题。在标准数据集Corel5K和IAPR TC-12上的实验结果表明,所提的算法不仅拥有较好的标注性能,而且拥有较高的效率。