论文部分内容阅读
近年来,在基于内容图像检索研究领域,由于图像底层视觉特征与高层语义间“语义鸿沟”问题的存在,图像语义自动标注技术得到了广泛的研究。本文主要围绕着图像自动标注技术开展工作,论文首先介绍了图像标注与检索技术的现状、图像标注涉及的关键技术,在此基础上,提出了基于GMM(高斯混合模型)与PLSA(概率潜语义)的图像标注方法,并进一步基于反馈日志来提高标注效果。 论文的主要工作及创新如下: (1) 对图像标注关键技术进行了梳理和总结,主要包括图像特征、图像标注模型、反馈技术、相似性度量及图像标注性能评价方法。 (2) 针对图像背景区域干扰的存在,基于图像前后背景分离思想,并分别提取的图像特征,通过使用 PLSA 在图像底层特征与标注词之间插入隐含主题,并建立隐含主题与标注词之间的关系;然后使用 GMM 通过机器学习建立模型参数,通过该模型完成图像标注。在此基础上,文中又设计了一种融合多特征(颜色特征、形状特征和纹理特征)的基于PLSA-GMM的图像标注方法。 (3) 为了减少底层特征与语义之间的差距,文中将日志反馈技术引入到自动标注中,基于日志信息、WordNet与PLSA-GMM模型,通过系统反馈来提高图像标注的性能。 (4) 基于上述图像标注模型,基于JAVA语言,实现了一个图像标注与检索的原型系统。