论文部分内容阅读
当今是图像爆炸式增长的时代,急切需要与之相适应的图像管理和检索能力。图像标注不仅可以为普通用户提供与之使用习惯更加符合的以Web图像搜索为代表的图像检索服务,还将为图像数据的组织、索引、管理带来革命性的变化,甚至能够推动图像理解及整个计算机视觉领域的发展。此外,图像标注在商业应用、数字图书馆、军事、生物医学、网络监控、国家安全等方面也有重要的意义。本文首先介绍了图像标注的一些基础知识,包括图像分割,特征提取,标注模型以及评价标准等。图像分割分为固定划分和N-Cut算法,在特征提取方面,介绍了颜色、纹理、形状等特征。评价标准主要是查全率和查准率。本文重点介绍了图像标注的模型,其中三个主要的模型分别是基于分类的图像标注,基于概率模型的图像标注和基于主题的图像标注。前两个模型试图直接寻找图像(或图像区域)与文本标注词之间的关系,而基于主题的图像标注模型则通过引入潜在主题概念建立高层语义与低层视觉特征之间的联系,从而实现自动图像标注。目前,基于机器学习的图像标注方法得到了广泛的应用和发展。其中,学习器模型的选择就显得非常重要了。本文围绕如何提高标注效果和效率展开了研究,并提出一种基于极限学习机(ELM)的图像标注算法。本方法的特征向量采用的是颜色特征、纹理特征以及SIFT特征组成的复合特征向量,能比较全面的反映图像的特征,有效提高了检索的效率。模型训练中,采用ELM算法,因其结构简单、学习速度快,大大缩小了模型训练和标注的时间。随着ELM的发展,理论研究和实践表明,ELM不但可以用于神经网络中,而且在多分类应用中也有不错的性能表现。本文实验结果表明,采用ELM算法不但在时间开销上有着巨大的优势,同时其良好的泛化性能提高了算法的准确性,二者的综合效果使得图像标注的性能得到了有效提升。最后,在本文算法的基础上设计和实现了图像检索演示系统。