论文部分内容阅读
随着互联网技术的发展,数字图像的数量急剧增长,基于内容的图像检索技术引起了国内外学者广泛的关注并取得了显著的研究成果。近几年随着当今社会触摸屏设备如平板电脑和智能手机等的普及,人们开始将关注的重点转移到基于手绘草图的检索技术中。在触摸屏设备的帮助下,各个年龄段、各种绘画水平的人都可以轻松绘制出浮现在脑海中的物体,进而通过手绘的线条图在大量图片库中找到与之形状类似的图像。基于草图的图像检索这一概念最早在20世纪80年代被提出,但是之后却一直进展较慢,主要是因为手绘草图中线条的多变性和不确定性使得线条的特征表示、特征匹配以及适合大规模数据库的索引结构的建立等方面充满了困难和挑战。2010年微软亚洲研究院提出的可以不依赖关键字,只根据草图中物体线条的特征匹配在大规模图片数据库上进行实时检索的草图搜索系统MindFinder再一次引发了人们对草图搜索的研究热情。本文提出的基于手绘草图的图像检索系统采用“词袋模型”来表示草图,每幅草图均可表示为与视觉字典中的单词相关的直方图。在特征提取过程我们使用的局部特征描述子是经过改进的梯度方向直方图特征--基于草图梯度场的梯度方向直方图(GF-HoG),该特征能够有效地表示由线条构成的草图;在构建视觉字典时我们采用分层K-means聚类算法,该聚类算法与传统的K-means聚类算法相比能获得更精确的聚类结果。最后通过比较输入草图与图像库中图像之间的余弦相似性实现库内检索过程,通过多类SVM分类器可以得到输入草图所属类别的关键字,将关键字送至搜索引擎能够实现在线检索。我们在Eitz提供的手绘草图数据库和Microsoft Office文档中提供的形状图数据库中进行了一系列实验,实验结果表明本论文提出的手绘草图检索算法与MindFinder和Eitz的草图检索算法相比效果更加显著。