论文部分内容阅读
随着移动互联网和社交网络的发展,互联网中图片等多媒体信息成为信息主流,大多数用户都习惯于以图片的方式分享自己的最新动态,这极大的增长了网上的图像数量。IT技术的飞速发展使得世界上各个地方的人们都可以方便地以不同方式来获得自己所感兴趣的内容,这也使得用户对图像的需求进一步增加。而传统的通过文本来检索图像描述信息的图像搜索方式已不能满足需求。面对如此海量的图片及其中包含的海量信息,如何高效地存储以及快速的从中检索到符合用户需求的图片,已经成为多媒体和信息检索领域关注和研究的重要课题。本文的主要研究内容是基于特征融合的图像检索中的图像特征提取算法与索引匹配技术两方面。详细地对比介绍了图像低层视觉特征提取技术,系统分析和研究了索引与匹配关键技术。本文的主要的研究内容和贡献如下:通过在Holidays数据集上对常见的颜色、纹理全局特征与SIFT, SURF局部特征进行详细地单一特征图像检索实验对比。通过分析它们各自在特征提取时间、索引时间、检索时间以及平均准确率这几个方面的优缺点的基础上,设计出一种既结合了局部SURF特征提取算法优势,又结合了全局CEDD特征提取算法优势的特征融合提取算法。检索实验结果表明,基于特征融合的图像检索能够在保持图像提取效率的情况下,取得比基于单一特征的图像搜索更好的mAP检索效果。由此说明特征融合算法能有效提高图像特征的区分度和健壮性。然后利用经典高效的BoVW方法对提取到的特征建立倒排索引结构并保存到Lucene索引文件中,并在此基础上通过加入Hamming Embedding、Soft-Binning等方法,进一步提高了检索结果的平均准确率,并使其能够应付大数据集索引与检索的要求。并且本文设计并实现了一个基于特征融合的JavaWeb图像检索系统“一点搜图”,最后论文总结了全文的主要工作以及不足之处,并提出了进一步研究的可能方向。