论文部分内容阅读
随着互联网的迅猛发展,网络多媒体数据与日俱增,其中网络图像数据的增长尤为明显,仅仅在Facebook论坛上,每天就有超过3亿张图像被上传和分享。在淘宝网上,每天的在线商品数量大约有5亿,商品图像数据超过了15亿。面对这些海量繁杂的网络图像数据,如何快速有效的检索需要的图像成为现在的研究热点。 对此,本文以图像检索中经典的词袋(Bag-of-Word)模型为基础,并结合网络图像包含大量伴随文本的特点,提出了基于关联图增强的网络图像检索算法,主要思想为构造关联图,利用关联图对视觉单词和伴随文本两个模态的检索结果作二次优化检索。本文的主要工作如下: 首先,搭建了一个基于词袋模型的图像检索实验系统,采用多种方法生成不同的图像视觉单词,通过对比实验,设计了一种比较适合检索网络图像的视觉单词提取方式。 其次,为了更好的融合视觉单词和伴随文本的检索结果,本文提出基于关联图模型的二次检索。将初步检索的结果在关联图上作随机游走,得到充分融合后的结果。为了让算法能够处理海量规模的数据,本文作了进一步的优化,将关联图分割成若干子图,每次检索只使用少量子图,有效的减少了数据规模。 最后,通过对比实验证明:相比于传统的图像检索方式,本文提出的图像检索优化算法能够得到更为准确的检索结果。