论文部分内容阅读
近年来,多媒体信息技术发展迅速,智能终端每天都会产生海量未经管理的多媒体数据,特别是图片数据快速增加。为了能够快速且准确的在海量多媒体数据中进行检索,图像检索技术逐渐变成多媒体领域的热点课题,并被广泛的应用于日常生活中的各个方面。本文基于传统的单个类别查询图片的检索系统,提出多个不同类别查询图片的检索系统,为了实现我们所提出的检索任务,我们提出多个样本特征加权融合的检索算法,有效解决多个不同类别查询图片进行检索。在基于内容而开发的图像检索系统中,最为重要的一点就是找到一种表达能力强的特征来描述图片,很多传统的检索系统会选择图像的底层视觉特征,例如图像的颜色,纹理和形状等特征来表达图片信息。本文,我们使用2012年提出的AlexNet网络作为我们提取卷积特征的基础网络。通过一个简单的例子来介绍我们的检索系统,假设我们输入的两张查询图片分别是“猫”与“狗”,我们希望在候选数据中查找到同时包含“猫与狗”的那类图片。通过调查我们发现现有的多个查询样本的检索系统无法直接实现我们的检索任务,主要的差别就是查询图片所属的类别问题,我们输入的查询图片完全属于两个不同的类别。由于查询图片属于不同的类别,为了能够直接反应二者在检索过程中的重要性,我们提出特征加权的方法,通过权重来体现二者之间的相对重要性。本文的成果与创新之处总结如下:(1)最近卷积神经网络在大规模图像分类比赛ImageNet上取得了非常的成绩,将图像分类的top-5错误率降到5%以下,在集成模型的情况下已经超过了人类的表现,所以我们选择卷积特征作为我们检索图像的特征描述,同时选择SIFT特征作为对比实验。(2)本文的重点是如何为每个查询图片的特征分配权重,一旦求解出权重大小便能够解决我们所提出的检索任务。我们使用K-Means算法将候选图片的卷积特征进行聚类处理,在这些聚类中心中找到一个离两张查询图片的距离是最近的。在查找到这个聚类中心后,我们便将距离之间的比值作为权重。(3)为了证明所提出的多个样本特征加权融合算法的有效性,我们在两个公开的数据集上进行验证。因为我们检索任务的特殊性,所以我们对着两个公开数据集进行适当改造。通过对比实验证明,卷积特征与SIFT特征相比具有更强的表达能力,其次是我们提出的特征加权算法可以有效解决我们提出的检索任务。