论文部分内容阅读
随着移动设备的日益普及,加之社交平台的广泛传播,图像的种类和数量正在以超凡的速度呈现爆炸式的增长,如何对大规模的图像数据进行有效地检索,已成为一个重要的研究课题。图像检索有两种查询范式:关键字查询和样例查询。但是,这两种查询范式都有各自的问题:在关键字查询中,存在用户表达和用户真实意图之间的意图鸿沟问题;在样例查询中,存在从图像中提取的底层视觉特征和图像所传达的高层语义概念之间的语义鸿沟问题。针对以上两个问题,研究人员主要采用显性或隐性反馈信号引导检索系统对初始查询结果进行重排序。图排序模型是目前执行图像重排序任务的主流技术手段,且具有较好扩展性,可有效利用显性或隐性反馈信号进行学习。然而,现有的大多数图排序模型仅能融合从单一信息源获得的同构特征,无法充分利用异构特征之间的互补信息。因此,本文提出了一种基于多图排序模型的图像检索方法,在点击日志特征和视觉特征上分别构建数据图结构,有效地利用多种信息源之间的互补性,从而改善图像排序结果。本文取得的研究成果可以简单概括为以下两点:(1)基于多图排序模型的图像检索方法。传统的多图排序模型仅能融合从单一信息源获得的同构特征,对图像排序结果准确性提升有限。因此,本文融合从多种信息源获得的异构特征,提出了一种基于多图排序模型的图像检索方法来优化排序结果。该方法同时考虑到了多个来源的不同数据,拥有更加丰富的信息支持,显著提高了图像检索的效果。经通用数据集验证,本文提出的方法与该领域其他代表方法相比,能获得更优的排序结果,改善了图像检索的质量。(2)点击日志清理方法。现实中的点击日志数据有其不可避免的噪声问题,严重影响图像检索的质量。本文受近邻投票算法启发,提出了点击日志清理方法,该方法通过判断点击日志数据的可信程度,修剪其中的不确定性点击,从而降低了点击日志的噪声水平。