论文部分内容阅读
查询性能预测是图像检索领域研究的前沿问题。该技术试图在没有相关信息(即未知检索返回结果与查询的相关程度)的情况下,自动评估检索系统对某一查询返回结果的质量高低程度。图像检索查询性能预测技术能够很好得为检索用户和检索系统服务。鉴于对查询性能预测技术在文本检索和图像检索现有工作的深入研究,本文提出了两种全新的查询性能预测算法:(1)直接估计图像检索返回结果的平均准确率的方法;(2)研究查询文本与检索返回图像列表间的相互关系来评估图像检索结果质量的方法。(1)直接估计图像检索返回结果的平均准确率方法:一般来说,给定一个查询,衡量某检索系统对其检索返回结果质量好坏的指标主要是AP (Average Precision,平均准确率),那么一个直观的想法就是直接对某个查询的检索返回结果进行平均准确率的估算。基于对AP计算公式的详细分析推导,本文提出了两个可以估计平均准确率的思路:a)直接估计检索返回列表中每张图片与查询的相关性,如果被判为相关就记作1,否则记作0;b)估计检索返回列表中每张图片与查询的相关性概率,而不是简单的0和1。在得到每张图片与查询的相关性关系后,然后利用事先推导好的AP计算公式来估计平均准确率,从而完成图像检索结果质量评估任务。(2)研究查询文本与图像检索返回结果间的相互关系方法:一般来说,对于一个简单的查询,检索系统返回的结果比较好,换言之,返回图片之间的视觉相似性比较高,我们可以轻松得从返回图像列表中推测出查询目标,也就是说查询文本与返回图像列表所表针的视觉主题保持高度的一致性;但是对于一个困难的查询,检索系统返回的结果比较差,返回图片之间视觉差异性很大,我们很难只从返回图像列表推测出它们对应的查询文本,也就是说查询文本与返回图像结果之间的相关性很低。基于上述观察,我们可以很容易得出如下推断:如果查询文本与返回图像结果的视觉主题保持高度一致性,则这个查询比较容易,即图像检索结果质量比较高,反之,那个查询比较困难,即检索结果质量比较低。因而,研究好查询文本与检索返回结果间的相互关系,我们就能很好的完成图像检索结果质量评估任务。本文主要以图像检索查询性能预测算法为研究方向,并通过大量实验结果验证算法的有效性。对于算法中讨论不足之处,在以后的研究工作中会予以关注。