基于用户点击信息的图像搜索重排序研究

来源 :中国科学院大学 | 被引量 : 0次 | 上传用户:FACYFACYFACY
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近些年来,随着Web2.0的蓬勃发展,以图像为代表的多媒体数据呈现爆炸式增长。为了满足用户大量的搜索需求,建立快速有效的搜索系统成为了一个亟待解决的问题。现阶段,大多数搜索引擎采用了基于文本的搜索技术,利用图像周围的文本建立索引并进行搜索。然而,图像的文本往往具有噪声大甚至缺失的问题。为了解决基于文本的图像搜索所面临的问题,图像搜索重排序作为一种能够有效提升图像搜索效果的手段,在近些年来受到了多媒体研究领域的广泛关注。  目前的图像搜索重排序虽然已取得了一定的进展,但由于图像底层特征和高层语义慨念之间的语义鸿沟尚存,而查询文本表达和用户搜索意图之间的意图鸿沟日益加剧,图像搜索重排序中还存在许多问题需要研究。获取用户搜索意图最直接的方式是使用相关反馈机制,通过与用户交互获取其显式反馈,然而这种方式过程复杂、用户体验差。为了提升用户搜索体验、满足用户搜索需求,本文尝试将能够提供用户隐式反馈的用户点击信息引入到图像搜索重排序中。作为一个创新性研究课题,图像搜索重排序在运用用户点击信息的过程中面临着如何引入用户点击信息、如何解决由用户点击信息噪声引起的点击偏差和如何利用尾查询的有限用户点击信息三方面的问题。  针对以上问题,本文就基于用户点击信息的图像搜索重排序进行了深入探讨和研究,并提出了相应的解决方案,主要工作和创新之处可以总结为以下几点:  为了探求用户点击信息在图像搜索重排序中的作用,本文提出了基于点击促进的图像搜索重排序。该方法在点击促进的基础上执行随机游走,利用单一视觉特征对图像相关重复模式进行挖掘以初步克服点击偏差问题。在常用搜索引擎上收集的Query40-Image20k小型数据集上进行的实验表明,该方法在NDCG@10得到了高于初始查询结果6.67%的提升,且与现有重排序方法相较获得了更令用户满意的搜索结果,充分验证了用户点击信息在缩减意图鸿沟上的有效性。  为了有效克服用户点击信息的点击偏差问题,本文提出了基于多特征的图像搜索重排序,包括基于点击信息的多特征自适应融合图像搜索重排序和基于点击信息的多特征度量学习图像搜索重排序。前者利用点击信息进行强监督学习,结合多特征自适应融合充分挖掘图像相关重复视觉模式;后者利用点击信息进行弱监督学习,使用多特征进行有关图像相似性和图像典型性的度量学习。在常用搜索引擎上收集的Query519-Image100k大型数据集上进行的实验表明,与点击促进结果相比,以上两种方法可以在NDCG@5上分别取得5.07%和7.55%的提升,充分展示了基于多特征的图像搜索重排序在克服点击偏差问题上的优越性。  为了提高尾查询在图像搜索研究领域的关注并有效利用尾查询的有限用户点击信息,本文提出了面向尾查询的图像搜索重排序。该方法利用多特征自适应融合以克服尾查询文本信息模糊的问题,同时借助图像点击对来增加训练数据以解决尾查询点击信息有限的问题。在常用搜索引擎上收集的TailQuery100-Image10k尾查询数据集上进行的实验表明,该方法可以在NDCG@5和NDCG@10分别取得高于初始查询结果10.88%和9.12%的提升,且其重排序结果优于其他现有重排序方法,充分证明了其在提升尾查询搜索效果和满足用户搜索需求上的优势。
其他文献
随着信息技术发展和企业信息化进程的不断推进,企业里分散孤立的应用系统越来越多。这些系统可能涉及不同的技术,使用不同的开发语言以及运行在不同的平台。这种异构情况给企业
Diffie-Hellman(DH)密钥协商协议是一种安全协议,它可以让双方在完全没有对方任何预先信息的条件下通过不安全信道创建公共密钥,该密钥可在后续通讯中作为对称密钥加密通讯内容
WSN (Web Service Notification)是由OASIS组织制定的一套用于发布/订阅系统的标准,定义了通过使用基于主题的发布/订阅模式进行通知的Web服务规范。订阅者向消息生产者发送订
随着Web服务与面向服务的体系架构(Service-Oriented Architecture,SOA)的发展,越来越多的服务提供商致力于开发、提供Web服务,并在服务注册时提供服务定义关键字对服务进行
企业规模的不断变大,市场竞争的不断增强,信息技术的不断发展推动多媒体客户联络中心飞速发展。客户联络中心已经成为企业提高竞争力,为客户提供高效率,高品质服务必不可少武
近年来,随着互联网、云计算等技术的发展,人类社会所产生的数据正以前所未有的速度在不断的增长和累积,我们已经步入大数据时代。研究大数据的意义在于从数据中发掘重要信息,为人
在机器人技术发展的过程中,机器人示教编程技术是衡量一个工业机器人应用的灵活性和智能化程度的重要指标。会话式编程作为一种编程方式,就是在图形界面上通过提示信息的方式来
智能硬件和交互技术的快速发展为图像和视频的观看带来极大的便利。例如人们可以在各种各样不同尺寸屏幕的显示终端上观看图像/视频,也可以通过交互技术任意设定图像/视频的目
无线传感器技术在国防军事、环境监测、电力系统等领域体现出许多的优越性,有着广泛的应用和发展前景。由于无线传感器网络的自组织性、网络拓扑结构和网络环境动态变化、节
随着网络信息的爆炸式发展而导致信息过载和搜索引擎系统本身的被动性搜索过程,推荐引擎系统受到了越来越多的关注和研究。推荐系统当前主要的研究方向是冷启动问题,矩阵稀疏