基于隐式相关反馈的无查询服装图像检索

来源 :上海交通大学 | 被引量 : 0次 | 上传用户:meidoc
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
图像检索是机器视觉的重要研究方向,在电子商务、公共安全等领域有广泛的应用。近年来随着深度学习的发展,基于内容的图像检索技术取得了显著突破。这种“以图搜图”的检索方式应用的前提是必须有一张查询图像。然而很多应用场景难以满足上述前提,比如在街上或者电视上看到了一件感兴趣的衣服却无法对其拍照。我们将这类问题定义为“无查询图像检索”问题,即需要检索的目标图像只存在于人的记忆里。本文围绕无查询图像检索问题开展研究,并以服装检索为具体应用场景,探索通过隐式相关反馈的方式实现无查询服装图像检索。隐式相关反馈的方式具体来说就是在检索系统推荐的图像中,用户每次选取一张和他/她心中的查询图像最相似的。系统会根据用户的点击进行下一轮的推荐,并通过这种交互的方式迭代地找到目标。这个过程中最为关键的部分是系统怎样根据用户的点击进行下一轮的推荐,这也是本文所探讨的重点。在对此问题原有研究的基础上,本文提出了基于贝叶斯的特征权重调整算法。不同于原有只对目标图像建模的方法,本文提出的基于贝叶斯的特征权重调整算法对目标图像和图像特征两个变量进行建模。通过两者互为条件变量构建的贝叶斯算法框架,实现了依据每一轮用户的单次点击,便可对目标图像和图像特征的后验概率分布同时更新。面向310名真实用户,我们在构建的在线检索系统中进行了同域检索和跨域检索下此算法和多种对比算法的实验,得到了有效的实验结果,并进行了大量的分析。实验分析表明特征权重可以较好地模拟用户的决策过程,相比于原有算法,本算法能够显著提高检索成功率,缩短检索完成轮次。受到增强学习的应用的启发,我们认为无查询图像检索系统同样也具备通过试错自行学习如何进行推荐的条件。对系统怎样调整权重进行全新的探索,我们在基于贝叶斯的算法框架下提出了基于深度增强学习的特征权重调整算法,具体使用的权重调整算法替换为了可以在连续动作空间进行选择的深度确定型策略梯度算法。针对所要解决的无查询图像检索问题,我们对深度确定型策略梯度算法的状态、动作和奖励进行了合理的定制,并模拟出理想用户对模型产生了大量的训练数据,然后在理想用户的情况下针对此算法和多种对比算法进行了实验。实验结果表明本算法相比于原有算法同样有显著提高,但相较基于贝叶斯的特征权重调整算法稍有差距,我们对差距产生的原因进行了较为深刻的分析并对未来的工作进行了展望。
其他文献
卷积神经网络(Convolutional Neural Networks,CNN)近年来在图像分类、目标检测、视频语义分析等领域取得了突破性的进展,其强大的特征学习与分类能力得到广泛的关注。由于卷
近年来,世界发生着翻天覆地的变化,科技人才和科研成果创新成为了推动着社会进步、百姓富裕、国家繁荣昌盛的最重要力量,也是国家在未来国际关系中决胜的关键。过去对于科研成果的评价体系中,主要是以情报人员、研究人员和专家学者为主导进行评价总结,使得评价结果不够准确和客观,专家人工筛选所有资源和研究成果的工作量非常巨大,成本很高。通过梳理近几年来对于科学论文重要性评估的评判标准,发现大部分的分析方法是利用科
分类是机器学习和模式识别领域的经典问题之一。对有监督分类任务,分类器从训练样本中学习知识,并调整自己的行为来实现更好的分类表现。许多经典的方法被提出用于解决分类问题,例如支持向量机、神经网络、贝叶斯分类器、决策树等。在这些方法中,神经网络凭借其易于构建和优异的近似能力,被广泛的应用于分类任务中。神经网络的分类过程可以从几何角度被解释。在分类过程中,神经网络将待分类样本从原始的数据空间映射到一个新的
随着互联网技术的飞速进步,全球信息时代得以快速发展,各种新闻数据急剧增加,其中隐含着大量信息和资源;同时很多发展中国家的网络用户快速增长,使得互联网上各种语言的文本数据持续增加。在这种全球化形式下,仅仅获取本国的新闻信息已远远不能满足一个国家或一个大型企业机构在国际地位的需要。跨语言文本的信息组织是一个不可忽视的问题,而单语文本聚类方法几乎不能满足实际需求,因而双语或者跨语言的文本聚类成为了人们研
随着科学技术的进步,许多学科领域对高算力有着无限的渴望,比如深度学习、大气及洋流的模拟仿真、计算化学、空气动力学等等无不依赖多处理器计算机。随着多处理器计算机处理器数量的不断增加,其互连网络构架的收益已经远远高于设计新处理器的收益。具有复杂互连网络结构的多处理器计算机系统维持其可用性的关键环节是互连网络的系统级故障诊断。在系统级故障诊断的研究中,学者们发掘出了诸多诊断模型,但性能优良的诊断算法并不
目的:探讨结肠癌转移相关基因(metastasis-associated in colon cancer-1,MACC1)蛋白表达与胃癌临床病理的相关性。方法:检索英文数据库:PubMed、Embase、Cochrane Library、web of science和中文数据库CNKI、VIP、WanFang Data,采用文献追溯以及手工检索等方式搜集所有关于MACC1蛋白表达与胃癌临床病理学参
研究背景心力衰竭是由于各种心脏结构和/或功能性疾病导致心室收缩和/或舒张功能障碍,即心室射血和/或充盈能力受损的一组复杂临床综合征,主要临床表现为呼吸困难、疲乏(体力
多元化的宽带互联网通信业务,如高清视频点播(HD)、视频通话、远程医疗、电子商务、在线游戏、虚拟现实(VR)、无人驾驶等,已经完全融入大众的日常生活。人们对数据传输速率的需求呈爆发性增长。这些不同网络环境中的数据通信的需求增长将推动整个光通信系统基础的物理层的带宽需求呈爆炸性增长。由于高速率的光纤通信系统存在接收光信噪比(OSNR)和光纤非线性效应的限制。近年来,可在有限光信噪比条件下,提高信道容
人类在复杂场景中可以快速地辨识感兴趣的区域,进而完成对场景的理解,这是由人类视觉系统存在的视觉注意机制完成的。视觉信息主要来源于接收到的图像或视频数据信息,当注视
目的:在化学领域研究中,尤其是有机化学领域,天然药物有效成分一直都是科学家研究的热点。迄今为止,临床应用的药物中,与天然化学成分相关的药物依然占领着主导地位。但是由