基于名词和动作视觉概念检测的复杂查询图像检索重排序

来源 :合肥工业大学 | 被引量 : 0次 | 上传用户:klose123
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
目前,图像重排序技术的使用已经成功地改善了基于简单查询的图像检索性能。然而,针对复杂查询,由于语义鸿沟的进一步扩大,重排序技术并没有起到显著的作用。另外,现如今针对复杂查询的图像检索中,通常忽略了动作视觉概念的重要性。因此,本文从复杂查询中挖掘动作视觉概念,提出面向复杂查询时将动作视觉概念亦纳入考虑的图像检索结果重排序方法。首先从复杂查询中提取动词和名词短语作为视觉概念,然后分别从语义层、视觉层以及两者的交叉形态估计复杂查询与图像之间的相关性,最后根据相关分数完成检索结果的重排序。本文的主要工作和创新点如下:1.本文从概率的角度出发,致力于针对复杂查询的网络图像检索结果重排序。解决了现有的针对复杂查询的图像重排序方法中初始排序列表的不可靠性。2.从动作视觉概念的角度出发,提出一种基于名词和动作视觉概念检测的复杂查询图像检索重排序方法,并提出一个检测动词短语以及名词短语的启发式框架,而不是仅仅将单个单词作为检索概念。3.提出一个异构概率网络,用来估计每幅图像的相关分数。其中,这个网络包含三个子层次:图像对之间的底层关系、图像和视觉概念之间的关系以及视觉概念和复杂查询之间的高层语义关系。这三个层次相互补充促进相关分数的估计,最终生成新的排序列表。这种方法不依赖于原始检索结果的图像顺序,并且整个过程都是无监督的,可以有效地改善以往的重排序算法存在的问题。
其他文献
随着IP网络的进一步发展,Internet中的流量成几何级数增长,于是对IP网络提出了更高的要求。而现有的基于IGP协议簇的因特网会导致不均匀的流量分布,因为它们按照最短路径优先(SP
在电信市场激烈竞争的今天,无线市话作为新的业务增长点异军突起,在个人通信领域占有一席之地。本文从农村数字无线接入产生的背景着手,阐明了在农村和山区进行CDMA450网络建设
当前的人脸识别技术主要是基于二维人脸灰度图像的,虽然其简单、快捷并且有效,但是一旦被识别者所处的环境受到光线变化的影响,或者其自身表情、姿态以及遮挡物的变化都会导
励磁系统是同步发电机的重要组成部分,对发电机运行的可靠性和稳定性有着直接影响。励磁系统故障是发电机组电气故障的主要原因。由于故障诊断专家不能及时赶往现场对故障作出处理,因此对于电机励磁系统的远程监测成为解决励磁系统故障的有效和经济的手段之一。本文利用公用电话网(PSTN)基于Modem搭建的计算机网络,实现了励磁参数的远程监测。远程监测中心计算机通过与工作现场励磁系统上位机进行远程通信,来对工作现