面向海量图像检索的视觉编码方法分析与优化

来源 :北京理工大学 | 被引量 : 3次 | 上传用户:chenjzh68
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
海量图像检索技术是计算机视觉领域研究热点之一。作为一种重要的多媒体搜索技术,它帮助用户在海量图像中快速检索出相关图像。视觉编码的主要工作是将海量图像快速转化成紧凑高效的向量表达,在海量图像检索系统中扮演核心角色,它直接决定海量检索系统的效率以及精度。词袋模型,VLAD,Fisher向量以及稀疏编码等现有主流视觉编码模型为快速准确地进行海量图像检索提供了有力支持。然而上述视觉编码算法也存在一些不足,词袋模型离线训练时间过长;VLAD以及Fisher编码过程没有考虑图像上下文信息;稀疏编码特征集聚算法统计模型较为简单,数学理论解释不充分。因此,针对上述视觉编码算法在码书训练、编码、集聚以及最近邻检索阶段的不足,本文的视觉编码技术分析以及优化研究工作具有重要意义。为分析和优化现有面向海量图像检索的视觉编码方法,本文依次对词袋模型、VLAD以及稀疏编码等视觉编码模型进行理论与实验分析,并结合分布式算法、上下文信息、熵编码理论以及概率统计模型等对上述视觉编码算法进行改进,提高海量图像检索的性能。最后本文在面向海量图像的视觉编码算法研究基础之上构建了一个基于城市级位置服务的移动视觉检索系统。本文完成的主要研究工作包括:1)针对词袋模型训练速度慢,内存消耗大的问题,提出一种基于分布式聚类的词汇树算法训练视觉单词,实现快速准确的码书训练过程。同时提出一种快速的几何重排序算法,利用特征点空间位置信息实现对检索结果的快速几何重排序。2)针对VLAD编码忽略特征点几何信息的问题,提出一种融合重力信息的角度编码以及尺度集聚算法,实现融合上下文信息的VLAD编码。针对乘积量化方法子空间量化误差不均衡的问题,提出基于上下文信息的角度乘积量化方法以及基于熵编码的变长子空间乘积量化方法,分别利用角度子空间以及变长空间维度实现子空间量化误差的均衡。3)针对稀疏编码最大值集聚特征表征不足以及求和集聚受burstiness现象影响的问题,利用概率解释模型提出一种优化的求和集聚算法,实现最大值集聚以及求和集聚的优势融合。同时针对稀疏编码图像检索框架下特征采样以及多特征融合问题进行研究,利用特征采样方法选择的理论分析以及多特征求和集聚实现检索精度的提升。4)搜集构建了一个GPS以及重力信息标注的Beijing Landmark数据库,利用视觉编码算法理论研究实现城市级位置服务的移动视觉检索系统。视觉编码研究中的理论和实验结果都证明了本文研究工作的准确性以及有效性,分布式聚类、上下文信息、熵编码以及概率解释模型等理论在码书训练、特征编码、特征集聚以及最近邻检索阶段极大地优化了现有视觉编码模型,提高了编码效率及精度,本文最后构建的移动视觉检索系统具有准确高效的特点,已成功应用于国家十二五科技重大专项。
其他文献
随着信息化时代的到来,高校图书馆服务创新尤为重要。结合新形势下高校图书馆的实际,本文从高校图书馆服务创新的含义、必要性、现状和存在问题以及措施等方面做了阐述.
文物档案是文物的身份证和名片,它记录着文物的来源和历史,建立文物档案,其宗旨在于加强文物的管理和保护,然而,就目前我国的文物档案管理现状来看,部分文物管理部门还没有建立科学
电子档案保护技术的对象是电子档案的载体及其记载的档案信息,涉及到信息技术、自动化技术、材料技术等高新技术的理论、方法和手段,它的主要内容大致可分为:保障技术、保管技术
当前,各类疾病的传播速度不断加快、传播范围不断扩大,对人类社会的影响越来越大。因此,疾病预防控制档案管理在疾病预防控制以及人类社会的发展中发挥着至关重要的作用。本文通
随着我国市场经济的不断发展和深化,企事业单位、外企以及国家政府机关的管理者,在开展科学研究、工作深化、探究如何加强员工生产力的方面,作出相关决策时,有许多因素是需要被考
目的:探讨乳腺癌患者T-钙黏蛋白表达情况与乳腺癌预后相关性。方法乳腺浸润性癌(浸润性小叶癌除外)患者280例,根据T-钙黏蛋白表达分为T-钙黏蛋白表达阴性组与阳性组,分析T-钙黏蛋
CBL教学法是基于PBL教学模式的基础上的教学模式,其核心是"以病例为先导,以问题为基础",广泛应用于临床医学生的教学中。MDT是目前国际肿瘤诊疗的常规模式,该方法的应用使肿
网络技术的更新换代将大大提升数字图书馆的自动化水平;大数据为数字图书馆的发展提供了强有力的技术支撑;协同发展将改变资源建设;人才匮乏问题有望得到解决;数字图书馆的环境改
本文以内蒙古财经大学图书馆馆藏纸质文献数字化为例阐述了图书馆馆藏纸质文献数字化的意义,数字化过程中应注意的问题以及数字化后对本馆所将带来的影响。