基于向量量化的近似最近邻搜索方法研究

来源 :桂林电子科技大学 | 被引量 : 1次 | 上传用户:a15088899204
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着多媒体数据的爆炸式增长,数据的规模与维度变得越来越大,基于原始数据的最近邻搜索方法已不能在存储与计算效率上满足实际应用的需求,因此更加可行的近似最近邻搜索方法的研究变得越来越重要。然而,向量量化作为一种流行的近似最近邻搜索技术,目前仍不能在速度与精度之间取得平衡,并且向量量化与倒排索引结构的结合也存在改进的空间。因此,本文基于向量量化技术,分别从量化结构与索引结构设计两个方向出发,对大规模数据的近似最近邻搜索方法进行改进。本文的主要研究工作分为以下两点:(1)乘积量化是一种非常流行的近似最近邻搜索方法,它将数据空间分解为多个低维子空间的笛卡尔积。然而,乘积量化仅为子空间构造单个码本,限制了量化编码的误差,进而影响了近似最近邻搜索的精度。本文基于残差向量量化,为子空间构造一个由多个有序子码本构成的残差量化结构,并采用联合优化策略对所有子码本同时进行训练,大大提升了向量量化的精度。此外,本文充分利用残差量化的特性,设计了一种高效的编码算法,能够在几乎不损失编码精度的同时显著提升量化编码的效率。理论分析与实验表明,本文提出的量化方法在SIFT-1M和GIST-1M数据集上的最近邻搜索性能表现明显优于同类型的主流方法。(2)倒排多索引(Inverted Multi-Index)与标准倒排索引结构(Inverted Index)是一种非常高效的非穷举式搜索框架,通过对数据空间进行划分,能够将穷举式的全局搜索转变为非穷举式的子区域搜索。本文将所提出的残差乘积量化与经典的倒排多索引结构结合,设计了一种高效的非穷举式检索系统。此外,为了优化标准倒排索引结构子区域的定位效率,本文通过乘积量化对子区域的倒排索引进行量化,并利用乘积量化的距离查找表机制加速查询项与子区域索引之间的距离计算,从而提升了非穷举式检索系统的搜索效率。在SIFT-10M上的实验结果表明,本文提出的两种非穷举式检索系统能够有效地解决大规模数据的近似最近邻搜索任务。
其他文献
赛博朋克是上世纪六七十年代出现的一种特殊的艺术派别,最开始是文学作品中的一种科幻类型,后面逐渐发展到影视图像等方面。随着赛博朋克作品的发展,赛博朋克美学也从中变得越发清晰,其独特的艺术设计和精神内核给当代的文艺作品提供了一种别样的艺术风格。本文将通从赛博朋克风格的作品入手,探究其发展过程中展现出的设计元素和内涵的哲理,从而归纳出独特的美学。并从多个角度解析归纳其设计理念,并通过与毕设短片《百鬼夜行
学位
随着国家经济发展,对于规模日渐庞大、架设地形复杂的输电线路如何实现高效、准确、安全的巡检已成为电力行业共同关注的问题。近年来国家电网致力于探索全新的智能巡检模式,并已经在电力系统作业考核中加入无人机巡检的相关指标。可以预测到无人机模式是未来电网应用最广泛的电力巡检手段。针对无人机巡检测量弧垂过程中特征提取与重构的难点,给出一种基于图像坐标映射的电力线弧垂测量方法,采用图像处理手段提取电力线特征,通
学位
大部分动画影片都是围绕个性化人物展开叙事的,通过因果推动故事的发展,以“开端—发展—高潮—结局”为结构,完整展现人物关系和性格变化,并把此奉为叙事作品创作的金科玉律。但也有一些导演更倾向于用淡化因果逻辑的方式,不着重刻画人物性格和人物关系,没有设计完整的转折起伏,结合自己的创作风格来叙事,形成了独具个人特色的优秀动画作品。本文以这种非情节化的叙事方式为研究讨论的对象,通过例证对该方式在动画中的具体
学位
足式机器人通过腿部与环境交互产生的反作用力提供驱动力,由于接触点是离散的,因此相比传统的轮式、履带式机器人更容易适应非结构化的复杂环境,在多数地形下有良好的通过性。尽管随着制造成本的降低及微处理器运算能力的增强,足式机器人性能越来越高,然而像人类和动物一样在复杂环境中动态奔跑仍然存在诸多困难。研究表明足式动物在动态奔跑时会通过一些主动柔顺或被动柔顺行为来适应地形和实现动态运动,如改变腿部关节角度、
学位
随着各项技术的飞速发展,数据呈爆炸式地充斥在人们的生活、交通、娱乐等各方面,数据的分类管理成为人们日常生活的迫切需求。半监督分类是机器学习研究中最受关注的问题之一,其仅需少量标签数据和大量无标签数据就可以取得良好的分类性能,有效缓减了有监督学习的人工标注代价和无监督学习模型不精确的问题。近年来基于超图的半监督节点分类成为半监督学习的一个重要分支,其利用超图能够建模数据之间高阶相关性的优势,通过超图
学位
遥感图像语义分割技术在作物规划、植被检测以及农用地监测等方面具有重要的作用。然而农作物遥感语义分割任务中存在类别不平衡和边界划分不清等问题,且部分样本中农作物类间的相似度高、类内的差异性大,使得农作物遥感图像的语义分割更具挑战性。为了解决上述问题,本文采用深度学习技术对农作物遥感图像的语义分割进行研究。本文的主要研究工作如下:(1)针对农作物遥感图像类别不平衡和边界划分不清等问题,提出一种基于并行
学位
伴随着社会的发展,人类与电的关系越来越密切。在平时的生活和生产中,电器设备逐渐增多,人们因电击受伤的案例也越来越多。在发生触电死亡的案件中,220V电压占全部触电电压的70%左右。目前,对电击致死的案件进行法医鉴定时,使用的方法多数仍然是肉眼观察身体外部特征的方法,该方法无法用科学的、量化的方案对电击伤进行鉴定。针对法医鉴定中存在的问题,本文从电学角度根据电击下生物体电阻抗的变化,提出了一种对电击
学位
从评论句子中提取出观点核心信息是细粒度的方面级情感分析的一项基础任务。该任务旨在从评论句中成对抽取出方面词和观点词,方面词描述评论人对什么目标/方面表达了观点,观点词指评论人用什么的词表达观点。本论文主要针对方面词和观点词成对抽取问题展开研究。现有的方法需要对数据进行大量复杂的标注或者会产生大量的负样本,耗费大量人力且计算代价过大,为解决该问题,本文首先将问题进行转化,抽取任务转化为生成任务,提出
学位
相位解缠作为合成孔径雷达干涉(Interferometry Synthetic Aperture Radar,InSAR)数据处理中的不可或缺步骤,对最终提取的高程参数具有决定性的作用。传统相位解缠算法存在精度与效率无法兼顾的问题,深度学习具有强大特征表示能力和非线性逆问题的求解能力,且完成训练后的网络通常可高效率完成其指定任务,使之在干涉图相位解缠领域具有潜在的优势。论文在深度学习理论与技术框架
学位
超表面作为一种新型的二维人工电磁材料,可以在亚波长尺度上灵活的调控电磁波的振幅、相位和偏振等。与传统的三维超材料相比,超表面不仅保留了超材料卓越的波束操控能力,而且重量轻,损耗小,易于集成,这对未来在光电子、超快信息技术、显微成像和传感领域的应用至关重要。近年来,全介质超表面成为了一项热门研究内容。关于全介质超表面的相位调控的研究工作已取得了许多成果,如光束偏折、光分束器、聚焦超透镜、全息成像等。
学位