【摘 要】
:
相似性图像搜索问题是指在给定数据集中返回与查询点距离相近数据点的问题。最近邻(Nearest Neighbor,NN)搜索方法在数据点维度较低的时候表现出良好的查询效果。对于高维的数据点,由于维度灾难问题的出现,最近邻搜索方法变得极其困难。为了提升数据搜索的效率,近似近邻(Approximate Nearest Neighbor,ANN)搜索方法被提出来。局部敏感哈希(Locality Sensi
论文部分内容阅读
相似性图像搜索问题是指在给定数据集中返回与查询点距离相近数据点的问题。最近邻(Nearest Neighbor,NN)搜索方法在数据点维度较低的时候表现出良好的查询效果。对于高维的数据点,由于维度灾难问题的出现,最近邻搜索方法变得极其困难。为了提升数据搜索的效率,近似近邻(Approximate Nearest Neighbor,ANN)搜索方法被提出来。局部敏感哈希(Locality Sensitive Hashing,LSH)及其变体是解决高维空间中近似近邻搜索问题的著名方案。传统上,这些索引方案是集中管理的,需要多个哈希表来保证搜索质量。然而,由于存储空间的限制,海量数据对象在集中式索引方案中已变得不切实际。因此,基于P2P网络的分布式索引方案被提出,其中,如何保证分布式网络节点的负载均衡成为研究的热点之一。本文针对上述特性及现存方案的一些问题,开展相似性图像索引负载均衡的研究。首先,研究了基于LSH的分布式索引数据分布模型。考虑到数据集中数据特征向量范式的不同,分别构建了基于同构和异构范式的数据分布理论模型,并证明其能准确预测分布式索引数据哈希值的分布。与现有的基于多张哈希表的模型不同,本文提出的模型适用于单张哈希表,其能显著减少创建分布式索引占据的空间。然后,基于LSH的分布式索引数据分布模型,提出了静态分布式相似性图像索引负载均衡机制。考虑利用累积分布函数的特性,在索引机制中提出了一种全新的索引映射方法,能够在概率上保证在数据映射阶段每个节点的负载均衡。本文提出的索引机制得益于正态分布的性质,可以让类似Chord的P2P网络获得更均衡的负载。进一步地,针对节点动态性和索引值映射误差等导致的负载不均衡问题,提出了一种基于虚拟结点的动态负载均衡算法。该算法可以实现P2P网络中重载节点与轻载节点之间负载的动态性调整,从而保持每个节点的负载均衡。该算法扩大了基于LSH分布式索引数据分布模型的适应范围,使静态分布式相似性索引方案更加实用。最后,利用合成数据集和两个真实数据集,对分布式相似性图像索引机制和动态负载均衡算法的效率和有效性进行了实验评估。本文的研究成果在海量高维图像数据搜索和分布式P2P网络技术领域具有重要的理论意义和广阔的应用价值。
其他文献
乌克兰是一个农业大国。国内粮食生产高度结合可持续的外部需求使乌克兰成为世界主要粮食供应国的一组国家。与此同时,国内粮食市场的出口因素很难夸大它,因为外部供应是利用
太赫兹波由于其在生物医学、安全检查、通信技术等方面潜在的应用价值,成为目前热门的研究领域之一,而太赫兹源技术是其中一个重要也是最基本的研究方向。非线性光学差频技术由于高效、高功率、精简的结构以及可调谐等优点,成为了研发太赫兹辐射源的一种重要技术,而如何实现差频过程中的相位匹配是一个关键问题。腔相位匹配(CPM)技术在近年来得以实验验证,并展现出在制备小型太赫兹源方面的潜在优势。而目前的研究报导中鲜
由于稀土化合物具有优异的光谱性质,而具有3d10电子组态的过渡金属Cd2+离子能够与有机配体之间通过能量传递而具有较好的发光性能,因此本课题选用含氮杂环羧酸类配体和镧系及
金属有机多面体结构的设计合成及其在传感、识别、催化、活性物种稳定化等方面的应用受到了科学家们的广泛关注。传统金属有机多面体由具有固定配位构型的过渡金属构成,其中
本文分别提出了圆形区域和球形区域上特征值问题有效的谱Galerkin逼近。对于圆形区域,我们提出了steklov特征值问题的谱Galerkin逼近和严格的误差分析。首先,我们利用极坐标变换和变量分离技巧把原问题化为一系列等价的一维特征值问题,而且这些一维的特征值问题是相互独立的,从而可以并行地求解。然后,我们推导了极条件并根据极条件引入了相应的带权Sobolev空间。结合正交多项式的逼近性质,我们
张量理论在数据挖掘与处理、神经网络、图像处理、化学计量和心理测量、物理学中的弹性分析等领域中有着不可或缺的作用.特别地,强?-张量的判定问题作为张量理论的一个组成部分在判定多元偶次齐次多项式正定性问题中起着至关重要的作用.然而,强?-张量的判定问题存在着诸多困难.因此,判定一个张量是否为强?-张量具有重要的理论意义和实际应用背景.本文主要研究强?-张量的判定问题.首先,给出一种新的强?-张量迭代判
近年来,企业对智能客服的需求越来越旺盛。传统交互中客户需要和多个部门打交道,低效、成本高,未来交互可以通过智能客服系统来快速准确地过滤用户的大部分需求,从而减少对人
有机-金属碘化物杂化型聚合物因在光电转换、刺激响应、铁电、非线性光学材料等领域具有广阔的应用前景,成为材料科学领域研究的热点之一。特别值得关注的是可用于光信号处理
随着网络的飞速发展,在网络上表达情绪的人日益增多。现有的文本情感分析系统虽然能够正确分类大部分文本的情感极性。但是当文本中存在讽刺时,现有系统往往会产生错误分类结
基于图像的人体姿态估计是指从图像中检测人体各部分的位置并计算其方向和尺度信息的过程,计算的结果分为二维和三维两种情况,本文主要研究单张室外RGB图像的三维人体姿态估