基于二维索引的结构化P2P高维数据范围检索

来源 :大连理工大学 | 被引量 : 0次 | 上传用户:wzhyskoa
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,随着网络技术的发展,很多P2P系统相继出现,P2P技术也越来越被人们所关注。目前P2P技术已经被应用在很多方面,主要有信息检索、文件共享、电子商务、分布式计算等领域。其中,信息检索作为查找网络信息的主要手段,是P2P技术目前最常见的应用。一直以来,高维数据都是数据库领域研究的热点,在实际中也有很多应用,例如数据挖掘、多媒体信息检索等领域。相似性检索是个非常关键的问题,即在数据集中找到与某个对象相似性较大的数据。高维数据检索过程中,距离计算是影响检索效率的一个重要因素,为了减少距离计算,近些年已经提出了一些解决办法,主要是以近似向量表示或者为数据建立一维索引为思路,前者通常是为高维数据寻找一个近似的向量表示形式,简化搜索空间。为数据建立一维索引是将高维数据通过某种方法转化为一维数据,以降低维度带来的影响。高维空间与我们所熟悉的低维空间不同,其中的数据分布有其独特的特点,即高维数据空间几乎是中空的,这使得大多数多元密度估计方法无法得出准确的结果,因为密度相对低的区域占了分布的很大一部分体积,而密度高的区域却缺乏足够的观测值。本文在分析了高维空间的这些分布特点之后,根据数据量将其分割成若干个子空间,使得这些子空间中的数据量分布大致均匀。子空间的划分是对数据空间纵向的分割。在子空间建立的基础上再进行分区划分,分区的划分是对数据空间横向的分割。空间划分之后,综合近似向量表示和为数据建立一维距离索引的基础上,为数据建立二维索引值,在数据索引和结构化P2P网络Chord节点的标识符之间建立映射关系,在检索过程中对查询进行两层过滤,减少了数据之间的距离计算,提高了查询性能。实验结果表明,这种二维索引结构在查准率,查找效率等方面有很好的性能。
其他文献
句法分析的任务是根据给定的语法,自动推导出句子的语法结构。句法分析性能的提高将对信息检索、信息抽取以及机器翻译等应用产生重要的推动作用。在句法分析的研究中,依存语
本文阐述了高等学校教学系管理信息系统的开发和设计过程。在本项目的开发过程中,注重使用新技术、新工具,采用了微软公司最新的开发工具Visual Studio.NET中的C#.NET、ASP.N
锅炉燃烧产生的烟气成分直接体现了锅炉的燃烧工况,是锅炉的优化运行和经济燃烧的重要指标之一,因此有必要对烟气成分进行分析。支持向量机(Support vector machine, SVM)是
互联网正以前所未有的速度发展,对人们的生活产生着越来越广泛、深入的影响。让用户从海量的信息中找到有价值的信息,同时让有价值的信息被需要的用户享用,一直是相关学术界和企
随着全球轿车市场竞争的日益激烈,不断提高轿车车身制造质量成为各大轿车制造厂商关注比拼的焦点。环顾轿车车身的整个生产制造过程,从整车质量规划、零部件的认可,产品试生产、