基于分布式哈希表的对等网络数据检索研究

被引量 : 0次 | 上传用户:furuirui
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
P2P(peer-to-peer)系统是一个迅速发展的研究领域。P2P系统的应用已从传统的文件共享领域逐步扩展到更广泛的广域分布计算领域,因而需要P2P系统提供确定性定位与低查询开销等关键特性。基于分布式哈希表(DistributedHashTable,简称DHT)的P2P系统在广域网支持巨量集的数据一致性分布,并提供低跳步的路由精确定位,以及具有低查询开销和高容错自组织等优良性能,已经成为学术界研究的热点。 然而,分布式哈希表技术的引入在带来其先进性的变革影响的同时,也带来了新的挑战性问题。第一,由于拓扑是一种结构化的拓扑,相对比非结构化的拓扑,其维护开销显著加大。特别是在大规模和动荡的网络环境下,维护开销相当可观。第二,由于DHT采用哈希技术仅提供精确查询匹配,使用查询受到极大的约束。如何突破精确查询匹配的限制,增强P2P查询能力是当前P2P系统的急需解决的问题。本文针对上述问题,主要主要研究贡献如下: 1.结构化DHT系统能够提供高效、可靠的服务,有着巨大的潜在应用前景。然而在典型的动态环境下的结构化对等网络存在的维护开销过大问题,尤其是在高度动态的环境下。在本篇论文中,我们通过P2P网络中的节点会话特性,提出了一个基于DHI拓扑的超级节点对等网络SPChord来控制维护开销。该系统使用了一个简单但是有效的聚簇技术生成超级节点对等网络。主要的技术优点有:(1)簇的管理方式是自然演化的,管理开销很小。由于它不依赖于任何附加的前提条件,所以它可以直接应用于现有的DHT算法的改进。(2)即使簇的大小很小,它也能大大改善系统的维护开销和性能,这就意味着相比于现有的普通DHT对等网络系统来说,它有着更好的可扩展性,使得DHT系统能够更好地适应动态网络。仿真结果表明维护开销得到了极大的减少,而查找失败率也有很大程度的减小,同时查找性能也大大提高。 2.针对当前对等网络信息检索系统存在的无法适应高维文本空间以及检索代价过高的问题,提出了基于索引汇聚的对等网络信息检索系统IRSPC,该系统构建在SPChord叠加网之上,主要的创新点有:(1)IRSPC综合了结构化对等网络和非结构化对等网络的查询方式,并引入了信息检索领域的评价机制,保证和查询相关程度高的文档能以较小的代价优先被查询到。(2)关键词权重的计算完全是分布式的,不依赖于集中式的统计数据(如TFIDF的计算)。(3)IRSPC能适应高维大文本集的全文检索,并且具有良好的可扩展性和查询精度。 3.针对当前DHT系统多关键词检索效率低下、网络带宽开销过大的问题,我们采用了TFIDF关键词赋权技术和关键词关联关系挖掘以改进对等网络关键词检索效率,提出了基于关联关键词集检索的DHT对等网络关键词检索系统pKSS。pKSS的主要的创新点有:(1)通过WWW或FTP搜索站点的查询日志挖掘关键词之间的关联关系,并根据关键词之间的关联关系对文档索引词和查询语句中的查询词分组以支持基于关联关键词集的对等网络检索。(2)通过采用TFIDF技术,选出文档最重要的L个索引词并连同关联关键词集发布到对等网络。当用户发布查询时,查询中的关键词按照其IDF值和相互之间的关联关系进行分组,因而使pKSS的关键词检索效率在关联关键词集划分的基础上得到大大提高。实验结果清楚地表明:pKSS在索引的插入和存储开销上要远远低于KSS,在查询的带宽开销上也明显比标准的分布式倒排索引低。 4.针对当前元数据描述规范广泛采用XML的现状,提出了基于DHT对等网络的XML元数据索引和查询系统PXIQ。PXIQ系统为XML数据查询提供了良好的可扩展性和丰富的表达能力。除DHT内在的固有特性之外,PXIQ还有几个独特的优特点:首先,PXIQ能针对XML实施语义查询,查询语言采用XPath;其次,PXIQ能支持DHT对等网络中的范围查询;第三,PXIQ能支持DHT对等网络中的关键字检索和语义结构查询。从实验结果可以看到,PXIQ能够适应具有大量主机节点的对等网络环境。 5.针对当前DHT对等网络数据检索中存在的“热点”(负载不均衡)问题,本章提出了基于负载重定向的RLBA负载均衡算法以提高数据检索的性能和效率。RLBA负载均衡算法的整个负载均衡过程以及节点负载统计表的维护不依赖于任何集中式信息。该负载均衡的过程仅需要付出的代价为对节点资源的访问需要进行统计跟踪和重定向,一般的P2P数据检索系统从应用的角度也希望对节点资源进行统计跟踪,而负载重定向在DHT系统中进行负载均衡通常很难避免,并且重定向仅增加了一个路由跳数,对性能影响不大。因此,相对于其它的P2P负载均衡算法,RLBA算法的特点一是算法开销小,另外是不依赖于任何集中式信息。
其他文献
随着24小时在线网络变得越来越流行,不光是普通的个人电脑要和因特网相连,各种嵌入式设备,比如传感器,家用设备、音视频设备等都要和因特网相连。为了把无数的设备接入因特网
广域传感器数据库是目前国际上的一个热点研究领域。传感器网络为人们提供了一个全新的平台和基础结构,使人们可以在更广的范围和网络中部署各类应用系统。目前,在该领域的研
结构化对等网络(Peer-to-Peer,P2P)是目前计算机网络技术的研究热点,在文件共享、分布式文件系统、社交网络等方向有着巨大应用的潜力。查询服务是结构化P2P网络的核心技术,它的可
移动Ad Hoc网络是由一组带有无线收发设备的移动节点组成的临时自治性网络。可广泛应用于国防战备、灾难救助或者某些只需要临时通信而组建有线网代价太大的场合。由于Ad Hoc
由于下一代网络(Next Generation Network, NGN)的分组化、开放式、高带宽、多种媒体流统一承载等特性,使NGN能够将多种能力组合包装成各种用户感受的新业务,和电子商务、教
随着32位嵌入式应用越来越广泛,嵌入式应用软件的研发成为嵌入式系统设计中重要研究课题之一。嵌入式系统可以看着是由一台计算机加上专用设备构成的,而嵌入式应用可视为运行
人脸检测与识别技术是一种重要的生物特征验证手段,在安全访问控制、视觉监测、智能用户接口、基于内容的图像检索等方面有着重要的应用。本文以构建一个可用的、实用的人脸
统一消息系统是我国电信业与传统IT业融合的最佳切入点,是电信增值业务的重要组成部分,同时也是电信增值业务从公众娱乐走向实时企业和即时通信的关键桥梁和纽带。 本文首先
在数字签名中使用前向安全算法,有效地降低了因私钥泄露所带来的损失,为加强私钥的安全管理提供了一种新的解决方法。本文重点分析一类时段参数在验证过程无效的前向安全签名
本文以目前发展较快的一个分支—精简指令集计算机(ARM,Advance RISC Machines)作为介绍重点,对TCP/IP协议族在ARM7处理核嵌入式系统中的应用与实现做了深入研究,并独立编写