常量度P2P系统中复杂搜索技术研究

来源 :国防科学技术大学 | 被引量 : 0次 | 上传用户:fangming286
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,基于对等结构(Peer-To-Peer,P2P)的分布式系统在互联网上广泛的流行起来,成为了当前占据Internet主要流量的应用之一。基于分布哈希表(Distribute Hash Table,DHT)的结构化系统是P2P系统的重要组成部分,系统中的各个节点通过某种规则相互链接,形成具有一定拓扑结构的网络,具有较高的查询效率。常量度P2P系统作为一种新型的结构化系统,具有邻居节点个数为常数而查询效率为O(LogN)的特性。常量度P2P系统能有效地减小系统维护开销,简化系统结构,但同时也面临着容错、数据负载平衡、路由负载平衡等方面的问题。如何解决常量度系统所面临的这些问题,是一个值得深入研究的课题。此外,由于P2P系统中往往具有着巨大的节点规模和节点在地理上广泛分布的特点,因此在大规模P2P环境下的资源搜索面临着两个重要的性能指标:搜索效率和网络负载。高效的搜索有利于减小搜索的延时,提高用户的满意度;而较低的网络负载有利于减轻网络流量,减小营运商的成本。特别是在P2P环境下进行复杂搜索时,面临着搜索效率和消息开销的性能折衷问题:优化其中一个往往使得另一个表现出较差的性能。进行复杂搜索时,如何在保持搜索效率的同时减小网络的消息开销将对网格系统、服务组合等应用具有现实的推动作用。针对上述问题,本文首先拓展了CCC[1]网络结构,为每个节点增加3个邻居节点,从而形成新的常量度P2P重叠网络,它在负载平衡、路由效率等方面表现出新的特性。在该系统的基础上,本文围绕复杂搜索中的区间搜索和Top-K搜索两个问题展开研究,提出了针对这两个问题的搜索算法,对算法进行的理论分析和实验模拟表明这两种算法具有较高搜索效率和较低的网络负载。论文的主要贡献主要包括:(1)本文在CCC(Cube-Connected-Cycle)网络结构的基础上,提出了一种新的常量度P2P网络—Cactus。该系统中每个节点的邻居节点数为6,而在节点规模不超过d×2d的情况下,查询效率为O(d),其中d是CCC网络的维度。本文阐述了Cactus的拓扑构造、路由算法以及容错机制,并对相关实验及其结果进行了分析。实验表明Cactus在查询效率、负载平衡、容错性等方面均不逊于现有的常量度数的P2P系统。特别是与已有的容错算法相比,在节点非正常离开系统的情况下,Cactus采用了“反馈式”容错算法,使节点恢复邻居关系的消息个数从log2N减小到3logN,时间开销从logN减小到2步,从而使得系统具有较强的容错能力。(2)本文在Cactus常量度系统基础上,设计了一种Smart-Broadcast算法。该算法根据被搜索区间的范围,动态建立一棵虚拟搜索树。该搜索树的结构与Cactus系统的底层拓扑结构相匹配,并使得被搜索的节点都聚集在根节点附近,从而使得单值区间搜索的消息开销为O(d),而平均路由开销不超过O(d)+(1+3/d)m,其中m是被搜索区间内所有映射到的节点。本文描述了Smart-Broadcast算法,并在该算法的基础上设计了多属性区间搜索算法。对算法进行理论分析和模拟实验证实Smart-Broadcast算法在大规模节点的情况下,具有较小的消息开销和路由开销。(3)本文在Cactus系统和区间搜索算法的基础上,提出了一种Top-K搜索算法—IES(Iterative Estimate Range-size)。算法根据资源属性,将资源看作是m维空间中的点,而Top-K搜索就转换为在m维空间中搜索距离查询点最近的k个点。该算法根据Agrawal发现的资源密集现象,在m维空间中确定搜索区间大小,并利用Cactus的多区间搜索算法,迭代地在多个区间中搜索资源,使得算法同时保持了高效和低负载的特点。本文证明了算法的正确性并分析了它的性能。分析和实验表明,该算法在高属性维度、低查询维度的情况下,具有较好的查询效率和较低的网络负载。
其他文献
回 回 产卜爹仇贱回——回 日E回。”。回祖 一回“。回干 肉果幻中 N_。NH lP7-ewwe--一”$ MN。W;- __._——————》 砧叫]们羽 制作:陈恬’#陈川个美食 Back to yield
情境教学法是开展小学英语教学的一种有效的方法与手段。它能为学生的英语学习创设一个宽松的、真实的环境,帮助学生激发学习兴趣,使他们轻松、快乐地习得知识,准确地掌握知
目的:调查手足口病感染的细菌分布及耐药性,为临床合理选择抗菌药物提供参考依据。方法回顾性分析2012年3月-2014年3月162例重症手足口病患儿发生感染部位、细菌种类、药敏试验
本论文结合自适应技术和并行计算技术,针对新型纳米结构半导体器件建立了扩展模型,提出了一套完整一致的自适应并行计算方法,对这些器件进行计算机模拟和特性分析。该方法在
立木整枝是优质工业用材林定向抚育的重要环节。传统的整枝方法效率低、易引起工人的疲劳和事故、作业高度也受到限制,因此立木整枝机的自动化及智能化是实现高效、高质量和
从土壤中筛选到一株植酸酶高产菌株,利用紫外线对该菌株进行诱变提高植酸酶产量,并采用硫酸铵分级沉淀、DEAE-纤维素阴离子交换层析和Sephadex G-100凝胶过滤层析对植酸酶进行
专业教学标准主要包括专业定位、人才培养规格、课程体系及课程说明、教学要求等几个方面。在现代学徒制背景下制定专业教学标准时,应从企业的角度和利益出发开展调研,定位专