论文部分内容阅读
对等计算(Peer—to—PeerComputing)技术自近年以来在学术界与产业界引起广泛的关注,许多基于对等计算技术的文件共享、数据共享、计算资源共享、即时消息传递等应用被广泛地开发。非结构化对等计算系统具有分布式性、自组织性、自治性、鲁棒性、维护代价小等优点,同时还有可扩展性差、搜索效率低下等缺点。本文试图在保留非结构化对等计算系统优点的情况下,尽可能提高其搜索效率及可扩展性。
本篇论文首先提出了一个两层的对等计算系统架构。然后定义了两种不同的基于相似度(similarity)的查询,第一类是基于多维向量模型的相似度查询;第二类相似度查询是基于主题层次(topichiemrchy)的。随后对于两种不同的搜索问题给出了不同的搜索策略,并进行了实验分析。
本文的主要贡献有如下几点:
1.提出了一个结合结构化与非结构化对等计算系统各自优势,同时摒弃两者劣势的两层对等计算系统架构。这个架构具有结构化与非结构化两层,在此基础上,文章提出了节点聚类算法,通过节点聚类,相同主题的节点将被聚类到一个小簇中,提高了查询的效率及准确性。
2.定义了基于多维向量模型的相似度查询。在两层对等计算架构上,提出了一个自适应路由策略用以解决这类查询问题。根据查询所属的主题及节点相似度,该搜索策略能够自动地调整路由状态。文章对这个策略进行了实验分析,结果表明自适应路由策略在响应时间、查全率、带宽消耗及计算资源使用率方面都优于宽度优先策略。
3.提出了一个基于主题层次的相似度查询,给出了一个概率模型(pmbabmsticmodeD。利用概率模型中两类概率信息,提出了基于概率信息的路由算法及概率信息的维护算法。随后在两层对等计算系统架构上,给出了如何进行概率路由和维护概率信息的算法,并且利用实验比较了宽度优先,随机行走搜索策略。结果表明,基于概率信息的搜索策略从查全率、覆盖率与响应时间都要优于其它策略,而基于概率信息搜索的性能在两层对等计算架构中比在一般非结构化网络拓扑结构中更好。
本文首先提出了一个两层对等计算系统构架,并定义了两类基于相似度的查询,对于这两种查询问题在两层架构上给出了不同的搜索策略。文章所提出的技术在非结构化对等计算信息检索中有广泛的应用前景。