论文部分内容阅读
基于分布式散列表(Distributed Hash Table,DHT)的第二代结构化P2P系统是P2P研究的最新进展和研究热点。内容寻址网络(Content-Addressable Network)是结构化P2P系统的典型代表,它在虚拟的d-维笛卡尔坐标空间上利用DHT来实现其数据组织和查找功能,提供了根据键值(key)快速定位资源的能力、良好的容错能力、自组织能力和可扩展能力。此外,CAN的提出者还探讨了在CAN中实现应用层多播的方法,并证明了该算法很好地避免了重复数据报。但是包括CAN在内的许多DHTs算法仍然存在两个主要的缺点:第一,缺乏基于内容的有效搜索。DHTs在搜索之前已经明确了搜索目标——特定的key,而基于内容的搜索无法在搜索之前确定搜索目标,需要通过计算相似度来选出匹配程度最大的那些文件。第二,维护系统结构开销较大。虽然DHTs查询所需要的网络资源(网络带宽)开销小,查询延迟小,但为了保证当节点动态加入/退出系统时路由表的准确性,必须依靠额外的协议来更新路由表,因而对动态的网络,用于路由维护的开销较大。 本文作者从网络拓扑改进和算法改进两个角度详细分析了上面提到的两个问题,并给出了一个改进的CAN解决方案——基于资源聚集网格的内容寻址网络(Grid-CAN):根据网络的幂定律模型以及在对现有网络资源分布规律的统计,Grid-CAN将P2P网络中少数的前列内容提供节点(top content provider)组织成一个d-维CAN结构的资源聚集网格,在保证内容提供能力的同时,减小了结构维护的开销;根据小世界特征,Grid-CAN在原始CAN拓扑的基础上加入小世界特征拓扑,使得从任意节点发出的消息能够以O(log2N)的延迟扩散到整个网络(原始CAN的扩散延迟为O(N1/d),实现了CAN上的基于多播查询方式的可扩展深度内容搜索;根据P2P网络中不同消息数量的统计,Grid-CAN提出了一种流水线(pipeline)消息传输机制,不仅能够消除用于路由维护的Ping-Pong消息(约占消息总数量的63%),还能够更好的利用网络带宽来传输查询和响应消息。 为了验证Grid-CAN在下一代互联网环境下的可行性,本文作者分析了Grid-CAN的具体实现以及对目前两种重要的下一代互联网技术:网格和IPv6的支持。为了验证Grid-CAN的性能改进,本文作者分别对Grid-CAN的节点分类算法、搜索算法和消息传输算法进行了深入分析并通过仿真试验对其性能进行了验证。