论文部分内容阅读
因特网(Internet)技术的发展日新月异,向全球用户展现出了一系列具有创造性的分布式应用成果。对等网(Peer-to-Peer,P2P)文件共享系统,作为通过协作定位和分布共享文件的工具,已成为占据Internet网络流量最多的新型网络应用。P2P文件共享系统中的信息定位在过去几年吸引了很多注意,并出现了大量的研究成果;而目前文件分布已经开始成为了近来非常活跃的研究课题。BitTorrent是当今Internet上非常流行的基于P2P技术的文件分布工具,它能够快速、有效地在Internet的网络结点上分布大的文件,而不会给源服务器带来负载。本文针对BitTorrent对等网文件共享系统的服务能力、激励机制、和覆盖网拓扑结构等P2P文件共享系统的关键问题展开了研究。这些问题的研究有助于提高P2P文件共享系统的性能、稳定性、和可扩展性。本文的主要研究内容和贡献如下:(1)BitTorrent对等网文件共享系统服务能力的研究:利用n叉树的结构模型分析了BitTorrent系统的文件分布性能,进一步研究了BitTorrent系统的文件可获得性和文件共享效力,并提出了一个优化的邻居结点选择策略。BitTorrent作为当今Internet上最为流行的P2P协作文件共享分布系统,已经得到了广泛的关注。很多研究证实BitTorrent系统有非常好的性能,然而其服务能力并没有得到充分地研究。本文利用n叉树的结构模型分析了BitTorrent系统的文件分布性能,证实BitTorrent系统有非常好的性能支持大规模的下载结点同时下载共享文件,并指出文件被分割的块数和结点的并发上载连接数对系统文件分布性能的影响。同时通过模型分析研究了BitTorrent系统的文件可获得性,发现当文件块在系统均匀分布时,文件可获得性最高,并证实最少文件块选择策略有利于提高系统的文件可获得性。进一步研究发现BitTorrent系统具有非常好的文件共享效力。此外,针对BitTorrent系统邻居结点随机选择策略的缺点,提出了一个优化的邻居结点选择策略:服务器tracker为结点优先选择与其具有相近文件块数的结点作为其邻居结点。模拟实验验证了本文的模型分析结果,并且显示了优化的邻居结点选择策略能充分地利用系统服务资源,有效地提高系统的服务性能。(2)BitTorrent对等网文件共享系统激励机制的研究:通过一个具有两类不同结点的流体数学模型研究了BitTorrent系统的激励机制,提出了严格基于结点贡献量分配种子带宽的种子带宽分配策略。结点间的协作是P2P文件共享系统不可缺少的条件,然而没有一个有效的激励机制,在个体参与结点间实现协作是非常困难的。BitTorrent作为一个协作的P2P文件分布工具,不可避免地要面对结点不愿协作的“搭便车”问题,因此BitTorrent有专门的激励机制去防止搭便车行为并提高结点间的协作,然而其阻止搭便车行为的能力并没有得到充分地研究。本文构建了一个具有两类不同结点的流体数学模型去研究搭便车行为对BitTorrent系统的影响。通过此模型分析,发现BitTorrent的激励机制在无种子系统中能成功地阻止搭便车行为;然而,在具有较多种子的系统中,BitTorrent的激励机制并不能有效地阻止搭便车行为。这是因为BitTorrent没有为种子提供有效的激励机制,便车者可以从种子获得大量的服务资源。因此,本文提出了严格基于结点贡献量分配种子带宽的种子带宽分配策略。模拟实验证实了本文的分析和发现,并显示出种子带宽分配策略不但能阻止BitTorrent系统的搭便车行为,而且能十分有效地提高系统贡献结点的性能。(3)BitTorrent对等网文件共享系统覆盖网拓扑结构的研究:提出了基于邻近结点聚类的BitTorrent文件共享系统-CBT(Clustered BitTorrent),构建了层次化BitTorrent文件共享机制,并采用结点加入算法和超级结点选择算法去构建此CBT系统。在大规模的BitTorrent系统中,中央服务器tracker要不断地为大量动态地加入和离开的结点更新状态信息,这会给tracker服务器带来很大的负载。此外结点随机选择连接结点传输数据,使得结点有可能连接到与其拓扑距离较远、网络时延较长的结点,增加了网络带宽的损耗,并降低了文件传输的性能。为了提高BitTorrent对等网系统的共享文件下载性能,本文提出了基于邻近结点聚类的BitTorrent文件共享系统(Clustered BitTorrent,简称CBT),此系统通过将邻近的结点聚合成结点簇,同一结点簇中结点优先建立共享连接,从而构建了层次化BitTorrent文件共享机制。同时提出了结点加入算法和超级结点选择算法去构建CBT系统。通过基于马尔可夫链的流体数学模型分析了该系统的性能,证明了CBT系统比原BitTorrent系统具有更好的文件共享性能。模拟实验证实了理论分析结果,并显示该系统有效地降低了中央服务器tracker的负载,提高了系统可扩展性和稳定性。