论文部分内容阅读
在P2P文件共享系统中,如何能够将全部用户共享的文件检索到,并以合理的方式展现给用户,一直是困扰着P2P文件共享系统的设计者的难题。开放式的P2P环境下的高动态性等等特性,加大了设计检索方法的难度。
本文首先分析了Maze系统中好友网络的社会性,提出了好友之间共享文件的相似度较高的猜想,并验证了该猜想。利用这个结论,结合了EigenTrust算法,提出了适用于无结构覆盖网络的EigenForward搜索方法。并采用模拟实验,证明其搜索的性能由于传统的泛洪搜索和Random Walk方法。
由于结构化的覆盖网络的高性能和高可扩展性,在其上设计信息检索算法是当前的研究热点。但是目前的研究多集中在稳定性较高、动态性低的封闭环境中。本文指出了传统的构建在DHT上的搜索算法的纯在的缺陷和漏洞,并在此基础上,提出了称为异步发布的基于DHT 的检索算法。并分析了开放式P2P环境中系统的动态性,提出了在该环境中维护索引的方法。并首次将向量空间模型同用户反馈共同运用到DHT的检索算法中,提高搜索性能,降低网络负载。
本文首次指出了现有的开放性P2P环境中的搜索算法对中文分词问题考虑的不足,而影响了中文的检索的效果。分析了传统中文分词算法在开放式P2P环境中的局限性,提出了两种构建在DHT环境中的中文分词算法。并分析了两种算法各自的优点和潜在的问题。给出了分布式环境下中文分词算法的基本解决方案。