P2P文件共享系统中资源检索算法的研究

来源 :北京大学 | 被引量 : 0次 | 上传用户:jij0tl81f
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在P2P文件共享系统中,如何能够将全部用户共享的文件检索到,并以合理的方式展现给用户,一直是困扰着P2P文件共享系统的设计者的难题。开放式的P2P环境下的高动态性等等特性,加大了设计检索方法的难度。 本文首先分析了Maze系统中好友网络的社会性,提出了好友之间共享文件的相似度较高的猜想,并验证了该猜想。利用这个结论,结合了EigenTrust算法,提出了适用于无结构覆盖网络的EigenForward搜索方法。并采用模拟实验,证明其搜索的性能由于传统的泛洪搜索和Random Walk方法。 由于结构化的覆盖网络的高性能和高可扩展性,在其上设计信息检索算法是当前的研究热点。但是目前的研究多集中在稳定性较高、动态性低的封闭环境中。本文指出了传统的构建在DHT上的搜索算法的纯在的缺陷和漏洞,并在此基础上,提出了称为异步发布的基于DHT 的检索算法。并分析了开放式P2P环境中系统的动态性,提出了在该环境中维护索引的方法。并首次将向量空间模型同用户反馈共同运用到DHT的检索算法中,提高搜索性能,降低网络负载。 本文首次指出了现有的开放性P2P环境中的搜索算法对中文分词问题考虑的不足,而影响了中文的检索的效果。分析了传统中文分词算法在开放式P2P环境中的局限性,提出了两种构建在DHT环境中的中文分词算法。并分析了两种算法各自的优点和潜在的问题。给出了分布式环境下中文分词算法的基本解决方案。
其他文献
多核与虚拟化的发展,数据规模的增长,以及新的计算模式的出现,对内存容量提出了不断增长的需求。然而,DRAM系统的扩展性却受到了封装、工艺和信号完整性问题的限制,尤其以信号完整
随着移动通信技术的快速发展,国内移动网络运营商也在加紧对3G网络的部署和运作。为了保证第三代移动通信系统中核心网(CN)的安全,防止外部Internet网络的攻击,以及保护移动终端
随着Internet迅速发展,网络软件平台已成为当今软件技术发展主流趋势和竞争焦点,其核心和关键是位于中间层的Web应用服务器。Web应用服务器是在Web计算环境下产生的一种新型中
学位
网格计算是分布式计算的一种,随着网格应用的发展,网格技术被逐渐应用到科学研究的各个领域中。网格计算资源共享的思想与生物信息计算环境Weblab“一站式”服务的思想不谋而合
本文对可扩展的应用服务器架构的设计与实现进行了研究。主要内容如下: (1)分析了容器、公共服务和底层通信的关系,提出了一种改善系统结构的解决方案,能便利系统的维护、更
随着信息社会数据量的日益增加,人们迫切需要有效的数据挖掘来发现其中的知识。数据挖掘的好坏不仅决定于挖掘的算法有效性,更决定于待挖掘数据的质量。数据预处理可以为数据挖
随着Intemet的普及和社会信息化的不断发展,越来越多的商业应用系统被开发和部署到各商业企业和公共服务部门中,在社会生活的各个领域扮演重要角色.机群计算环境(Cluster Com
随着嵌入式系统领域不断增长的应用需求,嵌入式系统的复杂性日益提高。作为一款优秀的、开源的操作系统,Linux在嵌入式领域的应用也越来越广。随着Linux内核的不断丰富以及应用
信息技术飞速发展,计算机审计取代过去传统的手工审计,成为现代审计领域的热点技术。我国从20世纪90年代末大力推广计算机审计以来,已取得很大的进步,多种审计软件问世,某些领域取
学位
互联网已经成为社会基础设施,网络规模持续扩大,新应用不断涌现,对网络管理和安全提出挑战。网络流量分类(Network Traffic Classification)作为流量管理和安全防范最重要的基础