论文部分内容阅读
来自中国互联网信息中心的数据称,互联网数字分配机构地址池中的 IPv4地址已经分配完毕。可见当今互联网的发展已经达到鼎盛时期。而现在的中国的互联网更是爆炸式发展,中国网民增长迅速,网络中所蕴含的信息资源急剧膨胀。当前互联网应用的网络结构多是Client/Server(C/S)和Browser/Server(B/S),这两种网络结构中服务器都扮演了很重要的角色。但是这些基于服务器的应用存在着单点失效、过多无效链接、成本昂贵等不足,大大降低了搜索结果的查准率和查全率。近几年Peer-to-Peer(P2P)技术发展迅速,应用越来越广泛,以其分布式、动态性、可扩展性方面的优势弥补了传统搜索引擎的缺点,为搜索引擎的发展带来了新活力。 本文主要探讨的是以 JXTA这一先进的 P2P技术与高性能的搜索引擎 Hyper Estraier结合的方式,设计与实现一个P2P的全文检索系统。具体的研究工作如下: (1)本文基于JXTA协议搭建了系统的P2P网络平台,实现了P2P应用的一些基本功能,如节点发现、资源定位、数据传输等,为系统全文检索功能的实现建立了平台基础。 (2)本系统采用IP多播进行防火墙和Network Address Translation(NAT)设备以内的多播搜索,利用HTTP能够穿越防火墙和NAT设备的特性,实现了防火墙和NAT设备之外的搜索,充分利用了P2P网络上的资源。 (3)本系统实现了私有对等组,每一个对等点在加入私有对等组之前必须同时知道该组的登陆名和密码。私有对等组将网络流量全部控制在组内,避免了网络流量不必要的扩散。 (4)本文采用Content Manage Service(CMS)实现了资源在组内的共享,并利用Hyper Estraier改进了CMS的搜索功能,使之拥有了对资源全文检索的能力。 最后,选择校园内两个教学楼之间的几台电脑搭建了实验网环境,根据系统的功能要求设计了测试用例,对系统做了全面的功能测试。测试结果说明系统在兼容性、安全性、资源利用率和检索性能方面符合设计要求,较其他P2P信息检索系统相比实现了索引管理本地化,能够获取防火墙和NAT设备之后的资源,并具备良好的全文检索能力。