论文部分内容阅读
对等网络小世界模型簇聚合和存在短链的特性已经被证明对提高检索效率是非常有效的,熟知的Internet,www以及其他许多真实世界中的网络都属于小世界网络。本文基于对等网络的搜索引擎力图融合小世界模型和传统的搜索引擎技术,构建新的搜索引擎系统模型,充分使用小世界对等网络中度数较高的对等节点连通性好的特点,在HNC自然语言理解的基础上进行语义搜索,目的就在于克服当前大多数搜索引擎搜索信息资源覆盖率低、资源消耗大的缺点,以及由于未能没有能够很好的理解查询意图、查询返回结果多且与查询要求无关的不足,为用户快速准确提供信息冗余少,更加符合查询意图的搜索结果。
P2P技术的一个优势是开发出强大的搜索工具。论文论述P2P技术,分析小世界模型特性,结合传统的搜索引擎技术,根据小世界网络簇聚合的特点,将小世界对等网络中度数较高的节点作为索引节点,在索引节点中存储同一个簇中所有节点的资源索引和少量远程网络节点的资源索引,小世界网络中少量的远程网络连接节点为查询提供短链,从而提出基于小世界模型的对等网络搜索引擎系统模型,并且给出模型中对等节点的网络拓扑结构。本文将基于HNC自然语言语义理解的信息检索模型部署在小世界对等网络搜索引擎网络中,研究小世界对等网络搜索引擎系统模型中HNC语义搜索相关性,提出HNC语义搜索算法以及词汇或者语义块HNC概念相似度计算方法,并将该方法应用于小世界网络HNC语义搜索算法中,对HNC语义搜索算法也做了进一步的说明分析。
本文从理论上证明了使用小世界网络中度数较高的对等节点进行消息传递有效的减少了消息传递的步数,从而减少消息传递量;实验部分使用VC++6.0模拟实验了小世界网络拓扑,自行构造查询条件在实现的网络中进行中文主题搜索,实验结果说明本文提出的系统模型能够明显的减少查询消息量,在本文小世界网络搜索引擎系统模型网络中进行HNC语义搜索能够提供较高信息资源的查全率和查准率。
本文基于小世界对等网络搜索引擎研究为新型的搜索引擎系统提供了一种可行的解决方案。