论文部分内容阅读
在大规模P2P网络中节点数量庞大,节点上的信息呈现出海量、分布、动态、异构的新特征,要建立集中的索引进行检索工作量太大,不容易实现,所以面对这些缺乏组织与管理的网络节点,检索时往往采取洪泛的方法,效率很低,而且有时检索已经达到指定跳数,检索停止了却还没有搜索到有用的信息。当前网络中的检索都是基于关键字而进行的,常常搜索到大量关键字相同但无用的信息,那些真正有用的信息又由于关键字不匹配而无法得到。可见用户需要的不只局限于匹配关键字的那些信息,只依靠关键字进行检索远远不能满足用户的需求。所以需要将节点按照所包含信息的语义关联进行有效的组织,建立基于语义关联的语义覆盖网,使检索能够以需求为中心高效的搜索出大量语义关联的信息,为用户提供信息资源关联聚焦服务。本文以P2P对等网络为研究背景,对实现信息资源关联聚焦服务的主要贡献如下:1.将节点按照存储资源的类型聚类。针对节点上存储资源类型的多样性,提出先构建主题树将节点上的资源分类,基于资源的类别计算节点相似度,并进行节点聚类。2.将主题分解为多个属性,建立主题属性矩阵;利用关系数据库中实体之间的关联,量化实体的主键属性之间的关联值,主键属性对应主题的属性,建立属性矩阵来表示属性之间的语义关联。提出了根据某两个主题包含的属性之间的语义关联值来计算主题之间语义关联值的算法,然后在有语义关联的聚类之间添加关联链接。3.基于聚类访问的偏好记录一个语义路由表,在经常访问的聚类之间添加朋友聚类快捷链接。经过上述步骤建立起一个基于语义关联的语义覆盖网,实验证明在这个语义覆盖网的基础上进行资源检索可以大大提高检索效率,它还支持基于语义关联的聚焦服务。为实现大规模、分布式P2P网络环境下的信息高效共享提供了一个有效途径。