超节点对等网络信息检索关键技术研究

被引量 : 2次 | 上传用户:hailongsky
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
对等网络(Peer-to-Peer,简称P2P)具有数据分布式存储、节点平等、节点间直接通信等特点,被广泛应用到信息检索、文件共享等领域。随着网络规模越来越大,网络极易产生瓶颈现象和节点失效的问题。为了解决这些问题,人们尝试对超节点对等网络信息检索技术展开研究。但相关研究成果还存在一些不足,仍有许多关键问题亟待解决。例如:如何按照语义相近的原则构建超节点对等网络,以进一步提高搜索效率和检索结果质量;如何设计节点常数度数的超节点拓扑结构,以进一步降低网络维护代价;如何设计失效节点、链路故障的发现和恢复机制,以提高网络的容错性;如何建立分布式查询机制,以减少超节点的负载、提高检索结果质量和下载质量等。这些关键问题的解决,将有利于满足用户对信息检索的需求,为用户提供更加便捷的信息检索平台。因此,对超节点对等网络的信息检索展开研究,有着重要的理论研究意义和实际应用价值。本文以提高搜索效率、检索结果质量和下载质量,降低网络维护代价,增强网络容错性为目标,围绕上述关键问题展开研究。在此基础上利用所得的研究成果设计和实现了一个原型系统。本文主要研究内容及贡献包括以下几个方面:(1)在超节点对等网络的构建方面,本文针对早期的超节点对等网络信息检索中,存在普通节点与超节点连接缺乏语义相关性,搜索效率和检索质量不高,缺乏超节点负载平衡等问题,提出了一种基于在线聚类的超节点对等网络构建方法。主要工作包括:①改进了已有在线聚类算法,以适应高动态的对等网络。该算法保证了普通节点按照语义相关性连接超节点,较好地解决了资源准确定位的问题。②提出了一种超节点选择和动态调整超节点选择策略。该策略能根据超节点自身的负载能力,动态调整连接普通节点的数量,使超节点的选择更加简单,减少了超节点因负载过重而出现网络瓶颈的可能性。③提出一种搜索路由优化机制,使检索尽可能在某个语义组内完成,减少了查询请求转发次数,进一步减少了查询带宽消耗、提高了搜索效率和检索结果。(2)在节点共享文档组织方面,为了克服已有共享文档组织方法不利于构建语义覆盖网络的问题,提出一种基于层次聚类树的超节点对等网络。主要工作包括:①改进了传统层次聚类算法,以适应多文档集聚类。采用该算法将节点共享文档集聚类,根据簇之间的语义范畴形成层次聚类树,克服了传统单层次聚类很难揭示文档之间语义关系的不足。②在层次聚类树的构建过程中,利用曲线多项式拟合技术,设计一种自动发现并设置阈值的方法。这种方法使聚类过程更加智能化和自动化,聚类结果更加准确。③提出了基于层次聚类树的超节点对等网络构建方法。利用该方法,普通结点能根据网络中已有语义组的语义范畴,选择不同层次的簇与超节点建立连接,提高了搜索效率、减少了查询带宽消耗。(3)在超节点拓扑结构方面,针对已有超节点对等网络中超节点拓扑结构复杂、无序,难维护、不便于搜索路由等问题,提出了两类常数度数的超节点拓扑结构模型。主要工作包括:①在分析完美差异图(PDG)结构的基础上,提出一种新的k-PDG拓扑结构,并利用该结构组织超节点,建立了一种新的超节点对等网络。②提出一种新的k-皮特森图拓扑结构。采用改进的皮特森图,将网络中超节点按照k-皮特森图拓扑结构进行组织,建立了一种新的超节点对等网络。性能分析和模拟结果表明:这两类结构与现有超节点拓扑结构相比,除具有支持多关键词查询、减少搜索所产生的查询消息量外,在动态适应性方面,新超节点对等网络能更好地降低超节点失效对拓扑产生的影响;在性能上,该网络具有更小的拓扑构造和失效修复成本。(4)在分布式查询方面,针对现有超节点对等网络中超节点负担重,查询结果缺乏统一排序、包含重复结果的下载节点可能无效等问题,提出一种低负载和高质量的分布式查询处理机制。主要工作包括:①提出一种分布式查询处理机制,减少了超节点的查询负载。②提出一种基于近似全局信息的分布式排序方法,实现对查询结果进行统一排序。③提出一种下载节点选择机制,提高了下载请求的成功率、减少响应时间和网络通信消耗。(5)原型系统的设计和实现。将本文研究成果,如节点共享文档组织方法、超节点构建算法、超节点拓扑结构、分布式查询处理等关键技术加入到系统中,设计与实现了一个原型系统。
其他文献
锻造操作机作为锻造压机的重要辅助设备,主要用以夹持锻件完成送进、旋转、平行升降等动作,配合锻造压机完成锻造工艺。使用锻造操作机能够显著提高锻造压机的生产效率,降低
<正>目前,我国的小学艺术教育,尤其是在务农村小学中,存在着片面追求学习成绩、对艺术教育不够重视、学校艺术课程被挤占现象严重、艺术师资队伍缺乏保证、学生艺术学科基础
会议
本文将数据挖掘技术应用到变电站设备及缺陷管理系统中,设计出设备缺陷数据挖掘系统,此系统包括数据预处理模块,数据挖掘模块和数据挖掘结果显示模块。文中根据变电站缺陷数据的
水稻纹枯病(Rice sheath blight disease, RSBD)是一种世界性水稻病害,同稻瘟病和白叶枯病一起被称为我国水稻的三大病害。目前,随着矮杆育种策略和高氮肥施肥方式的影响,该
在获得无碳化物贝氏体/马氏体复相钢原奥氏体晶界侵蚀方法的基础上,利用电致加热循环淬火和高温形变方法对无碳化物贝氏体/马氏体复相钢进行组织超细化处理,研究了循环热处理中
建筑工程市场的竞争日趋激烈,如何做好项目的成本控制,达到既定的经济目标,除采取现代化管理方法外,工程索赔也是一个重要方面。施工企业要针对合同里明确规定的索赔条款,成立由熟
新课程改革背景下,对小学数学教学提出了更高要求。教师要创新教学理念,在教学过程中采用结构教学的方式,以提升学生学习兴趣和数学综合素养,满足新时期教学需求。本文主要结
水稻纹枯病是水稻上最重要的病害之一,病原菌为立枯丝核菌Rhizoctonia solani Kuhn。目前对其致病机理及分子生物学水平上的研究报道甚少。通过对水稻纹枯病菌进行遗传转化,
探讨了在高等师范院校数学教育专业开展数学科技活动,培养学生创新意识和实践能力的可行性,并在实践的基础上探讨了活动的具体形式、内容以及需要进一步解决的问题。
目的:以8名患有考试焦虑的高中生为研究对象,探讨考试焦虑形成的首要(真正)心理机制的因素是条件性情绪反应(因素),导致考试焦虑障碍的认知因素在绝大多数情况下都属条件性情绪反应