P2P网络基于异构本体的语义检索机制的研究

来源 :南开大学 | 被引量 : 0次 | 上传用户:xiaoc009
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
当前基于P2P网络的研发主要集中于文件共享的应用,但是现有P2P系统特别是结构化P2P系统大都仅支持粗粒度(文件水平)的共享,检索机制只支持基   于关键词的字面信息的精确匹配,使得检索方法只支持弱语义,甚至缺乏语义;并且由于缺少对信息内容的一致的语义描述,检索过程难以找到与需求内容相关的信息,难以实现相关信息的语义融合。   本体是语义网技术的核心,其目标是提供对领域知识的共同理解,确定领域内共同认可的词汇(表示概念),并从不同层次形式化地给出这些词汇语义以及词汇之间的关系。   本文研究内容主要聚焦于P2P网络的语义检索机制。将语义网技术,特别是本体与结构化P2P网络相集成,在充分利用结构化P2P网络的可扩展性,负载均衡等优点的基础上,通过本体对领域知识的描述来增强对信息内容的描述能力,着重解决P2P网络仅支持弱语义,甚至缺乏语义的问题。并深入研究其中关键技术所面临的挑战,取得了以下成果:   1.提出了基于本体的文档描述模型   结合语义标注技术及文档的元数据描述形式,提出了P2P网络中基于本体的一致的文档描述模型。文档描述模型采用两层体系结构,融合本体概念、本体关系以及文   档关键词,从语义、语法两个方面对文档进行描述。通过定义一致的文档描述模型,解决了P2P网络检索中的数据建模问题。   2.提出了基于描述逻辑推理的本体映射方法-LMATCH   P2P网络节点自治性和对等性要求节点独立的构建和维护本地本体,造成节点本体之间存在异构性。本文提出了基于描述逻辑的本体映射方法-LMATCH,解决了P2P网络节点本体异构问题。LMATCH方法充分考虑了概念在本体中的语义环境,利用描述逻辑表示了概念在本体中的语义,通过对概念的逻辑描述形式之间逻辑关系的推理,发现不同本体中概念之间的语义关系,进而实现异构本体映射。LMATCH方法产生的本体映射结果是概念之间更加直观和明确的语义关系,而不是不包含任何语义信息的相似度数值。   3.提出了结构化P2P网络基于异构本体的语义检索方法   在结构化P2P网络中引入基于概念的两级分布式索引机制:本体概念分布式索引和文档描述符分布式倒排索引。在基于本体的文档描述模型和LMATCH本体映射方法的基础上,实现了P2P网络的语义检索。语义检索的过程可以描述为:根据本体概念分布式索引对检索请求进行转发,并在转发路径中的节点上查询文档描述符倒排索引,通过LAMTCH本体映射方法实现检索请求和文档之间基于语义的匹配。   4.在专家的帮助下构建了经济学领域本体-EOntology,并以EOntology作为基础本体开发了P2P网络语义检索原型系统-EPSS   EOntology以本体的方法和技术对经济学领域内容进行了组织和形式化表示,将经济学领域划分成知识(Knowledge)、理论(Theory)和方法(Method)三个主要范畴,从三个面对领域内容进行了描述。EPSS系统以EOntology作为构建节点本体的基础本体,在系统中实现了基于本体的文档描述模型、异构本体映射的LMATCH方法以及在二者基础上的P2P网络语义检索方法。同时,EPSS系统还支持基   于关键词的全文检索,作为基于本体的语义检索的补充。   P2P网络语义检索的研究不仅具有重要的理论价值,而且还具有广阔的应用前景,本文针对其中的一些问题展开了研究和讨论,所做的工作仍有待不断的完善和进一步的发展。
其他文献
合成孔径雷达(SAR)具有全天候、远距离、极强的穿透力和高分辨率等特点,在国民经济和军事领域中都有着广泛的应用。如何对SAR图像进行快速、准确地解译越来越引起人们的关注
即时消息业务用于在用户之间快速传递文本或多媒体信息,并能及时、有选择地向用户的联系人传递用户在线状态。近年来,即时消息业务发展迅速,不仅在互联网上积累了大量用户,在
在变电站自动化系统的发展过程中,由于缺少统一的电力规约,导致采用不同规约的设备之间进行互操作之前,要进行大量的规约转换工作,严重影响了变电站自动化系统的开发和运行的效率。为了解决这一问题,以实现设备互操作性为目标的IEC 61850标准被提出,并得到了广泛的研究和推广。本文首先介绍了IEC61850标准,包括IEC61850标准的组成、目的、系统结构、功能分解、信息模型、抽象通信服务接口(ACSI
彩铃业务是一项由被叫用户定制,为主叫用户提供一段悦耳的音乐或一句问候语来替代普通回铃音的业务。用户申请开通彩铃业务之后,可以自行设定个性化回铃音,在其做被叫时,为主
随着经济全球化,电子商务环境的竞争越来越激烈,人们必然会选择协商来解决利益冲突。利用agent自动协商技术可以替换人工协商费时、代价高、反应迟钝等缺点,有利于协商的效率
动作识别是计算机视觉领域的重要研究课题,同时也是当前极具挑战性的热点问题。近几年来它更加引起了人们的注意力,它在自动视频分析、视频监控、运动事件分析、人机交互和虚
移动业务终端是对移动营业厅的补充,在具有手机功能的同时,也具有营业厅的部分功能,可部署在营业厅覆盖不到的地方。移动业务终端采用了S3C2410嵌入式处理器和Windows CE.NET
贝叶斯网络参数学习是贝叶斯网络研究中的重点问题。有标记的训练样本充分时,极大似然估计方法是贝叶斯网络参数学习典型且有效的方法。但当有标记的训练数据稀少时,极大似然
门诊医生工作站能辅助门诊医生的日常医疗工作,规范门诊医疗文书,为诊疗提供各种辅助服务,从而提高医生的工作效率及医疗质量。医生工作站是医院临床信息系统的核心部分,复杂程度
随着互联网的飞速发展,Web已经成为全球最大的公共信息源,Web中蕴藏了各种丰富的知识。Web数据挖掘是指在Web这个信息源中挖掘出有用模式和隐藏信息的过程。然而,由于Web数据的