基于领域本体的检索系统研究与实现

来源 :华中师范大学 | 被引量 : 0次 | 上传用户:yangyupengmei
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
互联网是海量信息资源库,随着大数据网络信息新时代的到来,信息量正以爆炸性的速度在增长,并且信息的组织是异构的、多元的和分布的,如何准确的在海量信息中寻找满足用户查询期望的信息已成为当前信息检索系统所面临的重大挑战。本文深入研究了基于领域本体的信息检索,以本体为依据,提出一种新的语义映射模型,并对领域本体的构建、本体查询扩展等进行了以下研究工作:1、领域本体的构建。参照斯坦福大学的“七步法”原则,提出一种领域本体的构建方法并通过本体开发工具Protege给出一个领域本体的构建实例。2、提出一种新的语义映射模型。在线性链条件随机场的基础上提出一种隐动态条件随机场,并结合单词的上下文语境,在领域本体和词汇间建立语义映射模型,用来存储本体概念与词汇间的映射关系,达到词义消歧的目的。并将经过该语义映射模型进行词义消歧后的用户查询和文档库中的文档转化成相应的概念向量,再利用向量空间模型进行文档语义相似度计算并按相似度大小将匹配结果集进行排序输出。通过对比实验表明隐动态条件随机场模型要优于隐马尔可夫模型和最大熵模型。3、本体查询扩展研究。由于本体能描述和定义概念及概念间的相关关系具有较强的语义表达能力,当用户查询经所构建的语义映射模型映射到本体中对应的概念后,还可对其进行推理扩展,进一步提高检索效率。采用的方法是依据本体类公理,利用Jena中加入自定义推理规则的推理机制对映射出的概念进行复杂关系的推理,包括类关系推理、类/实例关系推理和基于属性的推理。基于前面的研究,本文开发了一个基于体育领域本体的信息检索系统,该系统能同时支持关键词检索、本体扩展检索和本体语义检索等三种检索方式。实验结果表明本体语义检索比关键词检索和本体扩展检索在查准率和查全率上有明显提高,因此,能满足人们更高的检索需求,为今后更深入的研究语义信息检索提供了基础。
其他文献
随着互联网用户规模的不断增长和网络服务内容的急剧膨胀,内容加速技术得到了广泛应用。内容分发网络CDN(Content Delivery Network)技术作为内容加速技术中最为有效的方式之一
自2012以来,MOOCs(Massive Open Online courses)在全球范围内迅速发展,MOOCs为了适合人们在网上学习,把学校中的课堂碎片化,移植到互联网环境中。MOOCs改变了现代教育的方式
细胞代谢是一切生命活动的基础,代谢网络中的生物化学反应之间的相互作用维持了细胞的新陈代谢。生物代谢网络是一个动态的、有序的网络,代谢网络的失衡则会导致众多疾病的发
关系数据库用来存储结构化数据,并使用SQL语言对数据进行查询,这种方式需要用户掌握这种语言的语法以及数据库的模式知识,因此对用户来说门槛比较高。而互联网上信息检索常常
数字家庭是以计算机技术和网络技术为基础,通过有线网络或无线网络将家庭中的各种通信设备、计算机设备、家用电器、安防设备等连接在一起,提供集成的数据、语音、多媒体、控制
随着异构本体的规模不断增大,当前的本体映射算法在处理大规模本体时会遭遇严重的效率问题。目前针对大规模本体映射大多采用先分块,再在分得的小块间进行块内映射。但是,对大本
计算机双目立体视觉是立体视觉技术中的一个研究热点,利用摄像机从不同角度拍摄物体所得的图像,就可以恢复出物体的三维空间结构信息,而三维空间结构信息数据是三维物体重建的依
寻找任意点对之间的最短路径是图数据管理中典型的、重要的基本操作之一。随着各种大型网络数据的不断涌现,实现在线的最短路径查询成为了当前图数据管理领域迫切需要解决的
基于话题的信息组织,检索,分析等服务已成为学术领域的重要研究话题。学术会议检索主要是根据学术会议名称、召开时间等信息进行检索,可以设定基本检索和高级检索。然而,这些基本
随着经济的飞速发展,人们对汽车的需求量不断攀升,交通事故的发生率也随之快速增长,安全驾驶也成为了社会关注的焦点之一。在所有的交通事故中,因驾驶员注意力不集中而造成的车道