论文部分内容阅读
传统的基于句法层次的关键词匹配技术的信息检索系统,因为缺少对信息资源的统一描述而没有语义处理能力,造成信息的误检、漏检等问题,这使得用户查找与自己检索需求相关的信息变得越来越困难,很难实现信息资源的语义共享。本体从本质上讲是对现实世界中的概念及其相互之间关系的描述。所以,将本体应用到信息检索技术中,用本体中的概念对信息资源及用户检索请求进行统一的形式化描述,可弥补传统关键词检索系统的不足,实现基于语义的信息检索,在查准率和查全率上有了更好的保证。基于本体的语义检索研究虽然目前在国内外已经取得了很大的成就,但总的来说本体检索还在处于理论日趋成熟,应用研究相对滞后的阶段。很多成熟的方法都是直接基于本体的推理和检索方式,而对信息的自动语义抽取、动态维护还是遇到很大的困难,系统扩展性也难以尽如人意。目前还没有完全成熟的系统,Web上也未出现一个非常完善的,可以进行真正的自然语言检索的,基于本体的语义检索工具。本文选题来源于导师贾君枝博士主持的国家社科基金项目“汉语框架网络知识本体构建研究”。基于所构建的法律框架网络本体,探讨在该领域本体之下的语义检索解决方案。通过对资源库的框架语义标注及用户以自然语言提出的检索请求的语义解析,采用基于概念图匹配的语句相似度算法计算检索资源与用户查询请求的相关度,不仅可得到与检索条件精确匹配的信息资源,而且还能查询到与检索条件具有语义相关,但在语法上并不精确匹配的隐含信息资源,从信息查全率和查准率两方面提高法律信息资源的检索效率。文章的研究内容及结构安排如下:第一章分析基于本体的语义检索研究的背景及意义。分析国内外基于本体的语义检索的研究现状,提出本文的基于法律框架网络本体的语义检索研究任务。第二章通过分析本体在语义Web结构体系中的地位及作用,提出一种基于本体的语义检索模型和系统框架,详细阐述了系统的功能和检索流程。第三章分析基于法律框架网络本体的语义检索系统。将整个检索系统分为三个子系统:法律框架网络本体管理子系统、法律语料库管理子系统和法律框架网络本体查询子系统。重点分析语料库管理子系统中语料库的构建方法和检索子系统中各功能模块的工作原理。第四章阐述语义检索系统中的关键技术。详细介绍如何实现对用户以自然语言提出的检索问句的语义理解。深入分析如何计算检索出的答案候选句与用户的检索问句之间的语句相似度,以向用户提交最符合检索要求的答案。第五章实现了一个基于法律框架网络本体的语义检索实验系统。说明系统的开发环境及所用到的开发工具,模拟语义检索系统中的部分环节,展示系统的实现机理及检索流程。第六章总结全文,分析全文工作的特点及不足,对基于法律框架网络本体的语义检索系统的未来发展做出展望。