论文部分内容阅读
信息语义检索是一种基于语义理解的信息检索方式,较之基于关键词的信息检索方式的主要区别在于:一方面,对信息资源进行标注处理以使其中的信息呈现语义形式的表示;另一方面,对信息检索需求添加语义标签使其得以更明晰的表达。实现这两方面的核心是本体作为知识库提供相应的语义信息。粗糙本体是本体的一种扩展,在本体的精确概念的基础上添加了粗糙概念,并通过上近似外延和下近似外延将二者联系起来,使其能够同时实现对精确信息和不精确信息的表示。粗糙本体在信息检索过程中不仅继承了本体作为知识库对精确信息的表示和推理的能力,而且还可充当鲁棒性、容错性更高的信息载体。本论文在研究精确本体支持的信息语义检索的基础上,引入粗糙本体,构建检索模型,实现对不精确信息的语义表示和语义检索。首先,引入粗糙本体。研究粗糙本体的性质,确定粗糙本体构建的原则与方法,探讨粗糙本体的实际应用,分析粗糙本体替代精确本体后需要解决的不精确信息的表示问题。其次,给出粗糙本体支持的信息语义检索模型。该模型描述了信息语义检索的过程:第一,构建领域粗糙本体;第二,提取出信息语义检索请求的关键词集合,得到初始概念集;第三,通过粗糙本体支持的语义相似度计算,找到满足相似性阈值的精确概念和粗糙概念,获得扩展概念集;第四,通过扩展概念集完成检索请求与已标注的信息文档的匹配,获取检索结果并进行排序处理提交给用户。最后,设计并实现粗糙本体支持的信息语义检索系统。构建海事事故领域粗糙本体,添加具体实例到粗糙本体中,完成对抽取到的海事事故信息的标注,实现海事事故领域的信息语义检索。通过对系统查全率和查准率的测试,证明粗糙本体支持的信息语义检索方法很好地继承了精确本体信息语义表示和推理方面的优势,并能经由属性描述将初始概念扩展为相似的精确概念和粗糙概念,可有效地检索到原本无法获得的不精确的信息。