论文部分内容阅读
当今社会,信息爆炸成为了时代的显著特点。在海量的信息资源面前,如何全面而又高效率地检索到自己需要的信息成了备受关注的问题。由于现有的检索系统大都是基于关键词的检索,使得对查询词或语句只能实现字面上的匹配,无法实现对一词多义的理解或是对同义词扩展等情况,检索出来的结果也往往不能满足用户的需求。如何对现有的检索系统存在的这一系列问题进行改进已成为信息界研究的重点。伴随着本体(ontology)概念的提出,研究者对ontology进行了大量研究。Ontology具有良好的概念层次结构和对逻辑推理的支持,具有通过概念之间的关系来表达语义的能力,能较好的为语义检索提供知识基础,所以基于ontology的信息检索成为一个重要的研究课题。其中,本体的构建是否合理、完善都会直接影响到系统最终的检索效果,可以说领域本体的构建是实现语义智能检索的关键。因此,本文在对信息检索理论和本体理论深入研究的基础上,详细介绍了本体构建的方法和技术,并以教育技术学为例进行了领域本体的构建,为检索系统的实现打下基础。为了在检索中充分运用本体和语义技术来提高系统的检索性能,本文提出了基于本体的相似度算法和语义查询扩展方法,并在以上内容的基础上提出一种基于领域本体的信息检索模型,并详细设计模型中各个模块的功能。本系统可以实现在查询预处理阶段对查询信息进行概念语义提取,在查询阶段进行本体标注和语义扩展。最后,为验证该模型的检索效果,将其和传统的基于关键词的检索进行对比实验。结果分析显示,无论从查全率还是从查准率来看,该检索模型都比传统的基于关键词的检索模型存在优势。基于本体的语义检索有赖于人工智能、自然语言处理等技术的发展,如何实现自动化的本体构建,如何尽早的将基于本体的语义检索大规模的运用于实践都将是今后继续研究的重点。