论文部分内容阅读
随着Internet的迅猛发展,WWW已经发展成为包含多种信息资源、站点遍布全球的巨大的动态信息服务网站,为用户提供了一个极具价值的信息源。而传统的信息检索技术由于对这些信息的语义理解有限,越来越不能满足用户的检索需求。语义检索作为一种基于语义理解的信息检索方法,已成为信息检索研究的重点。本体作为解决语义层次上Web信息共享和交换的基础,语义检索对其具有很强的依赖性。目前对基于本体的语义检索研究,未考虑本体中没有可用的知识对系统检索性能的影响。在本体的利用上,没能充分利用本体中的概念关系,影响了对文档语义理解的准确性。针对以上的这些问题,本论文结合了传统的关键字索引和语义索引方法,在概念一文档权重的基础上对本体概念的部分关系权重进行扩展,提出一种基于本体的语义索引策略。本文的主要内容是:第一章绪论,简单介绍了本文的选题背景及意义,总结了语义检索的研究现状,分析了其存在的问题,说明了本文的研究内容和组织结构。第二章是相关知识概述。本章分为四部分,第一节从信息检索的发展、信息检索的基本定义、信息检索的分类、信息检索模型的分类这四方面对信息检索进行概述。第二节介绍了语义网的结构以及本体的概念、功能、分类和本体的描述语言及其构建工具。第三节和第四节主要对索引和语义索引进行了介绍。第三章是C++课题本体的语义索引策略研究。从C++课题本体的语义索引的设计思路,C++课题本体的建立、向量空间模型、语义信息的处理和权重的计算方法等方面进行论述并提出基于本体的语义索引策略。第四章实验测试。基于第三章提出C++课题本体的语义索引策略进行实验测试,完成分词和索引实验,验证了索引策略的有效性。第五章是对全文的研究工作的总结。分析了本文研究工作的不足和待改进的地方,并对下一步的工作前景进行了展望。总之,随着语义网技术的不断发展,语义检索这一新事物将是信息检索的未来的发展方向。语义检索最终将超越对字面匹配的检索和对字段的检索,从而真正实现用户对知识的检索。