论文部分内容阅读
"Ontology"(本体)最初是哲学领域的术语,是关于事物存在及其本质规律的学说。本体可以将人们共同认可的各种类型知识转化为规范的、计算机可以理解的形式。但是,目前真正投入使用的本体及相关科研成果还很少,主要原因在于现有本体的构建以人工为主,期间涉及多位专家协助,还要求领域专家对相关领域的概念和关系具有清晰和全面的理解,投入资源大、建设周期长、质量无法保障等问题严重制约着本体的应用。能否快速、便捷地获得某一领域的概念与知识,并将其自动转化为领域本体,在一定程度上决定了本体应用和推广的速度。本体自动构建技术正是围绕这一问题进行研究的。本文对本体的相关理论进行了研究,对比分析了文本预处理、特征提取、知识模式提取和知识模式评价等文本挖掘过程中多个阶段的相关算法,结合本体自动构建的指导思想,详细介绍其构建工具及构建方法。在理论研究的基础上,开发了文本挖掘结果分析工具和本体自动构建工具,搭建了基于文本挖掘的本体自动构建原型系统。在上述工作基础上,收集教学领域的相关资料,并进行了规范化整理,使之适合文本挖掘和本体构建的需要,利用本体自动构建系统成功自动构建了教学领域本体。在教学中的实际应用表明通过对基于文本挖掘的本体自动构建技术研究,开发相应的分析构建工具,能够很大程度上缩短本体构建工程的周期,减少本体构建过程中领域专家的投入,节约大量成本,同时能够避免人工构建本体时,由于知识面、专业的影响,领域专家之间认识不统一造成的本体内部不一致问题以及人为不细心造成的差错,从而提高了构建本体的质量,为本体应用提供了很好的技术支持。