论文部分内容阅读
本体作为语义Web的知识表示基础,在构建基于语义的系统或应用中发挥着至关重要的作用。随着本体规模的增长,系统处理和利用本体的效率会降低。对于大规模的领域本体,语义Web应用通常只需要利用其中的部分内容。从目前语义Web和本体的研究来看,还缺乏比较有效的模型与方法,来支持在语义Web应用中对大规模本体的重用。为了构建和推广面向语义Web的应用,有效地管理和利用已有的大规模本体已经成为一个十分现实和迫切的需求。基于上述背景,本文着重探讨了面向大规模本体重用的子本体模型,主要研究内容和贡献包括以下几个方面:□针对语义Web应用在利用本体时存在的局部性,提出了子本体的表示方法。将来自于大规模本体的上下文相关的模块表示为子本体,给出了子本体的形式化表示,并定义了针对子本体的对象操作。语义Web应用能够根据需要动态地抽取子本体,创建特定的子本体知识库。将缓存机制与本体重用相结合,利用子本体缓存作为系统的局部知识库,支持对大规模本体的动态重用。□对面向子本体的推理问题进行了研究。提出了子本体中的基本推理任务,通过特定的子本体推理算法,将本体的推理问题转化为子本体的推理问题,能从一定程度上降低推理的复杂性、提高推理的效率。给出了基于子本体表示的Tableau算法,支持模块化的本体推理。证明了面向子本体的Tableau算法相对源本体而言是半判定的,并给出了保持一致性的扩展推理算法。□针对子本体知识库的优化问题,提出了基于遗传算法的优化方法。该方法对传统的遗传算法进行扩展,提出了基于语义的遗传算法SemGA,使用基于三元组的非二进制编码方式将子本体表示为染色体,根据语义关系执行遗传算子。利用SemGA进行动态地演化,从而达到优化知识库的语义结构的目的。与一般的缓存策略相比,基于演化的方法在效率上和性能上都有比较明显的优势。□面向分布式的Web资源,提出了基于子本体的资源集成与管理方法。该方法利用本体语义对分布式的Web资源进行集成,通过在资源模式与本体之间建立语义映射,实现以子本体为单位的资源管理。将资源匹配过程转化为资源请求与子本体之间的概念匹配,利用遗传算法进行资源优化,满足动态变化的资源请求。模拟实验的结果表明,该算法能进一步提高资源匹配和重用的效率。基于上述工作,同时还设计并实现了一个子本体原型系统DartOnto,支持面向中医药领域的大规模本体重用。通过实例进一步说明了如何应用子本体模型创建中医药知识服务,解决大规模领域本体的重用问题。