论文部分内容阅读
自语义网的概念被提出以来,由W3C组织倡导和支持的语义网标准化建设已经取得了长足的发展,制定了一系列包含资源描述框架RDF、网络本体语言OWL、SPARQL查询语言、RIF规则语言等基础规范,并且在学术界的努力下,产生了一大批高质量的领域语义知识库,非结构化数据的语义标记、链接数据集和元数据描述等等。由于语义数据的描述性和互联性,我们把这些领域的知识模型和语义描述的集合称为语义图(Semantic Graph)。语义图构成了领域知识的形式化表述,并被应用到生物医学、电子政务、社交网络和信息检索等多个领域,参与或主导知识表达、决策支持、人工智能等多种智能应用,发挥着越来越重要的作用。语义图推理是用来保证语义图的质量、进行语义图的整合,以及发展进一步智能推理的重要处理手段之一。语义图推理除了可以检测语义图的一致性和完整性之外,更重要的是通过建模领域知识规则,并应用推理技术完成领域知识推论,进而辅助自动化决策、知识挖掘和关联发现。 本文以语义图推理的三大实用性科学问题为研究内容。首先,表达能力有限的语义本体语言无法满足领域应用中的某些复杂因果关系建模,因此扩展语义因果表达能力对于领域知识建模和知识型应用非常必要。再次,对于某些知识型领域,比如医学或者电子控制,常涉及多个因素对结果的影响,以及模糊术语的大量使用,比如多、少、高、低等等,当前的网络本体语言并不提供支持非精确描述以及推理的能力,使得这些领域的知识建模和知识辅助应用进展缓慢,因此研究如何建模领域中的模糊描述建模和模糊推理是领域深度应用需要解决的核心问题。最后,带有领域知识的异域异构语义图之间的无缝信息整合,不仅需要通用一致的知识表达标准,也需要对于多个领域知识的交叉理解和大规模同步处理能力,这是语义图的一大发展趋势和迫切需要解决的问题。本文重点解决三个核心科学问题: 1.面向因果循环的因果语义图建模及推理 针对领域应用中的因果复杂关联性,提出了基于网络本体技术和因果语义规则的因果语义图建模方法,刻画领域知以中的概念、属性、以及个体之间的因果关联关系。然后,提出了基于因果语义规则的语义推理方法,根据条件假设生成或者获取隐含的知识推理结果。在实际应用案例中,针对中医者思维中的人与自然的相关关系和因果关系,对中医基础五行理论知识进行了辨认和梳理,创建了一个全面完整的中医五行语义图,采用因果语义推理引擎对中医五行诊疗进行推理展示其内在的思维过程,或可用于诊疗建议。最后,基于Web开发技术研制了一个在线的中医五行知识展示系统。 2.面向不精确主观描述的模糊语义图建模及推理 针对领域应用中的主观不精确描述,提出了扩展自模糊描述逻辑的模糊语义图建模方法,通过隶属函数来表述模糊术语的语义含义、模糊相关关系等等。然后,提出了基于模糊描述逻辑的模糊语义图推理引擎,最终使得,可以返回实例查询、包含性检测等的查询结果及其模糊度。在实际应用案例中,针对中医药诊疗案例中典型的自然语言术语表达,和中医药诊疗结果中的不确定性,基于模糊语义图方法为现代中医病例术语定义了合理的不确定范围,针对症状、症候、疾病、中药提出了模糊表达方法,实现了中医药术语的形式化解释。同时,基于示范性中医诊疗模糊语义图的研究开发了两个在线中医自动诊疗演示系统,从本体主导和本体辅助的不同方向展示了模糊语义推理在决策支持中的作用。 3.面向大规模语义图整合需求的弹性语义推理 针对大规模多语义图整合的数据量超载和跨语义图语义关联挖掘的实际问题,基于语义链接数据技术,提出了弹性推理的概念,即基于分布式计算的思想提供弹性扩展计算资源和存储资源的能力,通过分散迭代语义推理的任务,达到同步在多个计算节点上推理大规模语义图的目的。在实际应用案例中,为了挖掘中西医之间的已有研究成果关联,收集各个领域的语义数据并进行标准化,在中西医领域专家的协助下制定关联传递规则,设计了中医药知识与相关现代生物医学知识进行关联的分布式语义推理算法。目的是使中医药知识接入到全球互联的知识网络之中,使得中西医结合医学发挥更大的作用和影响力。最后,研制了一个基于开放共享原则的中西医关联搜索引擎,为全球用户提供快捷方便的资源关联、科普教育和科研交流的平台。 最后,综合论述了中医药开放语义平台的总体架构、实施方案以及各个子系统的情况。在中医药开放语义平台的基础上,实现了中医基础理论知识展示、中医临床决策支持和中西医关联发现等中医药领域应用案例。结论处总结了当前推理方法的不足之处,并展望了语义推理和中医药信息化的未来发展趋势。