论文部分内容阅读
本体作为一种知识管理模型已经被广泛应用在人工智能及知识工程领域,在知识共享、知识推理及智能辅助决策等方面发挥着重要作用。特别是在以知识推理为核心的航空指挥智能决策领域,需要对以中文文档形式描述的知识进行建模和管理。本体可以形式化地保存某个特定领域或任务中的术语及术语之间的语义关系,提供领域知识或任务问题的规范化、统一的描述,为知识共享、重用及推理提供模型支持。因此,在航空指挥智能决策领域中引入领域本体及任务本体构建相应的知识模型非常必要。但是,领域本体及任务本体的构建目前主要以人工方法为主,显然费时费力,半自动或自动的构建方法已成为研究热点。
论文在部委航空指挥智能决策项目的支持下,主要围绕中文领域本体和任务本体的半自动构建展开了研究。显然,中文本体的半自动构建技术又涉及到两个关键问题,即术语及术语关系的抽取。因此,论文所研究的面向智能决策应用的本体关键技术主要包括:中文术语抽取、中文术语关系抽取、中文领域本体构建及中文任务本体构建。
论文的主要贡献如下:
1.提出了一种基于文本特征和复合统计量权值的领域术语抽取方法(TextCharacterandStatistic,TCS方法)。该方法首先对中文自然语言领域文档进行预处理,然后经过粗过滤提取出候选术语wij,最后综合考虑候选术语wij的文本特征和复合统计量,计算其综合权值WT(wij),并将WT(wij)值大于设定阈值的候选术语认定为最终的领域术语。实验结果表明,该方法能有效地将用户字典、文本特征及统计规则相结合,对特定领域的中文术语抽取效果较好,获得了较高的准确率。
2.提出了一种基于混合余弦相似度核函数的术语关系抽取方法(MixedCosineSimilarityKernel,MCSK方法)。该方法通过计算中文自然语言领域文档中的句型词性语义序列余弦相似度,以及候选层次关系词语的余弦相似度,使用两者来构建混合余弦相似度核函数,将模板规则和半监督的机器学习方法相结合对术语间的层次关系进行抽取。实验证明,该方法改善了单独使用模板规则及机器学习方法的不足,通过较少的人工标注模板,获得较高准确率和性能。
3.提出了一个领域本体的半自动构建方法。该方法的具体步骤包括:确定研究领域、中文知识文档预处理、核心术语挖掘、术语之间关系的抽取及聚类、OWL本体结构化及Protégé可视化修正。文中通过构建实例及和其他方法的对比,验证了方法的有效性及较高的任务完成率。
4.提出了一个任务本体半自动构建方法及查询算法。文中深入讨论了任务的分解、动态IDEF3模型、任务本体的形式化描述以及任务本体的IDEF5建模等内容,并给出了一个任务本体半自动化构建方法及基于任务本体的查询算法。并通过实例验证了方法的有效性和较高的性能。
为了验证所提出方法的有效性,设计并实现了一个基于本体的指挥决策支撑平台(CommandandDecisionSupportplatformBasedonOntology,简称CDSBO)的原型系统。该系统的仿真测试验证了本文所提出的中文术语及术语关系的抽取方法、领域本体及任务本体的半自动构建方法具有较高的性能,为本体在航空智能决策领域的推理任务提供了有力地支持,实现了从命令意图到决策方案的自动/半自动推演生成。
论文在部委航空指挥智能决策项目的支持下,主要围绕中文领域本体和任务本体的半自动构建展开了研究。显然,中文本体的半自动构建技术又涉及到两个关键问题,即术语及术语关系的抽取。因此,论文所研究的面向智能决策应用的本体关键技术主要包括:中文术语抽取、中文术语关系抽取、中文领域本体构建及中文任务本体构建。
论文的主要贡献如下:
1.提出了一种基于文本特征和复合统计量权值的领域术语抽取方法(TextCharacterandStatistic,TCS方法)。该方法首先对中文自然语言领域文档进行预处理,然后经过粗过滤提取出候选术语wij,最后综合考虑候选术语wij的文本特征和复合统计量,计算其综合权值WT(wij),并将WT(wij)值大于设定阈值的候选术语认定为最终的领域术语。实验结果表明,该方法能有效地将用户字典、文本特征及统计规则相结合,对特定领域的中文术语抽取效果较好,获得了较高的准确率。
2.提出了一种基于混合余弦相似度核函数的术语关系抽取方法(MixedCosineSimilarityKernel,MCSK方法)。该方法通过计算中文自然语言领域文档中的句型词性语义序列余弦相似度,以及候选层次关系词语的余弦相似度,使用两者来构建混合余弦相似度核函数,将模板规则和半监督的机器学习方法相结合对术语间的层次关系进行抽取。实验证明,该方法改善了单独使用模板规则及机器学习方法的不足,通过较少的人工标注模板,获得较高准确率和性能。
3.提出了一个领域本体的半自动构建方法。该方法的具体步骤包括:确定研究领域、中文知识文档预处理、核心术语挖掘、术语之间关系的抽取及聚类、OWL本体结构化及Protégé可视化修正。文中通过构建实例及和其他方法的对比,验证了方法的有效性及较高的任务完成率。
4.提出了一个任务本体半自动构建方法及查询算法。文中深入讨论了任务的分解、动态IDEF3模型、任务本体的形式化描述以及任务本体的IDEF5建模等内容,并给出了一个任务本体半自动化构建方法及基于任务本体的查询算法。并通过实例验证了方法的有效性和较高的性能。
为了验证所提出方法的有效性,设计并实现了一个基于本体的指挥决策支撑平台(CommandandDecisionSupportplatformBasedonOntology,简称CDSBO)的原型系统。该系统的仿真测试验证了本文所提出的中文术语及术语关系的抽取方法、领域本体及任务本体的半自动构建方法具有较高的性能,为本体在航空智能决策领域的推理任务提供了有力地支持,实现了从命令意图到决策方案的自动/半自动推演生成。