论文部分内容阅读
领域本体是指对特定领域内概念及概念间关系的形式化表达,用于描述一个领域内的知识信息。随着信息技术的飞速发展,航空安全信息涉及的内容逐渐增多且数据形式复杂,民航突发事件应急管理领域本体在图数据处理方面将面临新的问题。本文在分析民航突发事件应急管理领域本体现有存储和查询方案的基础上,提出了一种基于图划分的领域本体RDF存储与查询方案,并进行了以下研究:针对海量RDF图分区方法无法有效保留图的语义结构这一缺点,提出了一种基于标签传播的多级图划分算法。该方法首先选取度数较高的顶点进行标签预处理;其次迭代使用标签传播算法使原始数据形成多个语义结构密切的顶点集合,同时利用标签能量函数限制顶点集合的大小从而实现合理的语义分区;最后,将该方法应用于民航突发事件领域本体的分布式存储与查询。在领域本体RDF数据标签预处理阶段仅对实例数据进行标签赋值从而保证底层RDF图数据的语义结构完整性;在对领域本体RDF存储过程中将切割边对应的顶点进行双重备份从而保证了RDF图数据内容的完整性;采用局部求值的分布式查询策略对民航突发事件相似案例进行查询验证了该存储方法的有效性。实验结果表明,RDF多级图划分算法有效的保留了领域本体RDF数据的语义结构,基于图划分的分布式存储方案在对数据查询时有效的降低了节点间的通信代价从而提高了案例的查询效率,为大数据环境下民航突发事件领域本体在信息共享、推理与语义查询等应用方面提供了更好的数据支持。