论文部分内容阅读
RDF是标记万维网语言的技术规范,能够丰富地表达和描述网络资源的结构与内容。语义万维网中的RDF和OWL标准已在各个领域有着广泛的应用,由于近年来数据呈现几何级增长,因此设计出高效的海量RDF数据的并行化推理方案,挖掘隐含在数据中的重要信息成为一个亟待解决的问题。本文的主要研究内容是流式RDF数据的并行化推理算法,结合Spark平台和Redis内存数据库,利用MapReduce计算框架,实现基于OWL Horst推理规则的流式推理算法和扩展OWL DL构造算子的流式推理算法,并将算法应用于实际的研究项目当中。论文的主要内容有以下几点:首先,针对OWL Horst规则设计了 PSRH算法,该算法结合Redis特点,根据规则的模式三元组前件的特性,设计了规则连接变量关系表,借此能够快速地辨别可激活的规则,并对其进行推理;而后实时地对重复的三元组进行去重处理和保存,用以进行下一次的迭代计算。最后通过实验,证明了本算法在处理大规模RDF数据推理上的高效性和准确性。接着,针对PSRH算法无法处理OWL DL构造算子的问题,设计了扩展OWL DL构造算子的推理规则和推理算法PSRD。通过对匹配规则的转化,衍生规则的推理以及复杂规则连接变量关系表的构建,来实现基于OWL DL构造算子的推理规则。最后通过设计分布式计算框架来进行实验,实验表明PSRD算法能够有效的完成扩展了 DL算子的衍生规则的推理。最后,本文将分布式RDF数据并行推理方法研究运用于优化某城市安全风险管控智能化平台。首先使用本体构建方法构造风险数据本体文件,并根据本体文件的定义将已有的风险数据转换为适合推理计算的RDF数据,然后结合第四章提出的流式并行化推理算法实现风险信息的推理分析。本文提出的针对流式数据的RDF数据并行推理方法以及扩展了 OWL DL构造算子的流式并行推理算法,对于海量数据针对OWL Horst规则的推理和针对OWL DL的实际应用推理分析都具有良好的借鉴意义。