论文部分内容阅读
随着语义网研究的不断深入,对大规模RDF图进行语义推理的速度之慢日益凸显。在传统的语义推理机制遇到瓶颈时,应用MapReduce和HBase来实现大规模RDF图的并行推理成为新的突破口。对RDF图的并行推理,涉及到图的分解、数据存储、数据推理和查询。在本文中,我们将结合MapReduce框架和HBase存储对RDF图并行推理方法进行优化。本论文主要就以下四个方面进行了研究与设计:一、RDF图的分解。原有的RDF图分解方法存在语义歧义问题,而且分解后的RDF三元组集缺乏结构性。本文将对原有的RDF图分解法进行扩展,消除上述缺陷。二、RDF数据存储模式设计。RDF数据存储是关系到RDFS推理的关键因素之一。本文采用基于HBase的存储方式,设计S-PO、O-SP、SO-P三类存储表来解决大规模RDF数据存储问题。三、RDF数据并行推理方法的研究与设计。在RDFS规则基础上,分析已有RDFS推理算法,指出已有RDFS推理算法的不足并提出改进方案。四、将本文提出的研究理论应用到社保数据分析中,设计一套针对社保数据的分析平台。然后从RDF图分解和RDF数据推理等方面对本论文提出的方案进行测评,并进一步提出本文的不足和未来的研究方向。