论文部分内容阅读
Internet上分布着海量的信息,但由于这些信息内容没有更好地形式化表示,目前主要是提供给人使用的,计算机难以处理。为了将网上信息处理和利用尽可能地交给计算机自动完成,人们必须让计算机能够“理解”这些信息,并在“理解”的前提下更好地处理和利用这些信息。所以,WWW的创始人TimBerners-Lee在2001年提出了在现有Web的基础上建设下一代Web的蓝图——语义Web。XML为语义Web提供了通用的表示语法,是Web向语义化方向发展的种子技术;RDF提供了语义上描述知识的数据模型和一组基本的描述原语,是语义化Web在语义上的技术基础。在传统的Web向语义化Web发展的过程中,KE技术和计算机软件工程中成熟的方法,特别是Ontology技术和OO技术,起到了关键的作用。
随着语义Web的发展,基于RDF描述的知识日益增多,形成了各种各样的数字图书馆、知识库分布在网络上,如何把这些现有的知识和正在产生的知识有机地融合在一起,实现面向语义Web的知识融合就是本论文研究的课题。
本论文在研究RDF的数据模型和RDFS语法规范的基础上,基于Jena系统分析研究面向语义Web的知识融合的并算法、交算法和差算法,并基于Jena系统对知识融合的三个算法进行实现和验证。论文首先对语义Web的体系结构和关键技术进行分析和介绍,内容包括语义Web分层体系结构、XML及XMLS、RDF与RDFS、Ontology及本体语言栈。然后分析研究了知识融合的三个算法,内容包括为什么分析这个算法,与算法相关的Java集合框架,与算法相关的定义,算法的存储结构,两个RDF文件之间的并算法、交算法、差算法。最后对Jena系统体系结构、Jena系统的核心UML、基于Jena系统的三元组解析进行分析,基于Jena验证实现知识融合。