论文部分内容阅读
借助现代网络技术,建立网络政务系统,面向公众提供高效、便捷的公共服务,强化政府的公共服务职能是当今很多政府的追求目标。电子政务建设中,政务信息资源的共享和协同政务是很重要的内容,但在实现的过程中面临一个严重的问题:系统间缺乏一致的数据理解,从而增加了问题的难度和复杂度。采用语义技术实现政务信息系统的有效互操作是解决上述问题的有效手段。但语义技术还处在不断发展、完善的阶段,在实现中还有很多工作要做。根据各自治系统构建的局部本体之间也存在语义差异,需要设计合理的语义互操作模型来解决,常规的语义互操作模型没有考虑到电子政务领域数据特点,不能直接应用于本文研究的场合。要进行互操作、实现资源共享,首先要知道信息资源在哪里,现在常见的方法是建立基于元数据技术的信息资源目录,基于关键字匹配进行检索,检索质量不高,而且找到了也不知道信息资源的语义,会产生由于数据语义差异而导致的错误。还有如何将数据源数据转换、发布为语义数据的问题。如果将相关数据转换为静态本体,本体体积将会极其巨大,传统DL推理机往往无法处理。若同时采用本体分割技术,但分割技术往往都忽略了本体实例,分割后的本体仍然非常庞大。有些方法通过将语义查询转换为SQL来解决这个问题,但是语义表达、处理能力有限,都是RDFs级别的。各自治政务系统的数据之间存在语义异构性,进行互操作时,会暴露出很多冲突,常见的方法将数据库模式映射为局部本体,在映射过程中消解冲突,但是这种方法只能消解部分冲突。针对上述问题,本文做了一些研究工作,主要内容和创新点如下:(1)提出了电子政务领域的语义互操作模型。针对数据源的复杂性,提出数据视图的概念,将数据库表、交换服务等变换为统一的数据形式,但它们的语义还依赖于原始数据源。以数据视图为数据基础,提出了分层的互操作模型,通过全局本体、局部本体和冲突本体组织领域知识;定义了三种映射,通过它们实现了语义发掘及本体间的互操作,不仅使各自治系统的数据以语义良构的形式存在,而且消除了局部本体之间的语义差异。(2)提出了语义信息资源目录的概念及构建方法。提出了语义信息资源目录的概念、内容及组织方式。论述了如何构建语义信息资源目录,尤其是如何深度发掘数据暗含语义,设计了四类规则促进语义的发掘。(3)设计了在大规模数据源上进行语义查询的DSQ算法。本文研究将数据模式转换为静态本体,数据记录维持本身的自治性,设计了DSQ算法实现大规模数据源上的语义查询。DSQ算法的基本思想是将领域本体转换为图结构,语义查询也转换为图结构,然后进行子图的语义匹配,再将匹配结果转换为常规的SQL语句在数据源上进行查询。DSQ算法的语义支持能力突破了RDFs,实现了对OWL DL部分词汇的支持。(4)提出了语义冲突的解决框架。本文对语义互操作中可能出现的冲突进行了全面分析,明确了语义冲突的概念和类型,并设计了相应的解决框架,进而对多种冲突进行消解。本文还指出,在语义冲突中,存在一种特殊的属性冲突,进而提出冲突本体的概念,采用动态方法管理冲突本体实例以及转换函数,以其为基础设计算法专门消解属性冲突。(5)最后设计并原型实现了政务信息系统语义互操作框架,通过实验初步验证了本文理论的正确性、有效性。