论文部分内容阅读
语义异构是虚拟组织成员间实现信息共享所面临的一个核心挑战。解决此问题的一种有效方法是集成成员本体,形成领域知识的公共全局视图(虚拟组织本体),从而为异构资源提供统一的语义描述。然而,虚拟组织的动态性和开放性为成员本体的集成带来了极大的困难。由于不断会有新的成员加入虚拟组织或者旧的成员改变已有的领域知识,作为全局视图的虚拟组织本体需要能够随着成员本体的变化而持续演化。本文提出了一种支持持续演化的本体动态集成方法DODO,通过不断集成成员本体更新的领域知识来实现虚拟组织本体的构建。本文从需求、方法、算法、体系结构、原型系统以及在实际项目中的应用等角度对该问题进行研究,其主要工作和创新性贡献如下:
(1)提出一种支持持续演化的本体动态集成方法DODO
DODO方法引入演化的思想,以虚拟组织本体变更的生命周期为主线组织整个集成过程,并将其划分为变更捕获、变更执行与变更传播三个阶段。首先,它通过分析变化后的成员本体和虚拟组织本体元素间的语义关系来发现需要被虚拟组织本体吸收或摒弃的领域知识,并将它们以变更的形式表示出来;接着,通过执行捕获的变更促使虚拟组织本体演化完善;最后,通过将执行的变更传播给受到影响的映射关系,促使它们进行调整。与现有工作相比,DODO方法的特色是不要求领域专家预先构建一个完备的虚拟组织本体,强调通过不断分析成员本体领域知识的变化来促使虚拟组织本体持续演化完善。该方法能够在保证较好集成效果的同时有效降低响应成员本体变更的代价。
(2)提出一种准确高效的本体匹配算法RuleMatch
RuleMatch算法是变更捕获阶段的核心算法。它负责计算本体元素间的语义关系以使能变更的捕获。与现有工作相比,该算法具有以下特色:①提出了复合词匹配技巧来提升匹配算法的准确率。它通过分析复合词组成单词之间的修饰关系来推断复合词的词义,从而使能复合词所代表本体元素间语义关系的计算。实验结果表明,该技巧为RuleMatch算法分别带来了2%-4%的查全率和2%-23%的查准率提升。②提出动态预测和匹配规则两种优化技术来提升匹配过程的性能。动态预测技术通过预测元素间出现语义关系的可能程度优化待匹配元素的选取过程。匹配规则技术通过重用两个元素的匹配结果来直接确定相关元素的匹配结果,从而有效避免对相关元素所进行的不必要的匹配操作。基于相同的实验环境,与H-Match、Ctx-Match以及CMS等匹配算法相比,实验结果表明RuleMatch算法能够在保持较高准确率的前提下,性能提升至少3倍以上。
(3)提出一种能够减小变更影响的变更执行算法MINI
MINI算法是变更执行阶段的核心算法。它负责执行捕获的变更并保障变更后本体的模型一致性、无冗余性和简洁性。与现有工作相比,MINI算法能够有效降低本体变更造成的影响。它首先分析并提出了量化变更影响的数学公式,在此基础上,变更执行过程被转变为本体的变换过程,并通过搜索一条影响值最小的变换路径来减小变更影响。以“科技资源整合项目”中的实际数据(1000个服务与项目中建成的科技新闻本体)为实验背景,以变更执行后受到影响的服务个数占服务总个数的比例为实验指标,与KAON和Protege中的变更执行算法相比,执行相同变更后,MINI算法造成的平均变更影响范围仅为这些算法的60%左右。此外,MINI算法还能够保障变更后本体的无冗余性和简洁性等更多的本体性质。
(4)提出消除本体变更对已建立映射关系影响的变更传播算法PROA
PROA算法是变更传播阶段的核心算法。它通过将虚拟组织本体的变更传播给受到影响的映射关系,促使它们进行调整来维护虚拟组织本体及其依赖物件(如服务)之间的一致关系。与现有工作相比,该算法具有以下特色:①提出变更影响范围的计算公式。该公式使得只有受到变更影响的映射关系才会被通知并调整。这可以有效缩小传播范围,降低消除变更影响所耗费的代价。②提出变更影响是否能够被自动消除的判定原则。对于能够自动消除的情况该算法将通过预定义的消除策略自动解决。否则将通知服务提供者和维护虚拟组织本体的领域专家通过协商来交互解决。通过对机器和人工各自承担任务的剥离,使得仅在需要人员参与的时候才通知相关人员,可以有效减轻领域专家和服务提供者的负担。
以上述工作为基础,实现了DODO本体动态集成工具。并在科技资源整合项目中进行了应用和测试。测试结果表明了本文工作的可行性和有效性。