虚拟组织环境下的本体集成与演化问题研究

来源 :中国科学院计算技术研究所 | 被引量 : 0次 | 上传用户:wuyan68
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
语义异构是虚拟组织成员间实现信息共享所面临的一个核心挑战。解决此问题的一种有效方法是集成成员本体,形成领域知识的公共全局视图(虚拟组织本体),从而为异构资源提供统一的语义描述。然而,虚拟组织的动态性和开放性为成员本体的集成带来了极大的困难。由于不断会有新的成员加入虚拟组织或者旧的成员改变已有的领域知识,作为全局视图的虚拟组织本体需要能够随着成员本体的变化而持续演化。本文提出了一种支持持续演化的本体动态集成方法DODO,通过不断集成成员本体更新的领域知识来实现虚拟组织本体的构建。本文从需求、方法、算法、体系结构、原型系统以及在实际项目中的应用等角度对该问题进行研究,其主要工作和创新性贡献如下:   (1)提出一种支持持续演化的本体动态集成方法DODO   DODO方法引入演化的思想,以虚拟组织本体变更的生命周期为主线组织整个集成过程,并将其划分为变更捕获、变更执行与变更传播三个阶段。首先,它通过分析变化后的成员本体和虚拟组织本体元素间的语义关系来发现需要被虚拟组织本体吸收或摒弃的领域知识,并将它们以变更的形式表示出来;接着,通过执行捕获的变更促使虚拟组织本体演化完善;最后,通过将执行的变更传播给受到影响的映射关系,促使它们进行调整。与现有工作相比,DODO方法的特色是不要求领域专家预先构建一个完备的虚拟组织本体,强调通过不断分析成员本体领域知识的变化来促使虚拟组织本体持续演化完善。该方法能够在保证较好集成效果的同时有效降低响应成员本体变更的代价。   (2)提出一种准确高效的本体匹配算法RuleMatch   RuleMatch算法是变更捕获阶段的核心算法。它负责计算本体元素间的语义关系以使能变更的捕获。与现有工作相比,该算法具有以下特色:①提出了复合词匹配技巧来提升匹配算法的准确率。它通过分析复合词组成单词之间的修饰关系来推断复合词的词义,从而使能复合词所代表本体元素间语义关系的计算。实验结果表明,该技巧为RuleMatch算法分别带来了2%-4%的查全率和2%-23%的查准率提升。②提出动态预测和匹配规则两种优化技术来提升匹配过程的性能。动态预测技术通过预测元素间出现语义关系的可能程度优化待匹配元素的选取过程。匹配规则技术通过重用两个元素的匹配结果来直接确定相关元素的匹配结果,从而有效避免对相关元素所进行的不必要的匹配操作。基于相同的实验环境,与H-Match、Ctx-Match以及CMS等匹配算法相比,实验结果表明RuleMatch算法能够在保持较高准确率的前提下,性能提升至少3倍以上。   (3)提出一种能够减小变更影响的变更执行算法MINI   MINI算法是变更执行阶段的核心算法。它负责执行捕获的变更并保障变更后本体的模型一致性、无冗余性和简洁性。与现有工作相比,MINI算法能够有效降低本体变更造成的影响。它首先分析并提出了量化变更影响的数学公式,在此基础上,变更执行过程被转变为本体的变换过程,并通过搜索一条影响值最小的变换路径来减小变更影响。以“科技资源整合项目”中的实际数据(1000个服务与项目中建成的科技新闻本体)为实验背景,以变更执行后受到影响的服务个数占服务总个数的比例为实验指标,与KAON和Protege中的变更执行算法相比,执行相同变更后,MINI算法造成的平均变更影响范围仅为这些算法的60%左右。此外,MINI算法还能够保障变更后本体的无冗余性和简洁性等更多的本体性质。   (4)提出消除本体变更对已建立映射关系影响的变更传播算法PROA   PROA算法是变更传播阶段的核心算法。它通过将虚拟组织本体的变更传播给受到影响的映射关系,促使它们进行调整来维护虚拟组织本体及其依赖物件(如服务)之间的一致关系。与现有工作相比,该算法具有以下特色:①提出变更影响范围的计算公式。该公式使得只有受到变更影响的映射关系才会被通知并调整。这可以有效缩小传播范围,降低消除变更影响所耗费的代价。②提出变更影响是否能够被自动消除的判定原则。对于能够自动消除的情况该算法将通过预定义的消除策略自动解决。否则将通知服务提供者和维护虚拟组织本体的领域专家通过协商来交互解决。通过对机器和人工各自承担任务的剥离,使得仅在需要人员参与的时候才通知相关人员,可以有效减轻领域专家和服务提供者的负担。   以上述工作为基础,实现了DODO本体动态集成工具。并在科技资源整合项目中进行了应用和测试。测试结果表明了本文工作的可行性和有效性。
其他文献
入侵检测系统是网络安全研究的一个热点,它能够动态监视网络的流量,发现非法的入侵行为,实时关闭非法的连接,是网络安全产品的基础和核心。   蜜罐是一种新兴的主动防御的网络
学位
云计算和Web2.0应用对分布式存储系统提出了如下性能要求:极高的聚合读写带宽,庞大的名字空间管理能力以及均衡的数据读写负载。然而现有分布式文件系统存在诸多设计和实现上
随着微电子技术、通信技术以及移动应用的发展,智能移动设备近年来得到前所未有的高速发展,已经成为用户随身携带的必需品而成为日常生活中不可或缺的一部分。为了取得功能和新
传统的分子生物学着重于研究单个基因的功能。但是,生物体是一个复杂的系统,基因彼此相互作用形成网络。基因网络的功能并不简单的是单个基因功能之和。因此,在后基因时代,功能基
目前,行业信息化发展迅猛,但以往众多信息系统的开发缺乏整体规划和系统性,随着异构环境不断增加,数据交换困难,“信息孤岛”问题愈发突出。为了适应企业需要,有越来越多的应
需求工程是软件工程第一阶段的一个重要活动,其目的是得到对需求的准确清晰一致的描述以及相应的求解限制。需求工程在方法、技术、工具等各个方面正在逐渐成熟,但是关于需求获
IGRS标准是我国有完全自主知识产权的数字家庭标准。我国为加大本国技术在国际技术领域的影响,十分重视IGRS标准的制定和推广。国际标准化组织国际电工委员会正式接纳中国“闪
人脸是人类最重要的生物特征之一,传递着性别、表情、年龄、种族等丰富的信息。利用计算机进行人脸图像分析是计算机视觉和模式识别领域里的一个重要课题,作为人脸识别技术的重
随着计算机技术和网络技术的迅猛发展,计算机系统已经从独立的主机发展到复杂的、互联的开放式系统,这种情况导致计算机及网络的入侵问题越来越突出,为保护系统资源,需要建立不同
风云四号(FY-4)静止气象卫星是我国第二代地球同步轨道卫星,主要负责观测大气环境。不同于美国、欧洲将成像仪和探测仪分别安装在不同的卫星上,FY-4将两个载荷安装在同一颗卫星