论文部分内容阅读
随着信息化进程的不断推进和深入,Web上已累积了海量的信息,企业和组织都在不断努力探寻有效的技术,能够在Web上挖掘有价值的信息并进行数据融合。由于Web的巨大和复杂,使得Web数据集成领域还有很多难题亟待解决。当前,对Web服务的数据集成的研究主要集中在深度Web研究领域,主要面临的问题包括Web服务发现的查全率和查准率不高,Web服务组合方式简单、不能考虑组合的效率以及用户需求满意度低等问题。本文提出了一种面向服务的集成框架,该架构对当前Web服务发现和组合两个关键性技术进行了改进,提供一个在异构环境下Web服务集成的平台,提出的Web服务发现技术和基于本体代价图的Web服务组合算法,保证了Web服务发现的高效性和服务组合结果的高成功率、高满意度。本文针对Web服务发现的研究:采用本体的概念描述Web服务,利用本体对现实世界知识系统的良好模拟,机器通过逻辑推理达到对Web服务的语义层次的理解;提出了基于传统搜索引擎的查询转化的Web服务接口发现机制。提出了一种有效的Web服务发现机制,该机制能够实现静态发现和动态发现的结合,Web服务一般以静态的形式存储在本体库中,保证Web服务发现的效率,如果系统未能在本体库中查询到Web服务,动态地启动Web服务接口爬虫获取服务,该机制还定时以后台运行的方式运行Web服务接口爬虫,保持Web服务本体库处在不断更新中。这种机制保证了Web服务都能够被充分有效地被发现。本文针对Web服务组合的研究:提出了基于本体代价图的Web服务组合算法。将服务流程执行的代价、用户的倾向和服务质量通过代价计算公式的方式综合在一起,使得用户的应用倾向能够影响到Web服务组合策略地生成,使得服务集成的结果既能够保证服务的质量也能够满足对需求的高拟合度。首先定义了本体代价图,即以Web服务作为结点、以Web服务之间的关系作为边、以Web服务之间执行代价为边上的权值的有向无环图。在图上运行本文提出的基于本体代价图的Web服务组合算法,生成组合策略。利用本文的组合策略存储方法,将路径信息和组合策略写入到入选策略的Web服务本体中,实现组合策略的存储。使用本文提出的组合策略实施方法,解析执行该策略,生成满足用户需求的服务结果。最后,本文设计出了一种面向服务的数据集成框架,详细描述了系统包含的主要功能模块,并依据该系统框架设计出了模拟试验平台。通过一个测试用例,介绍了系统的总体运行情况。试验表明,按照该服务组合策略实施的Web服务集成结果能够很好的满足用户的需求,证明了服务组合算法的正确性,也就证明了本文提出的面向服务的数据集成框架,是一种有很高成功率和很高用户需求满意度的有效服务集成机制。