论文部分内容阅读
随着网络技术的飞速发展和深入应用,互联网上涌现出大量的异构数据资源,为人们获取信息提供了极大的便利。然而,随着用户业务需求的不断变化,单一的数据资源已经难以满足人们的信息需求,人们希望通过便捷的方式对获取的数据资源进行处理以满足其个性化需求。由于涉及大量的异构数据,传统的数据集成方式难以跟上需求变化的步伐,在这种情况下,以用户为中心的数据集成方法出现在了大众的视线中。以用户为中心的数据集成方法在对异构数据源进行操作时,一是允许用户不通过编程而是以可视化的方法实现异构数据的集成;二是可以对查询过程进行优化或者缓存查询结果,从而满足用户对异构数据集成结果查询的实时性要求。 本课题重点关注如何通过对中间结果的复用实现数据服务组合运行效率的优化,包括结构化缓存索引和动态缓存点定位技术两部分。本课题的主要工作如下: 1.复合数据服务的树形模型。数据服务为实现跨域数据集成提供了统一的数据模型,数据服务组合将多个基本数据服务通过组合形成具有层次结构的复合数据服务,是实现多源异构数据集成的一种手段。为了能够形象直接地表示复合数据服务的层次结构,使用树形模型对复合数据服务进行描述并给出了其字符串表示形式。 2.复合数据服务中间结果的复用。为了提高数据服务组合的运行效率,对复合数据服务的中间结果进行缓存并在所有的复合数据服务之间共享缓存数据,减少了重复运行的次数;引入了支持精确查询和部分匹配查询的结构化缓存索引,使新建复合数据服务能够快速有效地判断是否存在可复用的缓存数据;设计动态缓存点选择方案,实现了对复合数据服务树形模型的各层次节点的选择性缓存,从而减少了重复缓存和全部缓存的成本。 3.在实际项目背景下进行了实现和应用。基于上述成果,在数据服务组合平台支持环境的基础上设计了实验。实验表明,使用结构化缓存索引和动态缓存点选择技术提高了数据服务对业务用户请求的响应效率,在应对快速多变的需求方面起到了很好的效果。