论文部分内容阅读
Web信息集成系统是为Web数据管理提供了一种全新的方法。它提供了一个访问Web上多个数据源的、统一的和透明的访问界面,其主要目标是支持对Web上的多个数据源的查询,满足用户的查询需求,本文对Web信息集成系统的研究现状和发展趋势进行了深入的分析和探讨,围绕其中的几个关键技术,如构建面向XML的公共数据模型,根据数据源的查询处理能力生成有效的查询执行规划,智能协作信息系统中的协作与学习以及基于Agent的查询优化技术等几个方面进行了研究,本文的主要研究成果如下: (1)本章首先综合分析了Web信息集成系统的研究现状和发展趋势,对信息集成的两种方法:物化方法和虚拟方法以及多数据库集成系统和Mediator/Wrapper集成系统做了分析和比较,此外针对Web信息集成系统查询处理过程的特点设计了一个查询优化器,该优化器具有支持系统进行动态查询优化的能力,可以有效提高系统的查询处理性能。 (2)提出了一种面向XML的公共数据模型XCDM,该模型针对已有的半结构化数据源模型(OEM和OIM)在表达XML文档时存在的缺陷,将OIM的有向图结构与XML语言的相关特性相结合,并补充了OIM对象代数的六种代数操作。XCDM充分考虑了XML语法表达的灵活性,可以为用户提供多级视图,不仅可以表示Web上大量由XML表示的半结构化数据,还可以实现与其他数据模型之间的映射。XCDM可以起到某种元数据的作用,统一描述半结构和无结构数据,它符合公共数据模型的几点准则,完全适合作为Web信息集成系统中的公共数据模型。 (3)提出一种基于遗传算法的多数据源连接查询优化问题的方法以及与此相适应编码方法、交叉算子和变异算子。该算法适用于集成系统中具有约束模式的数据源。我们将遗传算法与数据源的约束模式有效地结合起来,将查询优化分成两个阶段进行,第一阶段利用数据源的查询处理能力划分搜索空间,第二阶段利用第一阶段的结果作为启发式信息,采用遗传算法寻找最优解或次优解。该方法不仅可用于左深度树搜索空间,同样适用于混合搜索空间。同时还引入了Neighbor结构以解决传统遗传算法局部收敛速度慢的缺点,有效的缩短了计算时间,提高了系统的查询效率。 (4)提出一种新的多Agent协作模型MACM及一种改进的分布式强化学习算法。在Web信息集成系统向智能协作信息系统发展的同时,对系统中多个组成部分(Agent)之间如何进行有效协作的研究也得到了越来越多的重视,理论分析表明,如果在智能协作信息系统中引入学习机制,使得每个Agent通过学习协调自身的行为,则能有效的完成共同目标。本章研究基于强化学习的多Agent系统协作机制,提出一种新的协作模型MACM,该模型通过提供灵活 摘 要协调机制支持多Agent之间的协作及协作过程中的学习,并针对MACM模型提出了一种改进的分布式强化学习算法。该算法不仅保留了分布式强化学习算法的优点,即减少了联合Q值表的存储空间,降低学习对系统资源的要求,同时还能确保以较快的速度收敛到最优解。 (5)提出了一种基于Agent的查询优化系统模型,在该系统中,Agent采用了典型的慎思型体系结构,即BDI模型。Agent具有信念库,目标库并在此基础上进行学习和推理,以支持信息集成系统的动态查询优化和规划的执行,提高系统的查询效率。在基于Agent的查询优化系统模型中,利用Agent的学习能力可以根据数据源的负载变化来动态选择参与查询的数据源,详细探讨了一种基于强化学习的数据源选择优化算法,并指出了其不足之处以及未来的研究方向。