Web信息集成系统及查询优化方法研究

来源 :合肥工业大学 | 被引量 : 0次 | 上传用户:handan0918
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
Web信息集成系统是为Web数据管理提供了一种全新的方法。它提供了一个访问Web上多个数据源的、统一的和透明的访问界面,其主要目标是支持对Web上的多个数据源的查询,满足用户的查询需求,本文对Web信息集成系统的研究现状和发展趋势进行了深入的分析和探讨,围绕其中的几个关键技术,如构建面向XML的公共数据模型,根据数据源的查询处理能力生成有效的查询执行规划,智能协作信息系统中的协作与学习以及基于Agent的查询优化技术等几个方面进行了研究,本文的主要研究成果如下: (1)本章首先综合分析了Web信息集成系统的研究现状和发展趋势,对信息集成的两种方法:物化方法和虚拟方法以及多数据库集成系统和Mediator/Wrapper集成系统做了分析和比较,此外针对Web信息集成系统查询处理过程的特点设计了一个查询优化器,该优化器具有支持系统进行动态查询优化的能力,可以有效提高系统的查询处理性能。 (2)提出了一种面向XML的公共数据模型XCDM,该模型针对已有的半结构化数据源模型(OEM和OIM)在表达XML文档时存在的缺陷,将OIM的有向图结构与XML语言的相关特性相结合,并补充了OIM对象代数的六种代数操作。XCDM充分考虑了XML语法表达的灵活性,可以为用户提供多级视图,不仅可以表示Web上大量由XML表示的半结构化数据,还可以实现与其他数据模型之间的映射。XCDM可以起到某种元数据的作用,统一描述半结构和无结构数据,它符合公共数据模型的几点准则,完全适合作为Web信息集成系统中的公共数据模型。 (3)提出一种基于遗传算法的多数据源连接查询优化问题的方法以及与此相适应编码方法、交叉算子和变异算子。该算法适用于集成系统中具有约束模式的数据源。我们将遗传算法与数据源的约束模式有效地结合起来,将查询优化分成两个阶段进行,第一阶段利用数据源的查询处理能力划分搜索空间,第二阶段利用第一阶段的结果作为启发式信息,采用遗传算法寻找最优解或次优解。该方法不仅可用于左深度树搜索空间,同样适用于混合搜索空间。同时还引入了Neighbor结构以解决传统遗传算法局部收敛速度慢的缺点,有效的缩短了计算时间,提高了系统的查询效率。 (4)提出一种新的多Agent协作模型MACM及一种改进的分布式强化学习算法。在Web信息集成系统向智能协作信息系统发展的同时,对系统中多个组成部分(Agent)之间如何进行有效协作的研究也得到了越来越多的重视,理论分析表明,如果在智能协作信息系统中引入学习机制,使得每个Agent通过学习协调自身的行为,则能有效的完成共同目标。本章研究基于强化学习的多Agent系统协作机制,提出一种新的协作模型MACM,该模型通过提供灵活 摘 要协调机制支持多Agent之间的协作及协作过程中的学习,并针对MACM模型提出了一种改进的分布式强化学习算法。该算法不仅保留了分布式强化学习算法的优点,即减少了联合Q值表的存储空间,降低学习对系统资源的要求,同时还能确保以较快的速度收敛到最优解。 (5)提出了一种基于Agent的查询优化系统模型,在该系统中,Agent采用了典型的慎思型体系结构,即BDI模型。Agent具有信念库,目标库并在此基础上进行学习和推理,以支持信息集成系统的动态查询优化和规划的执行,提高系统的查询效率。在基于Agent的查询优化系统模型中,利用Agent的学习能力可以根据数据源的负载变化来动态选择参与查询的数据源,详细探讨了一种基于强化学习的数据源选择优化算法,并指出了其不足之处以及未来的研究方向。
其他文献
目的:探讨中西医结合治疗霉菌性阴道炎的疗效。方法选取2010年1月至2012年3月于我院进行治疗的90例霉菌性阴道炎患者为研究对象,将其随机分为治疗组45例和对照组45例,治疗组采用
礼尚往来本是一种传统美德,然而在现实生活中,总是会有些“好面子”的人,在“面子”心理的助长下将“礼尚往来”发展成为“礼上往来”,形成铺张浪费和变相行贿,使礼尚往来变了质,变
基于虚拟驾驶员的仿真分析方法,研究了在三种直升机下滑-着舰进近轨迹下,无舰尾流场、定常和非定常尾流对飞行姿态和操纵量变化情况的影响,并模拟驾驶员在非定常尾流场中的工
态度是一种心理现象,也是一种独立的开放体系。我国的教育一直在改革,教育模式一直都在探索中。高中语文课程比初中小学的文化情志都要深厚,高中学习内容更加侧重情感的认知,
红军时期 严守秘密,服从纪律,牺牲个人,阶级斗争,努力革命,永不叛党。
网格被称为是下一代的Internet,而语义WEB则代表了WEB的将来。作为两者的结合,语义网格的目标是提供大规模和柔性可扩充的人机协同工作环境,进行与资源共享相关的信息和知识处理
互连网络结构的设计是实现高性能并行计算机的重要问题之一。互连网络拓扑结构的选择决定了最终系统的许多重要特性,例如性能,易编程性,可靠性,可扩展性和物理布局实现的复杂性等
5G以其超大带宽、超高速率、超低时延的性能成为工业互联网腾飞的助推器。工业互联网是连接人、数据、机器的网络,是推动工业智能化发展的基础。5G具有宽带传输速度大、低延
近几十年来,复合材料由于其重量轻和耐高温等优点,被广泛应用于直升机设计中,这对直升机的电磁屏蔽性能也提出了挑战。目前对直升机蒙皮屏蔽性能的研究很少考虑蒙皮材料的实