论文部分内容阅读
随着信息技术的飞速发展和企业信息化水平的不断提高,邮政企业内部积累了越来越多的数据。如何充分利用这些大量的数据并发现有价值的信息,为决策者提供重要的决策信息,已经成为研究的热点。数据仓库是存储供查询和决策分析用的集成化信息仓库,它能将分析决策所需要的大量数据从数据源中分离出来,使得分散、不一致的操作数据转换成集成、统一的信息。
通常,数据仓库的数据集成阶段会遇到网络堵塞、网络信息不协调、视图更新不一致等问题。本文通过引入Agent技术,对邮政的数据仓库系统进行了应用研究和实践探索。结合广东邮政储蓄的数据仓库系统对Agent的特性和优势进行了分析和利用,特别是利用它的移动性来解决传统方法无法解决的一些问题,使大量数据和信息检索变得更加方便、完整、快速和灵活。移动Agent可以在异构网络中自主迁移到另外主机上并与其他Agent或资源进行交互,并且具有高效处理大量数据的能力,这使得在实际应用中可以大大减少数据传输过程中的网络流量,更加有效地管理分布异构的集成环境,为开发一个灵活、可伸缩、高效的数据仓库系统提供了更为广阔的前景。
本文的主要研究内容和成果如下:
(1)分析了邮政数据仓库中存在的数据源异构和实时性等问题和要求,提出了一个数据仓库的改进体系结构,在其中增加了监控模块和暂存数据区。
(2)介绍和分析了Agent技术,提出了一个基于Agent的数据仓库体系,增加了两个多Agent系统:集成多Agent和同步更新多Agent。集成多Agent系统主要对数据源中的数据进行监控、转换和集成,并将集成后的数据传回数据仓库进行存储。同步更新多Agent系统负责数据仓库和数据源中的数据保持同步,避免紧急事件影响决策者的决策结果。同时保留基于时间的定期数据更新。
(3)阐述了邮政的数据仓库系统的设计方案,分析了改进数据仓库体系结构中各个模块的功能,并详细介绍了基于Agent的数据仓库模型中两个多Agent系统的结构、功能和流程,最后介绍了集成多Agent系统的形式化实现。为邮政数据仓库的数据集成提供更好的支持。
最后,通过对本系统的分析,指出了系统中的不足和下一步工作中需要改进和提高的地方。