论文部分内容阅读
本文针对民航快递信息系统发展过程中遇到的瓶颈问题,首次提出了数据仓库和数据挖掘的工作思路,并在以下问题:数据仓库的数据建模技术、系统的体系构架、基于分布式的数据仓库应用系统的实现方法、数据的清理、分析、装载和控制体制、OLAP分析、数据挖掘算法、预测模型等进行了比较深入的研究和实现。
笔者独立完成了本论文的工作,并独立完成了分布式数据仓库的构建,首次运用JAVA技术和数据挖掘技术完成了民航快递基于数据仓库的辅助决策支持系统。主要的工作和创新点如下:
(1)对民航快递现有的信息系统进行了详尽的分析,并针对有不同业务特色的18家分公司进行调研,获得大量的基础数据和相关业务信息。
(2)阅读了大量的国内外文献,对数据仓库环境支持下的辅助决策支持系统进行了深入的研究。
(3)根据数据仓库系统建模方法,第一次提出了基于民航快递的数据仓库系统框架结构,并独立完成在民航快递计算机系统中的实现。
(4)根据民航快递的实际需求,第一次在基于民航快递业务范畴的数据仓库系统中建立了主题域,独立完成了相关维度和指标的设计工作。
(5)以民航快递现有数据库为基础,采用基于关系型数据库的ROLAP方法,首次实现了对数据仓库多维数据的访问。
(6)根据民航快递现有分布式OLTP系统的状况,首次将企业内部不同部门伎用信息系统进行整合。并独立完成了将不同数据源、异构的数据存储到数据仓库的设计和实现工作。而且使用已有的商务工具对数据进行了抽取、清洗、转换,而且在此过程中,独立完成了复杂操作和高效率代码的编写工作,圆满的完成了数据的准备任务。
(7)阅读了大量书籍,对当今比较流行的数据挖掘技术和预测分析技术进行了分析和研究,结合民航快递的数据进行了第一次实践,独立完成了实践工作并在实践中取得了一定的效果。
(8)详细的研究了关联规则算法中的Apriori算法和相关的优化算法理论,在此理论基础上结合民航快递的实际数据,首次提出了基于Oracle数据库的改进算法,并在系统中独立完成了实现,提高了运行的效率和执行的速度。
(9)首次在民航快递企业内采用J2EE架构和JAVA技术独立实现了基于分布式数据仓库的辅助决策支持的系统。