论文部分内容阅读
本文结合盛鸿软件(大连)有限公司开发的货运代理管理系统在实际应用中的情况,研究了利用先进的数据库中的知识发现技术来挖掘隐藏在数据背后的、不为人们所知的信息的过程。 论文共分五章,第一章介绍课题的来源、国内外发现现状。第二章介绍货代管理系统,并详细描述海运货代管理的主体流程,明确决策子系统在该系统中的位置,通过详细讲解决策子系统的数据流、控制流和各功能模块的作用,使读者对知识发现有一个概要性的了解。第三章介绍人工智能领域的知识发现技术,从概念、内容、本质及其核心内容等多方面剖析知识发现技术,并介绍美国SAS软件研究所研究知识发现的方法论——SEMMA。第四章是论文的主体,着重介绍知识发现的全过程,按照SEMMA方法论首先进行数据准备,然后进入数据挖掘阶段,提出知识发现的概念体系和公认的Apriori算法,从该算法演变出适合于货代管理系统的生成频繁项目集的算法;因为在实际应用中存在效率上的不足,因此进一步地提出了改进方案;在事务处理中各个项目并不都是布尔型变量,因此需要特定的针对多值属性的关联规则发现算法;通常情况下,项目之间存在有层次关系,因此多层次关联规则的发现普遍存在;算法完善并运行后需要对发现的知识进行解释和评估;本章的最后讨论了知识发现的私有性和安全性问题;第五章讲述有待解决的问题和发展前景。 实践证明,这些算法能很好地完成知识发现任务,为货代管理部门创造经济效益和社会效益。