论文部分内容阅读
随着当今时代信息的爆炸性增长,数据的丰富带来了对强有力的数据分析工具的需求。事实上,重要的决定常常不是基于数据库中信息丰富的数据,而是基于决策者的直觉,而决策者缺乏从海量数据中提取有价值知识的工具。数据挖掘工具可以进行数据分析,发现重要的模式,对商务决策,知识库,科学和医学研究做出重大贡献。数据和信息之间的鸿沟要求系统开发数据挖掘工具,将数据坟墓转换成知识“金矿”。 零售业作为数据挖掘的主要应用领域,积累了大量的销售数据,顾客购买历史记录,货物进出,消费与服务记录等。其数据量在不断的迅速膨胀,特别是由于日益增长的Web或电子商务上的商业方式的方便和流行。这种发展趋势更体现了对一个强有力的数据挖掘工具的需求。 本文的目的是实现一个基于关联规则数据挖掘可视化系统。系统提供了一个友好的集成化可视界面,以指导用户交互的完成关联规则数据挖掘任务。系统将数据挖掘过程分成数据源选择、数据预处理、数据分析、挖掘算法、模式表达几个部分。在进行数据挖掘的过程中用户可以分别与之交互,体现了系统的灵活性以及提高了数据挖掘的质量。系统充分利用了数据库管理系统(SQL Server2000)的部分工具如查询分析、数据转换等功能进行数据预处理工作,实现了系统与关系数据库系统的一定程度的耦合。系统前端采用Visual Basic提供一个可视的交互界面,通过调用执行存储过程、DTS包和ADO数据访问等方式屏蔽后台复杂的数据处理过程,为用户提供了一个友好的可视数据挖掘任务的交互环境。系统以一个网络交易数据库为例,说明了本文实现的数据挖掘系统的可行性,有用性及有效性,并将可视化技术融入其中,在数据分析以及知识的可视化表达方面做出了一定的有意义的研究。数据挖掘工具中要实现的一个很重要的功能就是对交易数据库中的商品进行分析,发现顾客购买商品之间的关联性。并将这种关联性以表格的形式直观、简洁的展现在用户面前,以帮助分析决策,为零售业带来效益。