论文部分内容阅读
数据挖掘作为一个新兴的多学科交叉应用领域,正在各行各业的决策支持活动中扮演着越来越重要的角色。随着当前IT技术、电子商务及互联网的快速发展和迅速普及,导致在各个应用领域的数据库中存储了大量的数据,这些数据集中包含了很多有用的知识,如何发现各种大型数据库中所隐藏的、预先未知的信息以辅助相应的应用显得尤为重要,这正是数据挖掘所要完成的任务。近十几年来,数据挖掘技术有了长足的进步。数据挖掘已经成为数据库研究、开发、和应用活跃的分支之一,从大量的、不完全的、有噪声的、模糊的、随机的数据中,提取隐含在其中的、人们事先不知道的、但又是潜在有用的信息和知识的过程,正是数据挖掘分析大规模数据集的有效方法。关联规则挖掘是数据挖掘中成果颇丰而且比较活跃的研究分支,关联规则挖掘是发现大量数据库中项集之间的关联关系。随着大量数据的增加和存储,人们对于从数据库中挖掘关联规则越来越感兴趣。从大量事务中发现有趣的关联关系,可以帮助许多决策的制定。目前,关联规则挖掘已经成为数据挖掘领域中的重要研究方向。本文将用遗传算法研究解决数据挖掘中的关联规则提取问题。首先在提出关联规则基本概念的基础上,对传统的关联规则进行了改进;并结合数据挖掘中的一个重要算法——遗传算法,提出了一种基于遗传算法的关联规则挖掘算法模型,并结合具体的实例给出了基于遗传算法的关联规则的提取算法。同时选择目前引用率较高的Apriori算法以及基于约束的关联规则挖掘算法和本算法进行了对比实验,结果表明本算法执行时间整体上优于其他两种算法。说明本文所设计的算法在挖掘效率和对大型数据库挖掘的可用性方面具有潜在的应用前景。