论文部分内容阅读
近年来,数据挖掘引起了信息产业界的极大关注,主要原因是存在大量数据,可以广泛使用,并且迫切需要将这些数据转换成有用的信息和知识。获取的信息和知识可以用于多种领域,包括商务管理、生产控制、市场分析、工程设计和科学探索等。在过去的30多年中,计算机硬件稳令人吃惊的进步导致了计算机、数据收集设备和存储介质的飞速发展。这些技术大大推动了数据库和相关信息产业的发展,使得大量数据库和信息用于事务管理、信息检索和数据分析。为了从海量数据中获取重要信息、作出重大决策,数据挖掘应运而生。关联规则挖掘作为数据挖掘的一个重要方面,能够发现大量数据中项集之间的相关联系。随着大量数据的收集和存储,许多业界人士对于从他们的数据库中挖掘关联规则越来越感兴趣。目前有多种挖掘关联规则的方法,如Apriori方法以及由此衍生出来的多种方法,频繁模式增长方法(frequent-pattern growth)等等。然而每种方法都有其自身局限性,人们仍在改进已有的关联规则挖掘方法并不断探索新方法。 人工神经网络是在现代科学研究成果的基础上提出的模拟人脑结构和机制的一门新兴科学。它不是人脑真实的全面的描述,而是对这类生物神经网络的抽象、模拟和简化,其目的在于探索人脑的信息加工、存储和搜索机制,为人工智能和信息处理等学科的研究开辟新途径。人工神经网络是采用物理可实现的方法来模拟人脑神经细胞的结构和功能的系统,它模拟了人类神经元活动的原理,具有自学习、联想、对比、推理和概括能力,为很好地解决关联规则挖掘这样一个复杂问题提供了新的途径。近来,Hopfield网络作为神经网络的一种,被尝试用于关联规则挖掘,并取得了一定成果。但是,已有的直接、机械的将Hopfield网络用于关联规则挖掘的方法具有缺陷,这些缺陷主要源于Hopfield网络自身的不足。 遗传算法于1975年由Michgan大学的John Holland首先提出。它是一种自适应的搜索策略,因其操作类似于自然界的优胜劣汰机制而得名。遗传算法因其自适应性、领域知识无关性、并行性等特性,且能较好的处理大规模数据,特别适合于解决多目标优化问题,因而在诸多领域有广泛的应用。作为一个趋势,遗传算法被越来越多的应用于训练神经网络,改进神经网络的拓扑结构和权值。实践中,遗传算法进化BP网络的应用越来越成熟,并已经取得了丰硕的成果。与之相比,遗传算法和Hopfield网络的结合虽然也取得了一些成果,但还有待繁荣。