演化算法在分类规则挖掘中的应用

来源 :中国地质大学(武汉) | 被引量 : 0次 | 上传用户:gs086449
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
数据挖掘是从大型数据库的数据中提取人们感兴趣的知识,这些知识是隐含的、事先未知的潜在有用信息。数据挖掘技术经过十多年的发展,已经逐渐建立起系统的挖掘理论和成熟的挖掘技术。形成了以关联规则挖掘、分类规则挖掘、聚类规则挖掘为主要形式的,以数据库技术、统计学、人工智能、可视化技术和信息技术为主要工具的多学科交叉的应用技术。从最初的商业应用逐渐扩展到医疗、金融、生物、电信、军事、体育等诸多领域。数据挖掘成为越来越多的科学家、研究人员、工程应用人员、商人、医生所关注的对象。 分类规则挖掘则是通过对训练样本数据集的学习构造分类规则的过程,是数据挖掘、知识发现的一个重要方面。分类规则挖掘的实质是希望得到高准确性、易于理解的和有趣的分类规则。分类规则作为数据挖掘的一个重要分支,在过去的十多年中引起很多来自不同领域的学者的注意,学者们提出了以信息论为基础的决策树算法、以概率论为基础的贝叶斯分类方法、以神经科学为基础的神经网络方法等等,这些算法基本上都是确定性算法。以自然进化为基础的演化计算技术因为其智能性、并行性、不确定性等诸多特点成为其中一个特殊的分支。 演化计算中最重要的分支是遗传算法。遗传程序设计是遗传算法的一个变体。遗传算法和遗传程序设计两种技术虽然都遵循自然界优胜劣汰的基本原理,但是它们最初在工程应用领域具有不同的功能:遗传算法主要用于函数优化,而遗传程序设计则主要用于建模。近年来演化计算在数据挖掘,特别是分类规则挖掘中的应用研究已经取得了相当大的发展。基因表达式编程是C.Ferreira发明的一种新的遗传算法。基因表达式编程结合了遗传算法和遗传程序设计的优点,并克服了它们的缺点,在数学建模方面取得了非常好的效果。 本文以基因表达式编程和分类规则挖掘作为主要对象,研究基因表达式编程在分类规则挖掘应用中的几个重要问题。 本文在第一章介绍了论文的选题、研究意义和国内外分类规则挖掘和演化算法的研究现状。然后在第二章中简单介绍了数据挖掘和分类规则挖掘的基本概念,给出了目前常用的分类方法、存在的基本问题和解决的方向,并以决策树算法为例进行详细的分析和实现。第三章首先讨论了演化计算的基本概念及分类,然后分别对遗传算法、遗传程序设计和基因表达式程序设计的编码方法、初始群体设定、适应度函数设计及遗传操作算子的设计等问题进行了详细的分析。第四部分是基因表达式程序设计的缺陷及改进,对GEP的编码及解码方法进行了基本介绍,重点研究了GEP存在的局限性,并提出了改进GEP效率的方法,最后用实验验证其有效性。第五部分用GEP挖掘分类规则,先对用GEP进行分类规则挖掘的编码、遗传操作算子等细节问题进行了阐述,再通过实验证明GEP进行分类的优越性。在第六章,总结了论文的主要工作及指出了后续的工作。
其他文献
文件可信性是文件共享系统可用性的重要性能指标之一,抵御污染文件(不可信文件)的传播是保证文件共享系统高可用性的关键,但是对等网络的去中心化特点导致基于对等网络的文件共
随着软件过程技术的不断成熟,软件过程在软件开发中扮演着越来越重要的角色。软件过程已经成为开发高质量软件所必须的活动框架,软件过程的评估、控制和改进对软件产品的质量起
专有名词的自动识别(ProperNounDetection)对自然语言处理领域的“信息提取”,“机器翻泽”,“自动问答系统”,“自动摘要”等系统影响较大。目前存在各类专有名词(简称专名)识
房地产业是国民经济的重要组成部分。改革开放以来,随着我国经济建设的飞速发展和老百姓生活水平的提高,以及国家住房制度的商品化改革,我国房产行业在近些年内呈高速发展趋势。
AJAX是当前Web客户端技术研究的热点,通过Java Script与DHTML提供一种异步编程模型,从而提高网页的交互和响应能力,为用户带来更好的人机体验。JSF是SUN新的Web应用开发框架,提供
当今科学研究呈纵横两方向发展,纵向各学科分支越来越细,越来越深入;横向各学科联系越来越紧密,把某个领域成熟的思想进入到另一领域往往能产生较好的科研成果,模拟生物系统进行科
网络通信技术发展到今天,有着辉煌的成就,它的发展使人们沟通便利,交际自由,是现代化一个重要标志。即时通信软件是人们上网交际的常用工具,使用即时通信工具能够实现与好友即时,快
软件演化是一个程序不断调节以满足新的软件需求的过程,即是对一个已有的软件系统进行不断修改、补充和完善,以适应新的需求和环境变化的过程。软件演化已成为如今软件工程领域
软件演化已成为软件生存周期中最重要的形态之一,进入了软件的各个领域,成为了今天软件工程研究的热点领域。软件演化的过程表现出了明显不同于传统软件过程的特征。因此,有必要
数据分类技术是数据挖掘中一种强有力的分析手段,它旨在生成一个分类函数或分类模型,由该模型把数据库中的数据项映射到某一给定类别中。现有的数据分类算法大体可以划分为两大