共同进化计算在分类中的应用研究

来源 :华南理工大学 | 被引量 : 0次 | 上传用户:xiaofeiyu520
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
分类是数据挖掘中一个重要内容,它找出描述并区分数据类或概念的模型,以便能够使用模型预测类标记未知的对象类。它主要用于提取重要数据类的模型或预测未来的数据趋势。目前的主要分类方法有判定树归纳分类、贝叶斯分类、神经网络分类、遗传算法分类等等。这些分类方法各有特点,适用于不同的领域,目前尚未发现有一种方法对所有数据都优于其他方法。 进化计算(EC)是一种模拟生物进化过程与机制求解问题的自组织、自适应性人工智能技术。结合了达尔文的自然选择与孟德尔的遗传变异理论,将生物进化中的四种基本形式:繁殖、变异、竞争和选择引入到算法的过程中,指导算法的进行。它已经广泛应用于调度规划、机器学习、图像处理和模式识别、最优控制等领域。它在数据挖掘的分类中也有一些初步应用。 本文将详细阐明什么是进化计算、它的概念以及分析其理论基础,并进一步阐述共同进化计算的主要内容。讨论目前分类的评价标准和主要算法,如ID3、C4.5和EC算法,在此基础上提出一个基于共同进化计算的分类算法(CBCEC),并详细介绍该算法的主要原理和过程。使用WEKA数据挖掘平台在多个公共数据库上对上述的几个算法进行详细的性能比较,得出了结论:CBCEC算法分类准确度高,并且可以得到简洁的可理解性强的规则。同时针对如何挖掘用户兴趣的规则,通过修改CBCEC的适应度评价函数,提出适用于挖掘用户兴趣度较高的规则算法,实验证明了该算法的有效性和适用性。 最后结合某省的车辆交通规费系统,提出一个基于J2EE的数据挖掘体系结构,并应用本文提出的共同进化分类算法(CBCEC),给出了一个实例,得到了理想的结果,进一步验证了具有较好的分类预测能力。
其他文献
  本文以实时CORBA2.0规范为参照,研究了华盛顿大学开发的实时CORBA系统—TAO系统,TAO调度服务的调度策略和调度框架;对实时CORBA2.0规范所提出的可分布线程概念以及基于可分
学位
Internet中的路由协议及路由算法一直是Internet研究的一个重点内容,传统的Internet内部网关协议RIP由于其安全性差、支持网络规模有限、收敛速度慢等缺点终将被OSPF协议取代
现在企业随着时间的推移,企业的信息量在不断的增加,企业信息化就成为了研究的重点。制造执行系统(Manufacturing Execution System,MES),是企业信息化的重要组成部分。而企
互联网的高速发展,促使了网络教育等大批应用领域的产生,随着这些应用的不断深入发展,又对网络体系结构提出了更高的要求,如何保证用户所获得的服务质量成为当前研究的热点。
本文针对信息对抗中人员教学训练的需求,基于因素空间和因素神经网络理论建立了入侵检测教学训练系统模型,并进行了系统设计和验证实验。     研究分析了网络行为和有关
近年来Internet的飞速发展和网格技术的出现和发展,对存储系统在容量、性能、可靠性、分布性以及可扩展性等方面提出了更高的要求,存储领域的研究也相应出现了新的趋势和发展方
本文首先结合代价敏感的学习方法CSL和NB分类方法提出了一种代价敏感的NB分类算法CSNB,该算法以较少的计算开销取得对稀有类问题相对最优的分类结果;其次,采用Boosting技术构造
软件开发的产品质量水平,是一个由来已久的话题。而提高软件企业的产品质量水平,必须改进软件产品的开发过程。该文的主要内容是研究软件过程改进的理论,对广州数园网络有限公司
计算机网络已经得到广泛应用,网络功能不断增强,网络结构日趋复杂,异型机和异构网的互联,使网络的规模更加扩大。如何有效地管理网络,使网络高效、可靠的运行正是网络管理需