免疫遗传算法在分类中的研究及应用

来源 :华南理工大学 | 被引量 : 0次 | 上传用户:liguiming321
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
人工免疫系统作为计算智能研究的一个崭新分支,已在数据挖掘、机器学习、自动控制、故障诊断等诸多领域显示出强大的信息处理和问题求解能力以及广阔的研究前景。将人工免疫算法与遗传算法相结合后而形成的免疫遗传算法的研究和应用已经成为人工免疫系统研究领域中极为重要且最活跃的研究方向,免疫遗传算法在多方面都表现出比遗传算法更为优越的性能。 分类分析作为数据挖掘中一个重要任务,长期以来都是数据挖掘研究领域中一个较活跃的研究方向。大量的研究者都致力于通过各种方法构造高准确率的、高用户兴趣度的分类器。 本文阐述了人工免疫系统及数据挖掘的研究发展现状,自然免疫系统和人工免疫系统的基本原理和研究内容,详细阐明了免疫算法的理论基础、基本算子、算法流程及算法性能。在简要阐述遗传算法的基础上,通过分析遗传算法的不足,详细阐述了免疫遗传算法的基础理论、算法流程、基本算子和特点。在这些理论基础之上,结合数据挖掘分类分析的任务,本文提出了一种基于免疫遗传算法的分类算法(CBIGA)。本文详细研究了该算法的主要原理、基础理论及流程;研究分析了该分类算法的抗原抗体编码策略、初始规则集的产生方法、规则记忆池的产生及更新方法、规则浓度和适应度的计算方法、规则的抑制与促进、交叉和变异等算子,及其对分类结果的影响;并采用数学方法严格证明了该分类算法的收敛性,分析了算法的计算复杂度。本文在Weka数据挖掘平台上利用Java语言实现了CBIGA算法,并采用多个UCI数据集使用本文所介绍的分类评价标准对ID3、C4.5、遗传算法分类器和CBIGA的分类结果进行比较,得出结论:CBIGA算法分类准确率高,鲁棒性强,在高噪声数据情况下仍然有较高的分类准确率。并且还通过实验对参数亲和系数对CBIGA分类结果的影响进行了探讨,得出结论:亲和系数对实验结果存在一定的影响,但结果反映的情况与CBIGA算法理论的分析相吻合。 最后结合某省的公路养路费征管系统,提出一个基于J2EE的数据挖掘体系结构,并应用本文提出的CBIGA算法,给出了一个实例,得到了理想的结果,进一步验证了CBIGA较好的分类预测能力。
其他文献
随着国土资源部“十一五”规划的制定和开始实施,“加大对政务公开执行情况督查力度,大力推进政务信息网上公开”已成为各级国土资源管理部门“十一五”期间重点工作之一。实施