论文部分内容阅读
演化算法是一类统计优化算法,它们是受自然界演化过程特别是演化过程中生物个体对环境表现出的自适应性启发而产生的一类优化技术。最初,演化计算具有三大分支:遗传算法(Genetic Algorithms,简称GA)、演化规划和演化策略。20世纪90年代初,从遗传算法又派生了另一个分支:遗传程序设计(Genetic Programming,简称GP)。2001年,Ferreira提出了一种结合GA和GP优点的新型遗传变异算法,即基因表达式编程算法(Gene Expression Programming,简称GEP)。基因表达式编程算法是一种基于基因型-显型的遗传变异算法。跟遗传算法和遗传程序设计一样,它使用多个个体组成的种群,根据适应值选择个体,由一个或者多个遗传算子带来变异。它们三者的不同点在于:在GAs中,个体是固定长度的线性字符串,即染色体;在GP中,个体是不同大小和形状的非线性实体,即解析树;而在GEP中,个体被编码成固定长度的线性字符串,即基因组和染色体,而且可以被表达成不同大小和形状的非线性实体,例如表达式树。本文对基因表达式编程进行改进,提出了一种基于多显型染色体(Multi-Phenotype Chromosomes)的基因表达式编程算法(简称MPC-GEP),使得单个染色体可以解码为多个表达式树,即包含了多个可能解,从而增加了种群包含最优解的可能性。该算法以函数发现作为实验,相比传统基因表达式编程算法,对于个体数目相同的种群,MPC-GEP能够以较少的迭代次数,即以较少的进化时间获得最优个体。分类规则挖掘是数据挖掘中的一个重要课题,目前,有多种算法应用于分类规则的挖掘,包括基于决策树模型、基于神经网络模型以及基于粗糙集模型等分类算法。本文在Chi Zhou等人对基于GEP分类方法初步研究的基础上,将MPC-GEP算法应用于分类规则挖掘,实验采用美国加利福利亚大学机器学习知识库的标准分类数据集,实验结果与Chi Zhou等人的实验结果相比较,结果表明,MPC-GEP在分类规则挖掘方面有着不错的效果。