论文部分内容阅读
作为进化计算最重要的一个分支,遗传算法在许多领域已经获得大量的研究,但发展到现在仍然存在很多缺陷。遗传算法进化到后期,种群中的个体相似度较高,无法对解空间做进一步的搜寻,导致算法早熟收敛。遗传算法的局部搜索能力较弱,在最优解附近需要花费较长时间才能得到问题的全局最优解。而且,传统遗传算法一般采用二进制编码方式,这种编码方法不能表达丰富的生物遗传信息,在计算模型中无法反映遗传信息对生物体生长、发育的调制作用,尤其是起关键控制作用的DNA编码机制。自从Adleman提出DNA计算理论开始,基于DNA计算的智能系统开始引起研究人员的注意,它能够更好的反映生物体的遗传信息,从而建立功能更强、效率更高的智能计算模型。受此启发,研究者们开始尝试进一步分析和模仿生物遗传信息的调控功能,建立分子水平上的遗传信息模型。基于这种思想,学者们提出了DNA遗传算法。这种算法将遗传算法与DNA计算相结合,在DNA编码方式的基础上对种群中的个体进行遗传操作,从而更好地模拟生物的遗传机理和遗传信息表达机制。DNA遗传算法的结构与一般遗传算法基本上类似,主要区别在于DNA遗传算法采用DNA编码方式,并基于这种编码方式发展众多的生物遗传操作模拟进化过程,得到问题的解。由于DNA遗传算法是建立在遗传算法的框架上,因而继承了传统遗传算法的诸多优点,具有优良的全局搜索性能及隐性并行性等。但与传统遗传算法相比,DNA遗传算法在编码方式上有较大的改进,更适合于表达复杂知识,方法灵活,编码精度高。丰富的编码及译码特性,使得种群可以在变异概率低的情况,仍保持一定水平的多样性。同时由于引入复杂的基因级的操作,可以发展更多更有效的遗传操作算子,如倒位、分离、异位等,进一步丰富遗传操作。本文在前期大量工作的基础上,对DNA遗传算法及应用开展了更进一步的研究,主要研究工作如下:(1)提出了一种新颖的三联核苷酸编码的DNA遗传算法-GA-TNE+DRO。依据生物进化机制,通过模拟DNA在氨基酸水平上的繁殖过程来模拟DNA分子的遗传操作,在解空间中创建新的个体。新的DNA编码方案采用三联核苷酸编码(triplet nucleotide encoding,TNE)和DNA繁殖算子(DNA reproduction operator,DRO)提高收敛速度。使用八个无约束优化函数作为实验测试函数来评估该算法的性能。与对比算法相比,新算法能够在迭代次数较少的情况下更接近于全局最优解。新的算法应用到铁路物资应急调度的路径优化问题,取得较好的效果。(2)将DNA遗传算法融合到膜结构当中,提出一种受生物膜结构启发的DNA遗传算法(m DNA-GA)。所用膜结构由皮肤膜、两个中间膜以及基本膜组成。中间膜主要用于进行局部搜索,皮肤膜用于全局搜索。m DNA-GA算法从基本膜开始运行,运行结果在中间膜中进行输出。最终,将最佳的解决方案输出到皮肤膜中。通过分层膜结构中的多个膜相互协同作用,改善了DNA-GA搜索性能。将m DNA-GA算法分别应用于七个典型的优化测试函数,实验结果证明了所提算法的有效性。m DNA-GA算法应用到铁路物资应急调度的时间优化问题,取得较好的效果。(3)受云模型启发,建立一个基于云模型的DNA遗传算法(CM-DNAGA)来求解数值优化问题。本研究采用DNA编码方案对遗传算法中的染色体进行编码,利用云模型保持良好的不确定性转换能力,增强函数逼近能力。基于云模型的随机和稳定的特点,结合遗传交叉和变异,由Y条件云算子执行交叉操作,由基本运算执行变异操作,巧妙地完成进化过程。同时,为了实现种群进化,正态云发生器更新个体,实现了遗传云算子。将CM-DNAGA算法应用于典型的优化测试函数,实验结果证明了所提算法的有效性。(4)提出一种求解多目标优化问题的双链DNA遗传算法。为了得出最优解并提高解的多样性,该算法采用了双链DNA编码方式、一组新的遗传操作和两种新的非支配解排序。该编码方案和遗传操作模拟了生物DNA的结构和行为,并且在保存精英个体和保持解的多元化之间取得了一个较好的权衡点。为了保持解集的多样性,采用了两个新的排序标准:可变拥挤距离和非支配密度排序。这些排序标准能够改善拥挤距离和非支配排序的计算,有效地识别Pareto前沿以及横向前沿的多元解。实验结果表明,改进的DNA多目标遗传算法在IGD、ES、MS、收敛速度和求解精度上优于其它对比算法。(5)提出一种基于DNA遗传算法优化的改进谱聚类方法(ISC-DNAGA)。该方法采用基于中心点的编码机制,种群中的每个个体代表一个中心点集合,向量的维度为k?dim(其中k表示聚类的数目,dim表示数据点的维度)。在进化聚类中,谱图的中心点通过DNA遗传算法的DNA链进行编码。为满足遗传算法的需要,本文使用k近邻图方法构建初始种群,以矩阵的形式存储,使用通用聚类标准作为DNA遗传算法的适应度函数。与其他聚类算法对比,ISC-DNAGA在给出的评价标准上取得较好的效果。(6)提出一种基于DNA遗传算法优化数据场和高斯方法的自动密度峰聚类算法(简称ADPC-DNAGA)。ADPC-DNAGA可以用数据场的势熵去确定阈值的最优值并使用高斯方法自动确定聚类中心。通过数据场和势商,阈值的确定就成为一个最优值求解问题,然后利用DNA遗传算法求解,最后利用高斯分布获得拐点,从而确定聚类数目。将聚类结果与DPC算法和其他几种著名的聚类算法进行了比较,比如AP算法,DBSCAN算法和谱聚类。实验结果表明,ADPC-DNAGA可以找到截断距离dc的最优值,而且不管数据集形态如何,都能自动识别聚类,效果优于其他聚类算法。(7)提出一种基于DNA遗传算法优化的核直觉模糊C均值聚类(KIFCM)的MRI分割方法(KIFCM-DNAGA)。该方法将模糊聚类建模为直觉模糊集,能够控制像素的局部噪声,并利用核的技巧以提高性能,最后形成含有待优化参数的目标函数。提出一种DNA遗传算法来优化KIFCM聚类,使用DNA编码待优化参数和一组改进的DNA遗传算子,以便通过解空间搜索最优解。当算法搜索到最优参数时,就可以获得最优的基于IFS的模糊聚类。通过使用一组UCI数据集,一组人工MRI数据和一组临床MRI数据集比较KIFCMDNAGA与六个已有的模糊聚类算法进行实证研究。结果表明,KIFCM-DNAGA在聚类度量和计算效率方面优于对比算法。(8)提出一种用于搜索核支持向量机最优参数的新型DNA遗传算法(简称KSVMDNAGA)。采用DNA编码方式对支持向量机的关键参数进行编码求解,优化后的SVM模型能够加速支持向量机的收敛速度,提高支持向量机的分类性能,将研究成果应用于磁共振成像(MRI)的分类问题。使用离散小波变换(DWT)从MR脑图像中提取小波系数,然后采用径向基函数(RBF)核的DNA-GA优化支持向量机(称为KSVM-DNAGA)作为分类器。为证明KSVM-DNAGA算法的有效性,首先采用4个UCI数据集进行实验验证,然后从哈佛医学院网站下载90副脑图像数据进行分类验证。通过与其它几个常用的分类方法进行比较,实验结果证明了KSVM-DNAGA的优越性。