论文部分内容阅读
群体智能算法是一种新兴的优化计算方法,自20世纪80年代提出以来,引起了众多学科研究者的广泛关注,目前已成为优化技术领域的一个热点研究方向。群体智能算法是基于群体行为对给定的目标进行寻优的启发式搜索算法,其寻优过程体现了随机、并行和分布式的特点。作为群体智能算法中的典型代表,粒子群优化(Particle Swarm Optimization,PSO)算法是由Kennedy和Eberhart在1995年提出的,其基本思想是受他们早期对鸟类群体行为研究结果的启发,并利用了生物学家Frank Heppner的生物群体模型。PSO算法具有计算简单,易于实现、控制参数少等优点,但是却不是一个全局收敛的算法。量子行为粒子群优化(Quantum-behaved Particle Swarm, QPSO)算法是在分析了PSO算法中粒子收敛行为的基础上,从量子力学角度出发,提出的一种全新PSO算法模型,具有控制参数更少,收敛速度快,全局收敛能力强等特点。本文以QPSO算法为核心,首先对算法的基本理论进行了系统的研究,提出了算法的改进方法。随后将QPSO算法应用到基因表达数据聚类分析领域中。基因表达数据聚类分析是生物信息学领域的研究热点和难点,本文将基因表达数据聚类分析问题归结为一个优化问题,提出了基于QPSO的基因表达数据聚类算法,取得了良好的聚类划分效果,为基因表达数据的分析开辟了新的方法与思路。论文具体内容如下:(1)首先对课题的研究背景进行了详细地综述,包括群体智能算法和基因表达数据分析的研究现状,提出了本课题的主要研究内容是QPSO算法及其在基因表达数据聚类分析中的应用。在此基础上论述了本课题的研究目标和意义,随后详细阐述了课题的研究基础,即PSO算法的基本理论,介绍了PSO算法的主要改进方法。(2)对QPSO算法的基本原理进行了介绍,针对QPSO算法存在的粒子早熟问题,提出综合学习QPSO(CLQPSO)算法。在CLQPSO算法中,种群中所有粒子的个体最优位置都被用来更新粒子的局部吸引子,这种新的学习策略保证了种群的多样性,从而防止了粒子的过早收敛。针对CLQPSO算法中的几个关键参数的选取问题进行了详细讨论,通过仿真测试给出了参数的经验设置。为了考察CLQPSO算法的收敛性能和优化求解能力,验证算法的优越性,选择包括CLQPSO算法在内的8个具有代表性的PSO和QPSO算法模型进行了数值仿真测试,测试结果及分析表明,CLQPSO算法对各测试函数具有较好的寻优结果,尤其适用于对多峰函数的优化求解,在保证收敛精度的同时,也具有较快的收敛速度,是一种具有较好收敛性能的全局优化算法。(3)简单介绍了基因表达数据聚类分析问题的相关基本理论,包括基因表达数据集的矩阵表示方式,基因表达数据的预处理,数据向量之间的相似性度量准则,基因表达数据聚类问题的描述以及聚类结果的评价。提出了基于聚类中心编码和基于类标签编码的QPSO基因表达数据聚类算法,并在6个选取的基因表达数据集上进行聚类仿真测试,对仿真测试的结果进行了详细的讨论。(4)对专门适用于求解离散空间优化问题的二进制编码QPSO(Binary QPSO, BQPSO)算法进行了深入研究,将综合学习策略引入到BQPSO中,替代原先BQPSO算法中局部吸引子更新时采用的交叉操作,提出了综合学习BQPSO(CLBQPSO)算法。对CLBQPSO算法的数值仿真测试表明,新的学习策略有效提高了算法的全局收敛性能。将其应用于基因表达数据的聚类分析问题中,提出基于类标签编码的CLBQPSO聚类算法。(5)针对之前提出的聚类算法需要预先确定聚类数目,无法在聚类过程中自适应调整最佳聚类数的问题,提出了两种基于QPSO的动态数据聚类算法。第一种QPSO自动聚类(QPSOAC)算法中,通过特殊的粒子编码方式,在每个粒子中增加一组阈值,作为控制对应聚类中心的开关,在聚类过程中,每个粒子中只有满足激活条件的聚类中心才会被选中进行对数据集的聚类划分。第二种QPSO动态聚类(DCQPSO)算法给定一组聚类中心,通过二进制编码QPSO中的粒子对聚类中心进行选择,再由二进制QPSO的迭代更新确定聚类中心的最优组合,并结合K-means聚类算法得到对数据集的最优聚类划分。在对两种动态聚类算法进行了聚类仿真测试验证算法的有效性之后,将它们应用到了基因表达数据的聚类分析问题中。论文最后对本课题的主要研究工作和所获得的成果进行了总结,并对今后的进一步研究进行了展望。