论文部分内容阅读
随着高通量DNA测序技术的不断发展,得到了大量蕴含潜在生物信息的基因表达数据,如何从这些海量的数据中发掘出具有重大生物意义的信息一直以来就是我们的研究热点,而这对于医学、生物信息学来说具有重要的指导意义。双聚类是一种高效的用于挖掘基因表达数据潜在知识的实用方法,双聚类关键在于找到具有最低均方残差、较高行方差的最大双聚类,可以说是一个典型的多目标优化问题。而jMetal又是一个优秀的元启发式多目标优化算法框架,所以在jMetal框架下进行基因表达数据的双聚类问题研究显然是可行,而且对双聚类研究也具有积极的意义。本论文是在jMetal框架下,探讨基因表达数据的双聚类研究,得到了比较好的实验结果,具体做了以下几个方面的工作:首先,成功地把基因表达数据的双聚类问题研究移植到jMetal框架上,并在jMetal框架实现了代码编写、调试和运行,同时把适应度函数添加到jMetal框架中。然后,利用jMetal框架中的并行的非支配排序遗传算法Ⅱ来解决基因表达数据的双聚类问题。最后,提出一种基于拥挤距离排序的多目标粒子群优化算法优化双聚类的方法,它继承了多目标粒子群优化算法的优点,通过利用拥挤距离解决了多目标粒子群全局寻优能力和Pareto集多样性上的不足问题而得到了一种更好的多目标进化算法。最后通过采用精英策略和个体拥挤距离降序排序做法来进行外部种群的更新和全局最优值的选择,使得算法的性能进一步得到很大的提高。总之,本论文是在充分考虑了各种多目标优化方法的优缺点之后,再充分利用了拥挤距离、非支配排序、精英策略等优点,提出了利用两种不同的元启发式群智能进化算法来解决基因表达数据的双聚类方法。在酵母菌啤酒细胞基因表达集和人类B-细胞两个标准数据集上对两个算法进行了验证,通过大量的实验得到了较好的结果,表明本论文所提出的两个算法可以较好地解决基因表达数据的双聚类问题。