论文部分内容阅读
随着完成测序的生物数量的迅速增加及更深入广泛的了解了基因功能,生物网络(包括代谢网络、基因调控网络、信号转导网络等)的研究在生物信息学中越来越受重视。这主要是因为人们认识到生物中各成分(基因、蛋白质、代谢物等)的功能都是通过与生物网络中的其他部分的相互作用体现出来,所以,只有在系统水平上对所有成分进行整体分析才能对生物的生理功能有全面的了解。问题是如何利用基因组数据分析基因调控网络和代谢途径。近年来,由于计算机技术的发展,调控网络和代谢途径的建模模型越来越多。随着大量数据的收集,利用一般的模型难以从数据中提取出信息。由于微分方程系统非常强大灵活,有利于描述生物网络中的复杂关系,所以近年来研究者主要以此作为网络模型来分析基因调控网络和代谢途径。微分方程系统的演化过程还处于初级阶段,存在结构与参数有较大误差、建立模型的计算量过大等问题,所以需要一种新的优化策略得到准确的微分方程,这样才能更好的解决系统生物学中的实际问题。本文在充分研究多表达式编程和粒子群优化算法的基础上,提出了一种利用多表达式编程优化微分方程的结构,并使用粒子群优化算法优化方程的系数的混合优化策略,来识别基因调控网络和代谢途径,同时使用一种分裂的思想,大大减少了方程优化过程中的搜索空间,还结合灵活树模型接近微分方程的形式的特点,使用灵活树模型编码微分方程和基于树结构的优化算法进化微分方程的结构,同时对于灵活树模型做了限制和改进,来完成规模较大的基因调控网络的识别。本课题研究的主要内容包括:(1)对基因调控网络和代谢途径的基本理论进行了详细的综述,概述了基因调控网络和代谢途径的概念、发展动态和研究方法,着重介绍了识别基因调控网络的各种模型方法,总结出识别基因调控网络和代谢途径的思路。然后对微分方程模型的概念、应用领域以及解法作了详细的综述。(2)介绍了多表达式编程算法和粒子群优化算法。首先描述了进化计算的基本思想,然后重点介绍了遗传编程的基本理论,和阐述了多表达式编程和粒子群优化算法的思想和实现过程。(3)研究了用多表达式编程优化微分方程的结构,并使用粒子群优化算法优化方程的系数的混合优化策略,在此基础上提出了使用灵活树模型编码微分方程和基于树结构的优化算法进化微分方程的结构的算法,同时对于灵活树模型做了限制和改进。(4)将基于多表达式编程的混合优化策略、灵活树模型、限制性灵活树模型应用于大量的基因调控网络和代谢途径的实例。大量实验结果表明我们的优化混合策略和模型比传统算法更具有效性和高效性。