论文部分内容阅读
基因芯片技术的发展使得生物学研究重点从对单个基因的研究,转变到在基因组结构和功能的层次来研究生物系统的运行机理。特别是快速获得的高通量基因数据资料为生物学研究提出了挑战,如何在海量的基因数据中探寻特定生物过程中的关键基因及基因功能模块已成为系统生物学的重要研究。本文主要是利用基因表达谱数据建立基因互信息相关网络,在此基础上研究筛选关键基因和确定基因功能模块的最优化模型及相应算法。 本文利用从NCBI数据库的GEO中搜集的基因表达谱数据构建全基因互信息相关网络,以此作为两个基于网络的优化方法的基础。具体研究内容如下: Ⅰ)利用社会选择模型及其算法进行关键基因选取:首先,建立正常组和疾病组样本数据所对应的基因相关网络、并考察各网络中基因在不同结构参数(节点强度、介数和聚类系数)下的差异。其次,针对不同结构参数下基因的排序,建立社会选择理论中的序列聚合模型并讨论相关算法,由此得到基因的聚合排序、并选取关键基因。最后,通过对酵母全基因数据进行数值实验并对结果进行基因注释,验证方法的有效性。 Ⅱ)结合进化博弈理论与最大团算法来研究基因功能模块的确定:进化稳定策略是进化博弈理论中类似纳什均衡的概念,它体现了生物进化过程中的强稳定性。在基因相关网络中,进化稳定策略是关键基因功能模块的一种良好的刻画。基于这一思想,首先将基因相关网络中确定进化稳定策略的问题转化为求解一类推广的最大团问题;建立该问题的二次规划模型和KKT条件,从而得到了求解严格局部最优解、也就是确定基因模块的有效算法。最后,通过对已知肾癌数据进行数值实验和基因注释,验证方法的有效性。