论文部分内容阅读
蛋白质相互作用(Protein-Protein Interaction,PPI)网络是生命有机体内的所有蛋白质间相互作用组成的网络,利用计算方法在PPI网络中检测功能模块是生物信息学中一项重要的研究课题。随着蛋白质相互作用检测技术的发展,可获取的相互作用数据越来越丰富,所构建的PPI网络也越来越庞大。因此,如何高效、鲁棒地在大规模PPI网络中进行功能模块检测是大数据时代生物信息学研究中一个重要的科学问题。与此同时,随着研究的深入,人们发现真实的PPI网络是随时间和条件不断变化的,这种变化与生命活动的产生和发展密切相关。因此,对动态PPI网络进行功能模块的检测研究同样具有极大的重要性和必要性。本文针对大规模PPI和动态PPI网络的功能模块检测,开展了以下两个方面的研究工作:(1)针对蚁群算法在大规模PPI网络中进行功能模块检测所暴露的时间性能方面的不足,提出了一种基于多粒度描述和蚁群优化的快速求解算法。首先,从粒度计算的角度,给出了一种新的多粒度PPI网络描述模型;然后,基于该模型,设计了融合功能和结构信息的粒度划分方法,粗粒度的蚁群寻优,解的还原与优化3个阶段的求解过程。在前一个工作的基础上,又提出了基于多粒度模型的功能模块检测框架,旨在降低网络的规模,从而使更多的高计算复杂度算法能够高效地应用于大规模PPI网络功能模块检测的任务中。最后,在多个PPI网络数据集上分别对基于多粒度模型的蚁群算法和多粒度功能模块检测框架进行了实验,展示了多粒度模型高效的时间效率和良好的准确性。(2)与静态PPI网络相比,动态PPI网络中的蛋白质相互作用是在同一时刻发生的,通过对动态PPI网络进行聚类分析,可以实时地获取功能模块结构,这对研究功能模块的组成和变化具有重要意义。针对动态PPI网络功能模块检测这一新兴研究领域,本文提出了一个基于时序功能保持特征和蚁群聚类的动态功能模块检测算法。算法首先根据相邻时刻的子网结构,选出在相邻时刻都具有表达活性的种子节点集合。然后以当前时刻的种子集为基础,利用功能模块的保持特征,构建一组与前一时刻模块集合具有功能相似性的初始簇集合。蚁群在初始簇集合的基础上对未聚类蛋白质采用拾起、放下规则,生成最终的功能模块。最后,通过实验验证了使用时序功能保持特征可以提高功能模块预测的准确性,并通过与其他经典方法的对比,验证了算法在精度方面具有较好的性能。