论文部分内容阅读
生物网络作为一种描述生物分子间相互作用关系的研究模型,在揭示生物体的生长、发育、衰老和疾病等生命系统的基本分子过程和规律中受到越来越多的重视。由于生物系统通常具有保守性,利用网络集中的频繁模式挖掘可以排除生物数据中的各种干扰,挖掘出有生物意义的模式。 由于生物网络具有规模大、维数高、种类多及高噪声等特点,传统的生物网络聚类算法有着很高的时间复杂度。本文从频繁模式的局部拓扑结构特征入手,采取从图集-摘要图-候选图集的逐步迭代求精的策略,开发一种具有简单、高效、可扩展的挖掘算法,并最终开发出了可视化的应用软件。我们构建了20张有关酵母菌基因共表达的网络。我们把这个算法用在酵母菌基因共表达网络上并通过GOEAST工具分析,我们发现我们找到的频繁点集是GO富集的。 衰老从宏观上来说是生物体的器官、组织功能性的衰退,但是从微观上来说,却是由生物体中的基因有选择性的差异表达引起的。我们把我们的算法用在C57BL/6老鼠在不同年龄的海马组织构建的网络数据上。通过GO分析,我们得到的大部分的cluster的富集功能是与衰老有关的。这从某种程度上也说明了我们这个算法在研究衰老基因的差异性表达方面也有一定的实际参考价值。