论文部分内容阅读
[目的]
发展基于先验知识挖掘冠心病风险功能模块的网络分析方法,为研究冠心病发生发展的分子机制和寻找风险基因提供研究方向。
[方法]
1.根据复杂疾病的生物学机制以及结合蛋白互作的本质,从已报道的疾病风险基因出发,整合PPI知识实现疾病风险基因网络的构建和扩展。
2.利用基于图论的Newman谱算法分解网络获取紧密联系的模块。
3.计算模块的拓扑学指标(直径,特征路径长度,连通度,聚类系数),检验网络重要的拓扑结构(小世界性,无标度性,等级性)。
4.利用泊松分布计算模块的核心基因,并通过基因与疾病数据库验证其与冠心病的关系。
5.对各模块进行GO节点和KEGG通路的功能富集分析。
[结果]
1.应用266个冠心病相关基因作为初始基因,由蛋白-蛋白互作知识引导构建了一个包含1838个基因和9777个互作对子冠心病特异性基因网络。
2.利用Newman谱算法分解得到14个功能模块,所有模块都具有小世界性,12个模块具有无标度性,4个模块具有等级性。
3.通过计算共得到114个核心基因共,其中23%是初始基因,17%的基因已有文献支持和冠心病相关,32%的基因报道和心血管疾病相关,剩下的基因有文献支持与冠心病的危险因素如高血压、2型糖尿病和肥胖等相关。
4.富集的部分GO节点和KEGG通路与已有文献支持的冠心病发病机制一致如炎症反应,免疫反应,血管平滑肌细胞增殖,血小板凝集等;富集到的其它功能可能是冠心病的潜在发病机制,如雄激素受体信号通路,神经肽激素激活,YY肽受体激活,NOD样受体信号通路,RIG-Ⅰ样受体信号通路等。
[结论]
本文提出了一种不依赖于实验数据构建复杂疾病风险基因网络及风险功能模块识别的有效方法。该方法不仅计算简易,而且弥补了现有方法的一些不足,使结果更具生物学合理性。下游功能学分析和文献挖掘表明本研究的结果得到前人研究成果的支持,此外还找到一些新的可能参与冠心病发病机制的生物学功能,为进一步揭示冠心病的潜在致病机制提供了理论依据。