论文部分内容阅读
利用整合分析方法挖掘人类致病基因在生物信息学和疾病病理学研究中变的越来越重要。现今,蛋白质互作网络通常被用来建立基因与疾病之间的关联,进而挖掘预测复杂疾病的候补基因。本文基于复杂疾病致病基因在蛋白质互作网络中的拓扑特征,利用SVM筛选并获得最佳的组合特征,从而对候补疾病基因进行预测,并通过利用已知疾病基因与候补疾病基因挖掘与小窝蛋白相关的疾病致病通路。
通过研究分析发现,疾病基因与非疾病基因在网络中度、聚类系数,已知致病基因邻居个数等拓扑性质中存在着显著差异。利用本文的方法对冠心病疾病基因进行了预测,成功的预测出了224个疾病基因,其中有209个基因与已知的CAD疾病基因具有相同的GO功能注释,54%的基因与均与其他2种方法预测的结果均一致。通过对挖掘得到的候补疾病基因进行G0功能富集分析及通路注释,发现本研究预测得到的候补疾病基因很好的富集在已知致病基因所富集的GO功能上,并且较多的预测基因分布在与冠心病的形成相关的Cytokine—cytokineinteraction,Hematopoietic cell lineage,Focal adhesion等代谢通路上。
比较疾病基因以及小窝蛋白相关模块富集的BioCarta信号转导通路发现,小窝蛋白在心血管疾病的形成和发展中起着重要的作用。小窝蛋白参与了与心血管疾病相关的重要通路,并在通路间传到及交流中起着枢纽的作用。研究发现与小窝蛋白相关的Adhesion Molecules on Lymphocyte、Angiotensin—convertingenzyme 2 regulates heart function、Bioactive Peptide Induced SignalingPathway、Cytokine Network、EGF Signaling Pathway、Fibrinolysis Pathway等信号转导通路参与了疾病发生及发展的重要过程。
本文提出的方法不仅考虑了导致相同或相似的疾病表型的基因间的功能相似性,而且还考虑了导致相似表型的疾病基因在网络中的拓扑特征。通过对CAD候补疾病基因的成功预测,证实本文中提出的方法能很好将基因与疾病之间建立联系,对疾病基因与非疾病基因进行区分,从而可以被用来研究预测复杂疾病候补的疾病基因。同时,本文研究发现了与小窝蛋白相关的冠心病致病通路,为疾病的发病机理研究提供指导意义。