论文部分内容阅读
随着人类微生物组计划的迅速发展与应用,如何从这些海量的微生物数据中挖掘出有价值的信息,已经成为生物信息学领域中一个重要的研究热点。通过已知的疾病相互作用关系网络和微生物相似性网络,找出与疾病相关的微生物将有助于帮助人类在健康监测、新药研制、个性化对患者进行用药、以及疾病诊疗等方面取得有效性的进展。本文通过马尔科夫聚类算法形成“微生物社团”,再结合疾病数据构建异构微生物社交网络,利用异构网络随机游走方法以及相关性排名对与疾病相关的微生物进行预测,主要的研究工作和创新如下:第一,基于微生物社交网络的微生物-疾病关联预测。本文通过分析微生物网络拓扑特性,发现微生物之间的相互作用也存在类似于社交网络中的“社交特性”。因此采用SparCC计算相关性构建微生物社交网络,通过马尔科夫聚类算法挖掘微生物社区或微生物网络模块,对潜在的微生物-疾病关联进行预测。再对聚类形成的“微生物社区”进行了分析,列举了呼吸道、肠道、皮肤处的三种常见的疾病:哮喘、结肠癌、过敏性皮肤炎,根据相关性排名预测潜在的微生物-疾病关联,相关医学文献验证了本文所预测的疾病相关微生物的有效性。第二,基于异构网络随机游走的微生物-疾病关联预测。单一的微生物社交网络对疾病微生物关联预测存在一定的局限性,而且不同微生物医学数据之间存在着复杂的关联性,充分利用微生物与疾病数据间的联系可以更准确地对疾病微生物进行预测。本文通过将已知微生物-疾病关联数据进行整合,构建微生物社交网络-疾病异构网络,采用随机游走方法(RWRH)预测疾病微生物,对已有的微生物-疾病关联数据进行留一交叉验证、参数分析和ROC曲线分析,与在单层的微生物社交网络上的随机游走(RWR)进行对比分析。对二型糖尿病、哮喘、牛皮癣三种疾病的致病微生物预测结果表明:基于异构微生物社交网络的疾病微生物预测更为准确有效。