论文部分内容阅读
随着高通量代谢组学技术例如气相色谱质谱联用技术,我们能够同时获得成百上千的代谢子。当前,如何基于这些高通量的数据来系统地揭示生物学通路以及一些关键的细胞机制在疾病发生和发展中的作用是一个重大的挑战。代谢子的通路识别是解决这一问题的有效策略。然而,目前提出的大部分方法都没有考虑代谢组学实验技术的特点以及代谢子间的功能联系。因此,一个新的代谢子的通路识别方法是迫切需要的。在本研究中我们提出了一种基于网络的代谢子通路识别方法(MPINet),此方法整合了全局的代谢子功能关系网络结构以及代谢谱数据的特点。通过这种整合的策略,本文中的方法同时考虑了通路中代谢子的全局不均等性以及代谢组学实验技术的特点。因此,MPINet能够准确地识别出和疾病相关的通路。通过进一步的分析证实,全局的代谢子网络结构信息和代谢谱的特点对于有效的识别通路起着重要作用。我们将MPINet应用到四套数据集中,包括前列腺癌转移数据集,两套二型糖尿病数据集以及药物敏感性数据集。在前列腺癌的转移数据集中,MPINet识别出22个显著相关的通路,其中多达14个通路有文献证实和癌症相关。此外,在该套数据集中通过将MPINet与当前方法的比较证实其有效性。二型糖尿病数据集的分析结果显示,MPINet具有识别新的疾病潜在相关通路的能力以及其方法的可复现性。最后,我们将MPINet扩展应用到了药物敏感性数据集中,MPINet识别出了铂类药物一致性的敏感性相关通路。此外,通过对121个药物的敏感性相关通路分析显示,对于具有相同作用机制的药物其敏感性通路倾向于是同一类通路。