论文部分内容阅读
蛋白质差异表达分析对于我们认识生物的分子机理以及复杂疾病的发病机制有着重要的作用。随着基于质谱技术的蛋白质组学的不断发展,根据谱图数来分析蛋白质组表达差异的方法在分析复杂蛋白质混合物中的应用越来越广泛。已有的蛋白质组差异表达分析方法主要是通过在单个的蛋白质层面上对其进行逐个分析。但是,蛋白质之间是具有相互作用的,大多数生物学功能都不是仅通过单个蛋白质来实现的。 本课题考虑到了蛋白质间的相互作用,为了提高统计效力与数据的可解释性,针对高通量蛋白质组差异表达统计分析构建了结合生物网络模块信息的负二项分布统计模型,其中生物网络包括代谢通路以及蛋白互作网络的信息。我们首先对此模型进行了计算机模拟,模拟结果显示了该模型能有效地鉴定出差异显著的模块。然后我们利用此模型对一套真实的头颈鳞癌蛋白质组差异表达谱进行了统计分析,鉴定了在疾病与健康条件下蛋白质表达水平发生显著变化的功能模块,并与基于单个蛋白质的统计方法进行了比较,证明了结合生物网络模块信息的统计模型能有效地鉴定出差异表达的蛋白质模块。 结合生物网络模块信息的蛋白质组差异表达统计模型考虑到了蛋白质之间的相互作用,可以有效地鉴定出差异变化不大但变化协调一致的蛋白质模块。该模型在疾病关键蛋白的鉴定中做出了探索,为复杂疾病的发病机制研究以及新药靶点研究提供了信息。