论文部分内容阅读
以癌症为主的许多复杂的疾病日益威胁着人类的健康,然而它们内在的致病机理却仍然是当今生物医学所面临的重大问题之一。复杂生物网络通过系统科学的思想,为生命现象的动态过程研究提供了一个整体的视角。复杂网络差异性的研究,重点是对导致两个网络结构和功能发生明显变化的关键模块——核心差异子图(Kernel Differential Sub-graph,KDS)的提取。本文立足于差异性网络比对,以KDS的挖掘为目标,主要关注了两个方面的问题:(1)在生命发展的变化过程中,生物网络的变化不只是体现在原有分子拓扑结构的变化上,还包括某些生物分子的消失以及某些新的生物分子的出现;(2)复杂生物网络的差异性不仅要考虑拓扑的变化,也要考虑分子的生物学意义。本文基于差异性网络比对,提出了一种新的适用于不同节点的网络间KDS提取的方法(Kernel Differential Sub-graph of Networks with Different Nodes)——KDS-DN,并成功应用于非小细胞癌(Non-small Cell Lung Cancer,NSCLC)网络差异性研究中。本文的主要工作及创新内容如下:(一)提出了一种新的KDS提取算法KDS-DN。该算法实现具有一定相似性的网络之间的差异性比对,这些网络的节点数量可以不同,但其中有部分节点相同或者相似。KDS-DN通过相似性比对算法,对节点进行一一匹配。对于相同的节点,通过拓扑变化理论,计算拓扑变化;对于不同的节点,考虑其拓扑变化及节点的生物学意义,并根据差异值挑选核心差异节点。进一步,论文提出了提取KDS的三个原则:子图连通、规模最小化和差异性最大化。根据这三个原则,提取网络间的核心差异模块,并通过统计学方法和基于最短路径的方法来证明算法的有效性。(二)将KDS-DN算法成功应用于NSCLC基因调控网络差异性比对中。NSCLC基因调控网络差异性比对的前期工作主要包括数据的标准化、基因筛选、不同状态网络构建等。基于患癌和正常网络之间的差异性比对,发现了30个最有可能与NSCLC相关的基因,并提取出了相关网络的KDS模块。同时,还挖掘出了两个与PI3K/AKT、MAPK和PRKC等信号通路相关的重要功能模块。GO(Gene Ontology)富集分析和文献挖掘都表明,本文挖掘出的KDS模块和两个功能模块,与NSCLC的致病机理具有极强的关系。此外,本文还将KDS-DN与现有同等方法相比,证明了它的合理性和有效性。当然,KDS-DN同样可以用于其它重大疾病相关基因的预测和功能模块的挖掘。