生物复杂网络中功能模块的挖掘

来源 :上海交通大学 | 被引量 : 4次 | 上传用户:made5215210
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
网络科学作为一门交叉学科,它的基本理论正渗透到从数理科学到生命科学、工程科学甚至社会科学等众多学科中去。复杂网络的研究引起了世界不同领域科学家的广泛关注。对复杂网络的定性和定量特征的认识和理解是网络时代中一个重要而又具有挑战性的课题。作为复杂网络中一个重要特性,模块结构(或称社团结构)是一个重要而又普遍存在的结构特性。准确挖掘和分析模块结构对理解复杂网络的演化、结构和动态性都有着理论和实践的意义。模块结构作为生物复杂网络中的功能模块组织形式,在生命科学领域中有着重要的意义。人们虽然提出很多有效的算法来分析功能模块,如基于图论的方法,基于随机游走模型和谱聚类方法,但是这些方法在算法层面和生物网络局限性上都存在一定的缺陷。面对这些问题,需要我们有针对性地研究并提出新的功能模块挖掘方法。在本文中,我们主要研究了如何挖掘生物复杂网络中的功能模块,并探索了多样性的功能模块组织形式。首先,针对现有模块分析算法存在的缺陷,提出一种衡量网络中任意两个结点的新相似性ISIM,依据这种新的相似性和层次聚类思想对生物网络中的功能模块进行挖掘,并利用新结点相似性进一步揭示了生物网络中蛋白质复合物的层次性和功能模块的多尺度性。为了避免生物网络不完备性带来的影响,我们通过融合多条件下基因共表达谱数据构建完备的基因共表达网络,进而分析功能模块。接下来,我们突破模块结构是生物复杂网络中功能单元的唯一组织形式这一概念,在生物网络上发现一种新的功能模块组织形式,Bi-sparse功能模块。并相应地提出一种能同时挖掘高聚合和稀疏功能模块的二叉树搜索方法。最后,通过大规模网络的统计分析,深入研究了Bi-sparse模块的一些特性。因此,本文的研究内容和创新点主要包括以下几个方面:(1)为了有效地克服现有功能模块挖掘方法的缺点,我们使用受限的随机游走模型,提出一种新的转移概率矩阵,进而定义一种新的结点相似性ISIM来衡量网络中任意两个结点之间的距离。新的结点相似性有三个良好的特性,一是它能成功地融合网络的全局和局部拓扑信息;二是新结点相似性不仅能有效地衡量两个结点之间的距离,而且能捕捉到两个结点在网络中的拓扑结构;三是它是在一个收敛的空间定义结点相似性,因此,在一系列不完备和含有噪声的生物网络中,具有良好的稳定性和鲁棒性。使用新结点相似性和层次聚类思想,可以有效地分析生物复杂网络中的功能模块。首先,我们使用新结点相似性产生网络的相似性矩阵。然后,使用层次聚类思想建立网络模块的树状结构。最后,选择合理的目标函数自动地挖掘网络中的功能模块。在此基础上,通过改变新结点相似性中的调节因子,本文又提出一种新的方法(isimb方法)揭示生物网络中蛋白质复合物的层次结构和功能模块的多尺度特性。与现有的模块挖掘方法相比,基于新结点相似性的方法是一个无参数的方法,它能自动地确定网络中模块的个数。使用它挖掘到的模块不仅与真实的功能模块结构获得更好的匹配,而且能有效克服生物网络不完备性的缺陷。与单尺度的方法相比,本文创新性地把模块多尺度概念引入到生物网络中蛋白质复合物和功能模块的挖掘,这种新的理念不仅能成功地预测蛋白质复合物及其层次特性,而且能从具体到一般的视角揭示功能模块的动态过程。(2)针对生物网络的不完备特性和基因共表达的不传递性,本文提出一种新的方法检测基因共表达网络中的功能模块。这种方法首先融合不同条件下基因共表达谱数据构建完备的基因共表达网络,随后使用最大团算法挖掘网络中的功能模块。这种新的方法与其它方法相比,预测的结果有较强的生物功能相似性。通过转录和调控关系分析,预测功能模块中的基因有较高的概率被同一个转录因子所调控,从而为构建基因调控网络提供丰富的结果。(3)传统的生物网络中功能模块的挖掘都是基于高聚合的模块结构是功能模块组织的唯一形式。然而,这个结论在生物网络中,特别是在蛋白质相互作用网络中存在可疑性。因此,我们发现一种与高聚合模块不同的bi-sparse模块,然后结合二叉树理论和矩阵论提出一种新的方法(bts方法)来挖掘两种类型的功能模块。bts方法在蛋白质相互作用网络中挖掘的高聚合模块和bi-sparse模块都组成功能单元。与其它的方法相比,bts方法具有良好的性能:一是不需要预先设置模块的个数;二是挖掘的高聚合模块和Bi-sparse模块都具有显著性的生物功能相似性。(4)我们把高聚合模块和Bi-sparse模块作为功能单元的组织形式共存于同一网络中,这一概念进行泛化。我们整理了四种类型共25个网络,用BTS方法对25个网络中的模块进行分析,结果发现:(a)Bi-sparse模块具有普遍性;(b)在社会网络中,Bi-sparse模块中的人们充当着经纪人的角色,负责协调不同群体之间的矛盾,促进信息、技术和知识的交流等作用;在计算机软件网络中,Bi-sparse模块中的结点具有相似的软件包属性;在生物复杂网络中,Bi-sparse模块中的蛋白质或基因具有显著性的功能相似性;(c)复杂网络中的Bi-sparse模块拥有一些特性:一是Bi-sparse模块和高聚合模块相比,Bi-sparse模块含有的结点较少;二是Bi-sparse模块在不同类型的网络中,具有一定的偏好性;最后,存在复杂网络中的Bi-sparse模块有两种明显的拓扑结构。
其他文献
党的十六届五中全会从全面建设小康社会、加快推进社会主义现代化的全局出发,提出了建设社会主义新农村的重大历史任务。新农村建设是一项不但惠及亿万农民、而且关系国家长
接受美学是20世纪60年代兴起于德国的一种文艺美学思潮。本文根据接受美学理论对文本意义的阐释和对读者中心地位的理解,阐述了文学翻译以读者的阅读、创造性阐释为文本意义
在现代民主法治的语境下,人民满意度测评不仅是科学评估检察绩效、改进工作的具体方法,更是公民行使知情权、参与权、表达权和监督权,参与司法、评价司法、监督司法的具体途
<正>党的十八届三中全会通过的《中共中央关于全面深化改革若干重大问题的决定》提出了两项司法管理体制改革任务,一是推动省以下地方法院、检察院人财物统一管理,二是探索建
2017年中国高等教育领域发生了十大事件:掀起学习贯彻党的十九大精神热潮,推进新时代高等教育内涵式发展;"双一流"建设高校及建设学科名单公布,开启高等教育新征程;"新工科"
我国民营医院的发展还处于初级阶段,在政策层面、社会层面和内部管理层面存在不少问题。必须在科学发展观指导下,建立和完善相关政策,进一步开放医疗服务市场,促进和加快民营
从历史的角度来看,设计正不断经历着新的改革浪潮,在每一次的改革中,尽管设计在不断变换着风格,但每一次的改革始终遵循生活中发现问题并解决问题的原则来设计。在最早的时候
《四总穴歌》记载:&#39;头项寻列缺&#39;,言其该句的要旨主要说明位于头项部的病症当取列缺穴治疗。然而,手太阴肺经、手阳明大肠经以及任脉循行皆不上行头项部,依据&#39;经
自上世纪八十年代准晶首次在Al-Mn体系中被发现以来,就成为材料科学研究领域的新宠,受到了材料研究工作者的极大关注。经过几十年的不懈努力,诸多其它体系的准晶继而被一一发
北京市基本医疗保险跨省异地就医直接结算工作已全面启动。笔者所在医院作为首期试点医院,已经接入国家基本医疗保险异地就医结算系统。文章主要针对运行初期存在的问题提出