蛋白质交互模块若干识别算法研究

来源 :吉林大学 | 被引量 : 0次 | 上传用户:yufan123456789
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
后基因时代,生物医学的研究焦点已经逐渐从分子生物学转移到系统生物学,其目标之一是对细胞中的分子和它们之间的相互作用进行系统地分析与研究。细胞中的分子和它们之间的相互作用产生了大多数的生物功能。研究人员要明确这些分子和它们之间的相互作用是如何决定复杂的生物功能。系统生物学的快速发展表明分子网络也遵守普遍规律,同时提供了一种新概念,这种概念可能改变我们的对生物学和疾病病理的观点。蛋白质作为生物细胞中各类分子中的一种,是细胞结构和生命的核心组成部分。蛋白质之间的通过相互作用,可以组成不同的蛋白质复合物,同时在信号通路上可以调节和控制细胞的生物过程。生物体内所有蛋白质之间的相互作用可以构建为蛋白质-蛋白质相互作用网。高通量数据实验技术的发展,例如“串联亲和纯化”,“蛋白质芯片”,“酵母双杂交”和“质谱分析”等,使得我们能够获取海量的蛋白质相互作用数据。在蛋白质相互作用网络中,密集模块通常有较为重要的生物学解释,密集子网通常代表蛋白质复合物和一致的生物过程。识别出蛋白质相互作用网络中的交互模块已经成为一个研究热点,许多研究团队提出不同的算法,例如MCODE,CPM,MINE等。蛋白质交互模块的组成由多种因素决定,如网络中边的密度,网络中节点度分布,网络的拓扑结构等。本文中首先提出了一种节点展开模型,基于这种模型又提出了蛋白质交互模块识别算法。在算法中首先计算边的权值,然后计算节点的权值,这样是一个无权值的蛋白质网络转化为一个有权图。在该算法中,我们使用酵母和人类蛋白质相互作用网络,以验证我们方法的有效性,并分析参数设置对交互模块的规模和数量的影响。使用Gene Ontology和pathway富集分析之后,我们发现识别的模块都有较好的生物学解释,并且与癌症紧密相关。然后又定义蛋白质网络拓扑信息,基于这些定义,又提出了一种蛋白质交互模块识别算法,该算法引入了随机选择的思想,即核心节点的随机选择,候选节点的随机选择,扩展顺序的随机选择。为进一步算法的并行化,做出了理论基础。利用酵母和人类的蛋白质-蛋白质相互作用网络来展示该算法的有效性,为了评估算法预测的准确率,将该算法与众多顶级交互模块发现算法进行了对比。该算法预测的蛋白质交互模块结构更为稳定,与已知交互模块的组成更为相似,比其他算法有更高的准确性。又分析了参数对预测结果的影响,找到一个算法的最佳参数。同时使用Gene Ontology和pathway对识别的模块进行富集分析,发现所得结果有较好的生物学意义。随着海量蛋白质相互作用数据的产生,如何快速并且正确地处理这些蛋白质网络,成为了挑战。云计算,分布式计算,流计算等方法被提出来应对这一种挑战,开源Hadoop云计算项目已经引起广泛的关注,MapReduce编程模型简化了许多数据并行应用程序的实现,在本文中,也利用了MapReduce对具有随机选择思想的算法进行了并行化,发现并行化后的算法在处理时间上大大的减少,具有较高的加速比,并且发现数据量越大,并行化算法的优势就越大。在算法准确度上,并行化算法还是不如原算法即串行算法,这可能是因为串行算法中数据依赖的地方,并行算法识别模块数要大于串行算法。通过对模块进行功能富集分析,发现找到的模块具有统计学上的生物意义。在查阅国外论文的时候,发现以往算法,仅利用蛋白质网络单一数据集,把蛋白质网络看成静态网络。事实上,蛋白质网络不是静态的,而是一个动态实体,一个蛋白质是否表达是由在时间和空间上不同调控机制决定的。生物研究中存在多种组学数据,下一步的工作是融合不同组学数据,将静态的蛋白质网络构建为动态网络,揭示蛋白质网络的模块化组织,深入挖掘网络模块的生物学意义,寻找具有联合效应的子网标记物,进而阐明疾病发生的机理与过程。
其他文献
目的:本课题通过观察疏肝行气针法干预气郁体质的临床疗效,并与健康养生指导进行对比,探讨疏肝行气针法对气郁体质的干预效果,为气郁体质调理提供参考依据。方法:选择符合纳入标准的72例气郁体质受试者,受试者采用Doll’s临床病例随机表分为两组,试验组与对照组各36例。试验组采用疏肝行气针法干预,并配合健康养生指导,每周针刺3次,4周为一观察疗程,观察两个疗程;对照组仅给予健康养生指导。观察干预前、后应
为缓解城市地面交通压力,地铁交通已成为各大城市优先发展的交通方式。截止2019年底,中国内地累计有37个城市已经建成或在建地铁,总运营线路长达5187.05 km,我国地铁建设进入快速发展阶段。同时,地铁运行产生的振动不仅对周边建筑物及科学精密仪器造成危害,也严重影响人们的生命健康,降低人们的生活质量。因此,本文建立车辆-轨道-土层-DXWIB三维有限元模型,研究地铁移动荷载作用下带孔波阻板填充D
与光学全息以及数字全息不同的是,计算全息具有很大的灵活性,且不需要复杂的化学湿处理和光学实验,仅仅通过计算机编码就可以完成光学干涉记录和衍射再现的整个过程,并且编码
学位
本文以鄂尔多斯市泰丰新胜矿区为例,采用实地调查和类比分析相结合的方法,对矿区的生态环境进行综合分析。通过对3个样地16个样方的植被种类、生长状况、植物群落、土壤性状、
基因调控是生物体适应环境变化的一种基本手段,它使得生物能够在需要的时候表达适当的蛋白,从而有效节约自身的能量消耗。对生物体基因调控的研究意义重大,首先人们可以从中了解
颗石类微藻(颗石藻)因具有在细胞表面积累碳酸钙从而实现二氧化碳的长期封存的特性,使其在大气二氧化碳循环和海洋生态系统中扮演着重要角色。此外,颗石藻细胞还能够大量合成油脂
2015年以来,信用债市场迎来大扩容,信用债重要性与日俱增。本文致力于研究信用利差的影响因素及其与债券市场流动性的动态关系。本文主要研究方法及结论具体如下。第一,选取
化学反应动力学中,分子空间方向的控制尤为重要。它可以直接影响反应进行的方向和反应效率。所以对分子的操控变得十分重要。而通过外场,可以实现分子操控,如静电场或光场。处于
PH1704蛋白酶是一种细胞内蛋白酶,来自于嗜热古菌Pyrococcus horikoshii OT3,是C56肽酶家族的成员,具有嗜热蛋白酶的性质,酶反应速率快,在高温下不易失活,不易污染等特点,可以广泛地