基于蛋白质相互作用网络的关键蛋白质识别算法研究

来源 :南京理工大学 | 被引量 : 0次 | 上传用户:peng1589955
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
研究表明,关键蛋白质的识别不仅有助于理解细胞的生长调控过程,也有助于进行疾病研究和药物设计。但是通过生物医学实验的方法成本高、效率低。随着高通量技术的发展,可以获得越来越多的蛋白质相互作用数据,这让我们能够从网络水平上识别关键蛋白质。目前为止,越来越多的基于网络水平的方法被提出,但是由于蛋白质相互作用网络中包含了大量的假阴性和假阳性数据,它们的识别准确度依然需要提高。针对这些问题,本文开展的主要工作如下:
  (1)提出一种构建可靠的蛋白质相互作用网络的方法。原始的静态的蛋白质相互作用网络(StaticProtein Interaction Network,S-PIN)包含了大量的假阴性和假阳性数据,这些数据影响了网络的可靠性,降低了相关算法的识别准确度。针对这种情况,本文提出一种基于亚细胞定位和蛋白质复合物构建加权的、可靠的蛋白质相互作用网络(Reliable Protein Interaction Network,RE-PIN)的方法。实验结果表明,RE-PIN能够有效提高关键蛋白质识别算法的准确度。
  (2)对边聚集系数和领域中心性(NeighborhoodCentrality,NC)算法进行改进。由于边聚集系数不适用于加权的蛋白质网络,且它忽略了假阴性和假阳性数据的影响,造成对网络拓扑特征的描述不准确。本文首先基于蛋白质相互作用可信度的概念,对其进行改进,给出可信边聚集系数的定义;然后,针对NC算法提出一种改进的关键蛋白质识别算法:可信邻域中心性(ReliableNeighborhoodCentrality,RE-NC)。实验结果表明,RE-NC算法相比于NC等其它8种算法能够获得更高的识别准确度。
  (3)提出一种基于蛋白质结构域特异性的关键蛋白质识别算法。由于基于网络拓扑特征的算法忽略了蛋白质网络蕴含的生物信息,造成这类算法的识别准确度不高。本文,借鉴TF-IDF算法的思想,通过结合蛋白质结构域和蛋白质网络的拓扑特征提出了分别适用于无权网络和加权网络的关键蛋白质识别算法Do-NC和Do-ReNC。实验结果表明,Do-NC和Do-ReNC在相应网络上比其它8种算法表现更好。
  (4)研究一种基于DS证据理论融合多视角特征的关键蛋白质识别方法。由于不同的算法通常采用不同的特征来评估蛋白质的关键性,识别出的结果也不尽相同。因此,本文采用D-S证据理论对多个不同的关键蛋白质识别算法的识别结果进行综合考虑,介绍了一种融合多视角特征的方法DS-ESS。实验结果表明,DS-ESS能够有效提高算法的识别准确度。
其他文献
结直肠癌是目前世界上最常见的癌症之一,同时也是死亡率最高的癌症之一。尽管早期的结直肠癌通过手术的切除可以得到很好地控制,但是目前临床上诊断的结直肠癌,25%的患者已经存在远端转移,而转移性结直肠癌的预后很差,是造成结直肠癌死亡率高的重要原因。大量的研究认为肿瘤干细胞的存在是造成肿瘤转移的根本性原因。肿瘤干细胞是一类既具有自我更新能力,也具有分化成肿瘤细胞的能力的细胞群体,被认为是起始肿瘤的生长、促
目的:克隆多房棘球绦虫(Echinococcus multilocularis,Em)硫氧还蛋白过氧化物酶(Thioredoxin peroxidase,TPx)基因,构建原核表达重组质粒,诱导表达重组EmTPx蛋白,并对其免疫诊断价值进行初步评价。方法:从沙鼠中分离多房棘球绦虫原头蚴,提取虫体总RNA,根据EmTPx基因序列(Genbank No.AB071135),应用Primerpremie
填充词的使用在口译中十分常见。适当使用填充词是一种积极的口译实践策略,但译语填充词使用过多则会使译语质量大打折扣,使译语冗余,且有损听众对信息的接收和理解,亦会打击译员自信。译界学者以往的研究多将填充词涵盖于口译产出的非流利现象或冗余现象中,鲜少对口译产出中的填充词有独立的深入分析。本文借鉴口语分析中的话语标记理论和口译中副语言信息理论的填充标记概念,及结合其在口译研究和口译质量评估中的应用,首先
目的染色体数目异常是一类极为常见的遗传疾病,是导致自然流产、出生缺陷、男性不育等病征的重要因素。目前,染色体数目异常的检测主要依赖于经典的核型分析。然而核型分析步骤繁琐,影响因素多,实验周期长(2~3周)。特别在流产物检测方面,核型分析的培养成功率较低,仅为60%左右。上述特点决定了核型分析将无法满足日益增长的检测需求。长期以来,出现了许多方法作为核型分
采用传统的陶瓷工艺制备了CaCu3Ti4O12(CCTO)陶瓷,研究了烧结气氛和掺杂对CCTO陶瓷相组成和阻抗谱特征的影响。与空气中烧结的陶瓷相比,在约0.1Mpa的氧气中烧结的CCTO陶瓷,畴电阻率从70O.cm增加到120O.cm,数量级上没有明显的增加,表明CCTO晶粒或畴的n型半导不应该是由失氧引起的。掺铝CCTO陶瓷的晶粒和晶界电阻率随着掺杂含量的增加先增大后减小,低掺杂浓度时,A13+
目的:调查中国城市人群对紫外线的认知和防护情况。方法:在北京和上海两城市共完成1171份问卷调查。调查的内容包括:紫外线的基本特性、紫外线对人类健康的影响、防护紫外线的措施、防晒化妆品的认知和使用情况以及获得紫外线和防护知识的渠道。结果:只有少部分被访者掌握了紫外线的基本特性;关于紫外线对人健康的影响,大部分被访者知道紫外线可以引起皮肤晒伤、老化和皮肤肿瘤,但只有少部分(35%)知道紫外线与白内障
随着全球能源需求的增长和环境污染问题的加剧,光伏发电已经成为新能源利用的主要方式。光伏并网逆变器作为连接光伏阵列与交流电网的关键环节,其工作的稳定性和可靠性直接影响着光伏发电效率和电网安全运行。严苛复杂的工况、频繁的通断切换导致光伏逆变器主电路中的功率器件成为故障高发部件。当电路出现异常工作状态时,根据故障信息及时判断出故障位置并启动保护和容错运行机制,对于提高系统效率和减少经济损失具有重要意义。
期刊
目的探讨孕早期焦虑和抑郁对妊娠期糖尿病(gestational diabetes mellitus,GDM)的影响。方法采用前瞻性研究,于2017年通过立意抽样方法选取四川省妇幼保健院产前门诊1426名孕8~14周单胎健康孕妇为研究对象,年龄为(28.6±4.0)岁。通过问卷调查收集其年龄、孕前体重、产次、孕次等基本信息,分别采用焦虑自评量表(self-rating anxiety scale,S
停顿是口译活动中十分常见的现象,并非所有的停顿都应该去除。适当停顿可以吸引听众的注意力,有利于沟通,而不当停顿则会影响口译的流畅效果和信息的传递效果,并且造成了时间上的延误,同时影响听众的理解,甚至影响听众对译语以及译员的信任度,因此应当尽可能避免与克服。本文以“伊恩·牛顿教授全球难民问题座谈会”模拟会议的口译为例,对源语和译语进行转写,同时参考相关文献,通过分析对不当停顿的现象进行分类,并研究其