【摘 要】
:
从蛋白质-蛋白质相互作用(Protein-protein Interaction,PPI)网络中识别蛋白质复合物是目前蛋白质组学中最重要的任务之一。大部分传统的利用计算方法的蛋白质复合物识别方法都是通过在PPI网络中挖掘稠密子图作为最终识别的蛋白质复合物。由于PPI网络存在假阳性率和假阴性率的缺点,研究人员开始试图利用生物信息来提高预测蛋白质复合物的质量。然而,如何将不同类型的生物信息整合到复合物
论文部分内容阅读
从蛋白质-蛋白质相互作用(Protein-protein Interaction,PPI)网络中识别蛋白质复合物是目前蛋白质组学中最重要的任务之一。大部分传统的利用计算方法的蛋白质复合物识别方法都是通过在PPI网络中挖掘稠密子图作为最终识别的蛋白质复合物。由于PPI网络存在假阳性率和假阴性率的缺点,研究人员开始试图利用生物信息来提高预测蛋白质复合物的质量。然而,如何将不同类型的生物信息整合到复合物识别过程中对研究人员来说仍然是一个挑战。近年来,网络嵌入方法由于良好的信息保持效果被广泛应用于各种网络学习任务中。因此,本文提出了基于生物属性网络嵌入方法的蛋白质复合物识别算法GANE。GANE算法首先利用网络嵌入获得蛋白质的向量表示并重新计算蛋白质对之间的相互作用强度,后续基于蛋白质复合物的结构特性进行聚类识别出最终的蛋白质复合物。GANE算法提供了一个统一的框架将各种生物信息整合到识别过程中。在GANE算法的基础上,为了克服现有网络嵌入方法存在的无法同时保存网络全局、局部结构信息和节点属性信息的缺点。本文提出一种新型网络嵌入算法,并将该算法应用于本文提出的蛋白质复合物识别算法GLONE中。同样地,GLONE算法利用这种新型网络嵌入方法学习出蛋白质的向量表示并重新计算蛋白质对之间的相互作用强度,后续利用一种特殊的聚类方法识别出其中的蛋白质复合物。本文在五个国际上公开的蛋白质相互作用网络数据集上,与蛋白质复合物识别领域中六个经典的识别算法进行了一系列对比实验来验证本文提出的GANE算法以及GLONE算法的有效性。最终的实验结果表明GANE算法以及GLONE算法相比其他六种识别算法具有更高的准确性。
其他文献
有机发光二极管(Organic Light-emitting Diode,OLED)被认为是最具竞争力的下一代平板显示器和固态光源技术,它们具有驱动电压低,发光效率高,响应速度快和超薄等优点,在平板显示和固体照明领域具有非常广阔的应用前景。合成高效稳定的蓝光材料仍然是OLED发展的重点之一。分子内电荷转移型材料在改善载流子传输,调控发光材料的能级和合成TADF材料中得到了广泛应用,所以基于此思路我
班公湖-怒江缝合带(BNSZ)广泛分布各种蛇纹石化超基性岩,而磁铁矿是蛇纹石化过程重要产物,研究超基性岩蛇纹石化程度及其影响因素,有助于岩石物化性质研究、生命起源探讨以及为磁铁矿勘探提供新的方向。昂吾地区位于班怒带中段,本文通过岩石学、岩相学、矿物学、矿物化学以及地球化学方法,对昂吾超基性岩进行岩石成因探讨和蛇纹石化过程及其影响因素研究,并且评估昂吾超基性岩磁铁矿赋矿潜力,可以为今后缝合带超基性岩
自旋-轨道耦合,即Spin-Orbit Coupling(SOC)是一种重要的物理机制。它起源于狄拉克方程的非相对论近似,广泛存在于空间反演不对称的固体材料中。SOC的强度主要由材料的内禀性质决定,很难在实验上通过人工的手段去调控。近些年来,实验上通过双光子拉曼技术在中性玻色-爱因斯坦凝聚体(BEC)中成功实现了可调控的人工SOC,这迅速引起了广大物理工作者的研究兴趣。研究表明超冷原子体系中存在S
随着高通量转录组测序技术的发展和应用,数以万计的新型RNA得以发现,特别是长非编码RNA(long non-coding RNA,lncRNA)。研究表明,哺乳动物基因组大部分能够被转录,但具有蛋白
最近几十年里,具有交换偏置性质的核壳磁性纳米体系由于其在数据存储、生物医药和电子器件等方面有着可观的应用,而受到科研工作者的广泛关注。本文通过制备合成了γ-Fe_2O_3/NiO和Ni/NiO两种核壳磁性纳米体系,具体研究了形貌结构对其交换偏置以及测试条件对相关磁性能的影响,得出的主要研究结果如下:通过结合了煅烧工艺的两步溶剂热法,合成了具有可控微观结构的γ-Fe_2O_3/NiO核壳纳米结构。讨
不同波长的光对植物生长和成分的影响不同。红光和蓝光照射量的增加会促进植物的生长,紫外光会伤害植物而绿光会造成光能浪费。转光剂能够将太阳光中的紫外光、绿光等转化为
次黄嘌呤(Hypoxanthine,I)是DNA中一种常见的损伤碱基,主要来源于腺嘌呤的脱氨基作用,具有致突变性。高温加剧了腺嘌呤脱氨基形成I的速率,暗示着极端嗜热古菌基因组DNA的稳定性受到严峻的挑战。核酸内切酶是驱动DNA中I修复的关键酶。但是,目前极端嗜热古菌DNA中I的修复机制尚不清楚。极端嗜热古菌 Termococcus barophilus 和Thermococcus gammatol
铍因其低密度、高熔点、高弹性、高比强度等优点,在核装置、航空、航天、精密仪表等重要工程领域有着关键性应用。在其生产中普遍采用粉末冶金工艺成型。多种采用此工艺的材料如Ni合金、W-Cu合金、Mo、Cu-Cr合金、Ti-Al-V合金等已程度不同地引入计算机仿真辅助于工艺设计和优化,但铍不在其中。国内相关企业仍依靠传统的实验试错方法进行铍的工艺优化和新工艺设计,成本高昂。导致这一滞后的主要原因之一,是目
现代电子印刷大多基于数字化信息的控制,诸如通过喷墨打印机在不同基底上准确精细地打印各种功能材料以实现各种应用。这其中,纳米金属材料凭借其良好的导电性和延展性受到了广泛关注。喷墨打印技术具有环保、低成本、工艺简单等优点,在有机发光二极管、太阳能电池、柔性电子器件及射频识别等领域具有广阔的应用前景。本文通过对Fujifilm Dimatix公司生产的喷墨打印机DMP-3000的机器构造和工作方式的研究
在高炉冶炼过程中,合理的炉温是保持高炉生产稳定顺行的关键因素之一。由于高炉冶炼过程的复杂性及受当前技术水平的限制,难以精确掌握炉内的温度,因此炉温的预测技术对高炉运行具有重要意义。在高炉炼铁过程中,通常以铁水硅含量来表征高炉热状态,建立可靠的铁水硅含量预报模型对高炉操作人员具有重要的指导意义且具有重要的理论研究价值。本课题选用高炉铁水硅含量对炉温进行间接预测,主要工作包括:(1)针对硅含量预测效率