基于深度学习的S型棕榈酰化修饰位点和lncRNA识别方法研究

来源 :国防科技大学 | 被引量 : 0次 | 上传用户:lxg19841130
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
深度学习是一类以多层神经网络为特征的机器学习方法的统称。近年来,深度学习在图像识别、自然语言处理等领域已得到广泛应用。深度学习适于高样本量、高维度问题场景下的机器学习。在面向序列的生物信息学模型构建中,深度学习方法可通过对序列的初级编码,减少特征提取过程造成的信息损失。基于卷积神经网络,我们建立了通过肽段序列进行S型棕榈酰化修饰位点识别的预测工具DpPalm,我们在DpPalm中通过AAIndex1组合编码肽段序列。DpPalm在独立测试集上预测结果的AUC达到0.866。此外,我们基于双向长短时记忆-卷积混合网络建立了通过核酸序列进行lncRNA识别的预测工具Dp LNC。DpLNC在独立测试集上预测结果的AUC达到0.822。我们还建立了一个完全基于低通量实验验证的lncRNA综合数据库LIVE。我们使用LIVE中收录的新lnc RNA数据集,进一步验证了DpLNC的预测性能,预测敏感度达81.8%。LIVE中收录的数据涉及572种lncRNA,包含了来源于1045篇文献的1342个注释条目。本论文是深度学习在基于生物序列的信息学预测中的典型应用。本论文的研究成果不仅为S型棕榈酰化修饰位点的识别提供了有效工具,而且为lncRNA的识别建立了新的方法。
其他文献
近些年中国经济飞速发展,公路运输仍然是我国境内货物运输的中流砥柱,而且比重在逐年稳步升高,载重型货车在公路货物运输过程中发挥着无可替代的作用,载重型货车的增长率常年
在生活日益现代化的今天,桥梁、高楼、大坝、隧道等大型建筑物扮演着越来越重要的角色,这些大型建筑物在建造和长时间的使用过程中,由于受各种内力和外力的影响会产生微小形
图像在生成、传输、处理等过程中会有许多失真,模糊是最常见的一种。当前学术界涌现了许多去模糊算法,但是缺乏对去模糊图像质量的理想评价方法。本文是针对去运动模糊图像质
汽车蓄电池是汽车的重要部分,随着汽车产量的增加,对蓄电池的需求量越来越大。现有汽车蓄电池存在两方面问题:一是用户难以获得蓄电池寿命以及当前信息状态,在汽车行驶过程中
RNA编辑是一种稀有的转录后序列修饰过程,通过碱基插入、缺失或替换使成熟RNA与模板DNA序列不同,是对中心法则的重要补充。RNA编辑可以通过影响mRNA的亚细胞定位和调节异染色
禽流感(Avian Influenza,AI)是由A型流感病毒引起的一种禽类的烈性传染病,禽流感病毒变异频繁,所以不易控制。基因重组是流感病毒的一个重要进化机制,20世纪的3次流感病毒大
半导体量子点由于具有量子尺寸效应、隧道效应等特性而呈现出与体材料完全不同的光致发光以及电致发光性能;并且应用到如发光二极管、生物标记成像、激光器和单光子源等诸多
二十一世纪是信息化的时代,近年来人们对数据存储性能和数据处理能力的需求不断提高,这促使了半导体集成工艺和技术的持续改进和创新,同时也加快了下一代存储器件的研究进度
随着社会对全民健身的重视,青少年作为实施全民健身计划的重点对象,有必要对青少年体育中的龙头品牌赛事进行研究。本文主要对阳光体育大会赛事品牌建设现状进行研究,从2011
在对有机发光二极管(organic light emitting diodes,OLEDs)的研究中,反系间窜越(reverse intersystem crossing,RISC)是一个非常重要的物理机制,也是目前的研究热点。这是因