基于深度卷积神经网络的蛋白质接触图预测研究

来源 :南京理工大学 | 被引量 : 0次 | 上传用户:laverke
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
蛋白质结构信息在生物学、医学、药物学等多个领域都起到重要的作用。然而使用生物学实验来的得到结构耗时且昂贵,远不足以解析自然界中存在的巨大数量的蛋白质。所以基于序列的蛋白质结构从头预测具有巨大的理论价值和现实价值。蛋白质残基接触图是蛋白质空间结构的一种低秩表示。它约束着氨基酸间的距离,因此对重构蛋白质结构至关重要。作为一个分类问题,蛋白质接触预测存在一定特殊性:包括蛋白质接触的阈值是人为规定、蛋白质结构测定的各原子位置不完全准确、正负样本不平衡等。这些特殊性使得常用的机器学习模型需要进行一些调整后才能更好的应用在接触图预测中。除此之外,现有方法仍然难以对同源性低的序列进行准确的预测。(1)本文中首先提出了一种基于同源信息和Focal Loss的接触图预测方法,构建了一个深度卷积神经网络,以预测三态二级结构、预测溶剂可及性、直接协同进化信息、互信息、残基对势能等为特征。此外修改了深度卷积神经网络的模型中传统的交叉熵损失函数,转而使用对错误预测更敏感的Focal Loss来训练深度卷积神经网络。在Pfam家族蛋白质、CAMEO困难目标等多个数据集上与前沿算法的对比说明了所提出改进的有效性。(2)现有方法仍然难以对仅包含少量同源信息的目标进行准确预测。针对该问题本文提出了一种完全基于单序列的预测流程。该方法仅仅根据单序列出发编码蛋白质,不使用任何序列同源信息。构造了一个深度全卷积神经网络来建立单序列信息以及残基接触之间的关系。该方法在低同源性目标上获得较高的预测精度以及离散度,在多个CASP自由建模目标上都优于前沿算法。给蛋白质接触图预测提供了一种新的思路。
其他文献
冲击波压力是弹药毁伤威力评价的主要参数之一,自由场压力和地表反射压是冲击波压力的常测参量。针对当前弹药威力试验过程中出现的压力值测不准、不可比等问题,分别对自由场压力及地表反射压开展了工程测试影响因素分析及测量不确定度评定方法的研究。通过分析压力传感器测点位置设计对自由场压力测试造成影响的成因,运用AUTODYN软件仿真分析了TNT柱形装药的不同当量、爆高、尺寸(长径比)、起爆点位置对三波点高度变
慢性阻塞性肺疾病(chronic obstructive pulmonary disease,COPD)简称慢阻肺,是一种与人体肺部及呼吸道相关的慢性疾病,严重威胁着人类健康。氧减状态的准确定位和分析对该疾病的诊断具有非常重要的指导意义。为了提高慢性阻塞性肺疾病的诊断水平,本文基于长短时记忆网络(Long Short-Term Memory Network,LSTM),展开了慢性阻塞性肺疾病氧减状
非编码核糖核酸是一类不编码蛋白质的核糖核酸的总称,虽不编码蛋白质但在生物体生命过程中扮演着重要角色。微小核糖核酸是非编码核糖核酸中长度约为20个核苷酸的小分子,既能参与生命转录过程中的调控,也能参与转录过程后的调控,微小核糖核酸特别是病毒类型微小核糖核酸的异常表达还与疾病息息相关。因此,从有相似环状结构的发夹序列中区别出真正的微小核糖核酸具有重要意义。本文提出基于改进特征和有监督自组织映射神经网络
随着信息技术的快速发展和人们对生活品质的追求不断提高,数字图像在人们的生活中扮演着越来越重要的角色。然而数字图像在其采集、压缩存储以及传输过程中往往会遭受到不同程度不同类型的失真降质,导致数字图像质量出现一定程度的降低,同时给人们的实际应用造成一定的困扰。图像质量评价技术是用来对图像质量进行评价,度量失真对图像质量的影响程度。一个高效准确的图像质量评价方法在实际应用中发挥着非常重要的作用,是保证用
由于近年来信息物理系统(Cyber-Physical System,CPS)、物联网(The Internet of Things,IOT)等新概念新技术的火热,人机交互技术显得愈发重要。这些新技术都围绕着将现实世界和信息世界合二为一这一主题,在这个过程中,手势作为一种方便使用的人机交互方式获得了大量的关注。本文对安保机器人的手势控制进行了研究,主要研究内容与创新点如下:(1)对安保机器人控制系统
无人驾驶技术被认为是未来的发展趋势之一,是当前研究的热点,人们希望通过无人驾驶技术缓解交通上的种种问题。无人驾驶汽车通过配备的各种传感器对周围环境进行感知,多线激光雷达和毫米波雷达在无人驾驶汽车上广泛应用。本文基于激光雷达原始点云数据以及毫米波雷达数据研究环境建模技术,主要研究内容如下:(1)提出一种基于点云空间邻域多特征的点云分割算法。首先利用栅格内最大最小高度差特征进行点云粗分割,然后对粗分割
机器人对于人类生活和工作的革新有很大帮助,多机器人系统更是未来机器人的发展方向,对于制造业、加工业、危险环境和未知环境等都有很重要的意义。多机器人系统任务分配即为机器人和任务间寻求一种良好的对应关系,对于多机器人系统的执行效率至关重要,决定着多机器人系统完成任务的时间和资源消耗等多种因素。通常多机器人系统具有并行、冲突、可选方案多等特点,因此如何合理地分配系统内机器人在何时使用何种资源执行何种任务
本课题以人脸图像为主要研究对象,将人脸图像转换为具有艺术家绘制风格的肖像素描画,并将得到的肖像画通过处理、计算得到可供机械臂绘制的坐标序列。具体内容如下:(1)研究了语义分割的发展现状,利用双边分割网络Bise Net作为分割的基础网络,并针对它网络较浅、上采样方式粗暴等缺陷对其进行了一系列改进,主要有:在空间路径中加入残差模块以增加空间路径的深度,重新构造了上下文路径使其更充分地利用不同尺度的特
跟随机器人需要在自主跟随的同时避开环境中的障碍物,安全区域特指环境中可以自由通行的无障碍区域。为解决跟随机器人在户外环境下的目标定位和自主跟随问题,本文在以下几个方面开展工作:首先对跟随机器人进行软硬件设计,设计了可在户外工作的履带式底盘,该底盘采用双流传动机构,具有转弯半径小、功耗低、控制简单的特点,提高了跟随机器人的机动性和环境适应性。机器人采用UWB和单线激光雷达融合的传感器方案。基于UWB
预测在现实生活中有着重要的意义,预测的目的在于通过对未来进行合理地判断和规划使得事情往有利的方向发展。深度学习作为一种科学有效的预测方法,被广泛应用到预测领域中,并取得了良好的效果。因此,本文基于深度学习模型中的生成对抗网络,研究了其在复杂产品费用预测和软件业务系统状态预测领域的应用:(1)传统的深度学习模型需要大量的数据对神经网络进行训练以此保证预测结果具有较好的准确性。然而,由于复杂产品本身的