【摘 要】
:
蛋白质是生物体的重要组成部分,蛋白质的生物学功能在很大程度上取决于其三级结构的动力学性质,从蛋白质的三维结构预测蛋白质不同残基的柔性运动是理解蛋白质功能的分子机制的基础。近年来,卷积神经网络(convolutional neural network,CNN)方法在生物信息学领域得到了广泛的应用,越来越受到大家的重视。本论文借鉴PointNet方法的思想,提出了一种蛋白质结构柔性预测的CNN模型,本
论文部分内容阅读
蛋白质是生物体的重要组成部分,蛋白质的生物学功能在很大程度上取决于其三级结构的动力学性质,从蛋白质的三维结构预测蛋白质不同残基的柔性运动是理解蛋白质功能的分子机制的基础。近年来,卷积神经网络(convolutional neural network,CNN)方法在生物信息学领域得到了广泛的应用,越来越受到大家的重视。本论文借鉴PointNet方法的思想,提出了一种蛋白质结构柔性预测的CNN模型,本文的主要工作如下:首先,本文介绍了基于点云的卷积神经网络算法,并针对蛋白质结构特征的点云分割方法进行了改进,提出了一种新的批量化策略,使用大小不等的小批量输入蛋白对网络进行迭代训练。其次,本文构建了只考虑蛋白质中碳原子的CNN模型。在该模型中,直接将输入的蛋白质空间结构坐标作为三维点云,分别使用对称操作函数和空间变换网络来处理点云的排列不变性和刚性变换。同时使用新的批量化策略,并使用Pearson相关系数作为损失函数。本文使用了三组相对较小、中等和较大的蛋白质数据集来测试该算法的准确性,结果表明,该方法预测得到的B因子与实验B因子的平均相关系数优于高斯网络模型,后者已广泛用于预测蛋白质的柔性。最后,本文构建了考虑蛋白质中所有重原子的CNN模型。实验结果表明,使用所有重原子的预测结果优于只使用碳原子的预测结果。同时,本文将该方法与其它的机器学习方法进行了比较,结果表明,本文的方法优于大部分的机器学习算法,本文的研究为从蛋白质的三维结构进行柔性预测研究提供了一种有效的方法。
其他文献
二维(2-D)系统是动态过程,取决于两个独立状态(水平和垂直)的变化。许多2-D系统都存在固有的延迟,这会导致系统的不稳定和性能下降,同时2-D时滞系统在工程领域中具有广泛的应用,从而使得研究2-D时滞系统具有重要的现实意义,因此,众多学者越来越关注带有时滞的2-D系统的稳定性和控制问题。2-D系统状态在运行过程中不可避免的会发生突然变化,通常利用切换信号来调节系统变化。另外,非线性因素会增加系统
肠道病毒组是人体肠道微生态系统中的重要组成部分。近年来,肠道微生态与疾病的关系受到广泛关注,越来越多的证据表明粪菌移植过程中病毒组的转移对粪菌移植的疗效起到了不可忽视的作用。本文根据近些年的相关研究,综述粪菌移植中肠道病毒组在疾病中的治疗潜力,总结肠道病毒组在疾病治疗中的可能机制,同时对肠道病毒组在未来疾病治疗中的应用作出展望。
近年来,社会、经济、工业等发展迅猛,流固耦合问题被广泛应用到各行各业的研究中。由于在解决流固耦合问题时存在许多假设,与实际的工程研究情况无法完全一致,人们对于流固耦合问题的理论研究越来越重视。采用相容拉格朗日-欧拉法,求解可渗透弹性悬臂梁式薄板在理想流体横向绕流下的小变形问题。假设弹性薄板的孔很小且均匀分布,不会对其弯曲刚度及外部流场产生影响,忽略小孔所造成的阻力。根据弹性薄壳理论和接触面动力学方
储热是实现可再生能源、电网谷电、工业余热等大规模、低成本利用的关键技术。其中,复合相变储热复合显热储热和相变储热,具有储热密度高、耐腐蚀性强、导热性能高、不易相分离、不易过冷等优点。然而,传统复合相变储热材料的骨架原材料以天然矿产资源为主,这些材料的大规模开采破坏了周边的自然环境,其开采加工过程消耗大量化石能源,排放大量二氧化碳、二氧化硫等温室、有毒有害气体。为充分利用工业固体废弃物,本文以工业固
本论文将负顾客、反馈、休假、N-策略和工作故障等策略引入到经典排队模型中,研究三个排队模型,给出系统的平均队长及顾客的平均逗留时间等性能指标,通过构建个人利益和社会效益函数进行最优化分析。首先,研究带负顾客、反馈、N-策略及工作休假的M/M/2可修排队模型。假定有两个服务台,且其中一个在正常工作时可能发生故障。根据构造的三维马尔科夫链,可以获得状态转移率矩阵,采用拟生灭过程和高斯-赛德尔迭代法得到
在传统可靠性分析中,概率理论是研究系统可靠性的主要数学工具。然而,由于成本、技术、环境等原因很难获取到大量数据,甚至无法获得任何数据。利用传统可靠性理论来研究无充足样本的系统可靠性问题存在一定的局限性。针对稀缺数据和人为不确定性的系统可靠性问题,本文基于不确定理论,将系统元件寿命视为双重不确定变量,探究一般系统的可靠性建模与评估方法。首先,研究了具有双重不确定寿命的常见系统可靠性问题。基于不确定理
对于任何系统来说,维持较高的可靠性是至关重要的。k/n(G)结构作为典型的冗余系统结构,能够有效提高系统的可靠度和可用度,因此被广泛应用于各种实际系统设备中。重试排队系统以其在实际问题中的广泛应用得到大量学者的关注,然而在系统可靠性分析中,很少有学者考虑部件具有重试特征的系统可靠性问题。本文基于k/n(G)系统模型,建立部件具有重试特征的可修系统模型,并对该模型的可靠性进行了分析和研究。首先,分析
随着社会的不断发展,工业化程度不断提高,自动化水平也愈来愈高。近年来,随着随机理论的不断完善,随机控制系统在社会生产和工业控制中的应用愈加广泛。随机系统的研究领域中,连续时间随机系统是一个重要的研究分支。在随机控制系统的研究过程中,系统的稳定性控制是最基础也是最重要的。随着对系统结构的要求不断增加,针对包含不确定性参数、线性与非线性、外部扰动以及系统时滞和系统故障等问题时,如何设计合适的控制器,以
由分数阶微分方程描述的动力系统因具有良好的记忆与遗传性,能够更精确的刻画系统的动力学行为。因此,分数阶动力系统的研究受到了国内外学者的广泛关注。本文以分数阶网络多智能体系统为研究对象,探究分数阶神经网络的稳定性与同步以及多智能体系统的一致性。主要工作如下:首先,建立凸函数分数阶微分不等式与分数阶系统有限时间收敛引理,针对具有δ-逆K?lder激励函数的分数阶神经网络,应用Brouwer拓扑度理论和
随着分数阶微积分理论研究的不断发展,分数阶微积分在科学和工程的许多领域获得了广泛的关注和成功,尤其是材料力学。研究粘弹性梁的动态响应问题对于了解实际工况具有重要意义,许多学者对此展开了研究。目前,对于粘弹性梁的数值求解算法大多将问题转化到频域给出可解性,再转换回时域分析。然而,此问题直接在时域内求解算法的研究还很少。基于此,本文引入时间参数建立了两类粘弹性梁的分数阶控制方程,并首次应用移位Cheb