蛋白质二级结构预测

来源 :齐鲁工业大学 | 被引量 : 0次 | 上传用户:bynlxd
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
蛋白质二级结构是研究蛋白质折叠盘旋结构的基础,蛋白质盘旋和折叠的状态决定了人体生物蛋白酶的活性,如果这种生物活性缺失或者降低将直接会导致疾病的产生,因此确定蛋白质二级结构将对研究人体内蛋白复合物以及医学疾病的防治有很大的帮助。本文主要提出了基于蛋白质长度分类建模的预测方法,主要的工作包括以下几个方面:(1)蛋白质二级结构在线服务器评估。为了对当前蛋白质二级结构预测的研究现状有更深刻的理解,从蛋白质结构数据库中下载了350条蛋白质数据,对当前6个国内外经典的预测服务器:PSRSM、MUFOLD、SPIDER、RAPTORX、JPRED和PSIPRED进行评估测试,实验结果显示PSRSM服务器获得了最优的Q3和Sov准确率。(2)基于线性分类器优化建模的预测方法。该方法将25PDB作为训练集、CB513作为测试集,通过手动优化和贝叶斯优化两种方式,对线性分类器的正则化系数和线性系数阈值进行调整优化,最终得到优化后的实验结果比优化之前高0.1个百分点。(3)基于蛋白质长度分段和深度卷积神经的分类建模方法。该方法首先选定蛋白质预测中经典的两个大数据集Astral和Cull PDB,将其组合为一个整体数据集Astra Cull;然后将该数据集中的蛋白质按照长度划分为4段或6段;接下来分别在每一段上优化深度卷积神经网络的卷积核大小、个数、网络层数、学习率和正则化系数等,以寻找最优网络模型结构;最后得到4分段的网络模型和6分段网络模型。为了使实验结果更加精确,又获取了更多蛋白质特征信息进行实验,得到了进一步优化的蛋白质6分段网络模型。实现结果显示6分段模型的最优准确率高于4分段模型,6分段模型在数据集CASP9、CASP10、CASP11、CASP12和CB513的最高Q3准确率分别为83.67%、78.99%、78.53%、71.52%和85.94%,其中CB513的实验结果优于很多经典预测方法。(4)基于贝叶斯优化的分类建模方法。该方法将Astra Cull数据按照蛋白质的长度划分为6组,在每一组上使用贝叶斯优化卷积神经网络的4个参数:卷积深度、学习率、正则化系数和随机梯度冲量,从而得到优化后的卷积神经网络模型,该模型得到在数据集CASP9、CASP10、CASP11、CASP12和CB513中最优的Q3准确率分别为80.08%、77.74%、77.06%、69.95%和83.09%。实验结果说明,本文提出的基于蛋白质长度分类建模的方法是有效的,它考虑到长短程距离信息对结构预测的影响。不仅能够缩短训练时间,而且还能让蛋白质选择与其长度相似度高的模型进行预测,提高了预测准确度。与此同时,结合深度学习方法的使用也提高了准确率,这也为今后蛋白质二级结构预测研究指明了方向。
其他文献
在民航工作中,安全是永远的主题。在航空器飞行的各个阶段都会受到气象条件的影响,民航安全与气象条件有着密切的关系。而民航气象作为民航工作的重要组成部分之一,肩负着最
电梯在今时今日的城市中饰演着至关重要的角色,与公共安全息息相关。近几年来,随着城镇化建设进程的加速推进,高层和超高层楼房也逐渐走进了我们的生活,在用电梯的数量也随之
协作通信网络技术利用分布式的概念来共享彼此无线资源以达到空间分集的目的,能有效抵抗衰落、提高传输可靠性和扩大网络覆盖范围。协作通信网络研究中的一个关键问题就是中
随着美国页岩气勘探开发理论的发展与成熟,我国一些地区也相继开展了页岩气地质条件的理论研究工作,并尝试建立适用于各工区的页岩气评价标准。本文以柴达木盆地北缘侏罗系作
邯邢地区是我国重要的大型铁矿基地,大地构造位置属于华北克拉通中部,太行山板内造山带。西石门由于其规模大、储量多,被认为是邯邢式铁矿的典型。但是通过本文在西石门矿床
基数约束稀疏优化模型是指约束上带有l0范数的优化模型。这类模型在信号处理、回归分析、压缩感知以及图像处理等领域有着广泛的应用。随着研究的深入,又被应用到目标检测、
大脑是人体最为重要的器官之一,它负责控制指挥着人体各项重要的生理活动,因此了解其工作特点及原理是一个重要的研究方向。目前人们主要通过大脑的生理电信号了解研究大脑的
社会治理理论创新,是创造良好社会环境的必然前提,是实现治理体系和治理能力现代化的关键。对十八大以来中国共产党的社会治理理论创新进行研究,在当前具有十分重要的理论意义和现实价值。十八大以来中国共产党的社会治理理论创新,离不开改革开放以来中国社会取得的发展、马克思主义中国化的理论基础以及对国外社会治理理论的合理借鉴。党的十八大以来,以习近平同志为核心的党中央从党和国家事业全局的战略高度出发,根据我国社
重叠社区发现可以帮助人们分析和理解复杂网络,目前已成为数据挖掘的研究热门。随着新的重叠社区发现算法被不断提出,现实的应用情形对算法的时间性能和稳定性要求不断提升,
目的1、观察自拟七味平衡升压方(七味方组)治疗原发性低血压病气阴两虚型患者的临床疗效特点;2、评估自拟七味平衡升压方与盐酸米多君片(米多君组)对原发性低血压病气阴两虚型患者的升压效果、安全性异同及七味平衡升压方的优势;3、综合探讨中西医治疗原发性低血压病的相关问题。方法采用临床随机对照研究,选取符合纳入标准的原发性低血压病气阴两虚型患者87例,将研究对象随机分为两组,中药七味方组42例服用自拟七味