【摘 要】
:
生物信息学作为一门新兴的学科,已成为这个世纪自然科学的前沿领域之一。在生物信息学的众多研究方向中,蛋白质结构预测在生物信息学研究中占有重要地位,它的研究对于理解蛋
论文部分内容阅读
生物信息学作为一门新兴的学科,已成为这个世纪自然科学的前沿领域之一。在生物信息学的众多研究方向中,蛋白质结构预测在生物信息学研究中占有重要地位,它的研究对于理解蛋白质结构与功能的关系,以及分子设计、生物制药等领域有很重要的现实意义。本文结合氨基酸序列的编码方式,探讨了几种改进BP(Back Propagation)算法在预测蛋白质二级结构中的应用,并对遗传优化BP(GA-BP)网络的学习过程及结果进行分析和评价。主要研究内容及成果如下:(1)分析蛋白质一级序列和二级结构的种类,及其表示方法。从HSSP蛋白质同源结构数据库中选取36条蛋白质记录,对它们的氨基酸序列和对应二级结构特征进行提取和表示,为整个研究提供了原始数据。(2)针对正交编码、5位编码及Profile编码这3种常用的氨基酸编码方法,利用BP神经网络,建立蛋白质二级结构预测模型。运用该模型研究比较这3种编码方式对蛋白质二级结构预测精度的影响。结果表明,用富含“生物进化信息”的Profile编码方式可以提高预测结果的准确率。(3)针对标准BP算法存在的缺点,论文讨论采用动量法与学习率自适应调整策略的BP神经网络,同时结合遗传算法来实现蛋白质二级结构的预测。结果表明,用遗传算法优化动量法与学习率自适应调整策略的BP算法可以改善预测精度。(4)把3种编码方式分别应用在不同神经网络模型中,实现蛋白质二级结构的预测,提出一种新的改进方法,即Profile编码方式与遗传算法优化的动量法与学习率自适应调整策略的BP神经网络结合。实验表明,基于Profile编码方式的遗传优化BP神经网络预测蛋白质二级结构的准确度可以得到提高,达到67.1%。
其他文献
中国正面临艾滋病广泛流行的临界点,导致艾滋病更大规模流行的社会因素普遍存在。对其他国家与地区以及中国不同阶段艾滋病社会预防模式的比较研究可以发现,艾滋病的污名化、
在小型的网络或公司的局域网中,常常使用Linux充当文件和打印服务器,让windows客户机共享Linux系统中的文件,Samba是一个基于unix系统的服务器,它的重要功能在于方便windows
<正>所谓洋相声就是外国人或外国留学生说的相声,从第一个说相声的"洋面孔"大山开始,中国有了木少洋相声演员,但对此国内学者很少有人关注和研究,外国人为什么喜欢说相声?洋
合肥绕城高速公路某段工程采用桩板式无土路基,并确定了复合植入桩法施工技术。通过工程施工实践,该技术对提高施工效率,推行标准化设计、工厂化生产、装配化施工以及对减少
伴随着农业新科技革命的兴起和农业可持续发展的需要,构建新的农业技术体系已成为我国新时期农村发展和农业经济振兴的关键。 论文首先介绍了农业技术进步的概念、类型、特
以塔里木河中下游流域尉犁县以及农二师31~35团为研究区域,以空间换时间方法,用现有林草植被类型代替退耕还林还草后的模式。针对区域内调查的61个样地,将其划分成4种模式类型:混
在实践中如何正确应用和解读个人信用报告在异议处理中是十分棘手的问题。本文针对这一问题.从落实科学发展观的高度出发,认为解读并应用信用报告的核心原则是“以人为本”,全面
可持续发展是已经被人类接受和认可的新的发展观,它把人放在发展的中心,追求经济、社会、生态协调发展。农业作为基础产业是国民经济可持续发展的前提条件和根本保证,因此农业可
随着城市化进程的加快,我国农村男性劳动力在一段时期内源源不断的向城市社会中涌入,受中国传统性别文化的影响,不同性别群体有着不同的分工,丈夫一般会进城务工,妻子在家留
近些年来,我国方言的使用情况发生了很大的变化,有些地方的方言甚至呈现出萎缩以至消亡的趋势,致使我国语言的多样性受到了极大的挑战。本课题从非物质文化遗产角度出发,为确