基于神经网络的蛋白质主链几何特征的预测

来源 :南昌航空大学 | 被引量 : 0次 | 上传用户:pjp4057
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
蛋白质同生物的进化和功能有着密切的联系,掌握蛋白质结构有助于理解生物功能和揭示生物体的本质。随着测序技术的发展,蛋白质序列的数目呈指数形式增长,通过实验方法所获取蛋白质的结构已经远不能满足需要,并且结构获取过程中存在代价高、速度慢等问题,因此开发基于理论计算的蛋白质结构预测方法不可避免。本文以空间曲线理论和神经网络技术为基础,旨在寻求一种通过序列直接预测蛋白质主链几何特征的方法,主要内容如下:  (1)广泛阅读关于蛋白质结构预测的相关文献,对已存在的蛋白质结构预测方法进行了总结,依据所适用的范围和有效性对这些方法进行了归类。  (2)对基于神经网络的蛋白质结构预测方法进行了系统的学习。已有的基于神经网络的二级结构预测方法已取得了不错的成绩,同时近年来出现了一种将神经网络用于二面角实值预测的方法,预测结果也取得了比较高的准确度。  (3)提出了基于神经网络的蛋白质主链几何特征预测方法。该方法以蛋白质主链上的C?原子为研究对象,结合空间曲线理论,将蛋白质主链空间走向转化为曲率和挠率两个特征值,降低了预测的难度。在训练过程中将氨基酸序列作为输入,采用改进的 BP算法对曲率和挠率进行预测,通过给定的评价标准G30对预测结果进行了统计计算,实验中创建了同源蛋白质链和非同源蛋白质链数据集,并对比了两种数据集预测几何特征的预测精度。在非同源蛋白质链数据集上G30分别达到了73%和59%,同源蛋白质链数据集上G30分别达到了83.03%和67.9%,实验结果说明了蛋白质主链几何特征预测的有效性,也说明了同源蛋白质对几何特征预测的准确率要优于非同源蛋白质对几何特征预测的准确率。  (4)本文提出的方法首次从曲率和挠率角度实现了蛋白质主链结构预测,为了说明方法的可行性和有效性,引入了二面角实值预测的方法。通过两种方法的实验结果比对发现:几何特征预测不依赖于二级结构的组成,并且预测结果比二面角实值预测结果稳定,预测正确比率比较令人满意,并且为从蛋白质序列直接预测蛋白质结构提供了一些借鉴。
其他文献
数字签名和认证是公钥密码学在日常生活中的两个非常重要的应用。自数字签名和认证的概念被提出以来,基本上所有的数字签名和认证方案的安全性都是基于大整数分解问题和离散
文中围绕目前Ad hoc网络发展中急待解决的障碍物问题展开,以期能够满足分组时延、通信和计算开销等方面的需求。Ad hoc网络中存在的障碍物可能引发如下问题:一方面,网络可能
随着计算机技术的高速发展以及对编程水平要求的提高,程序设计成为了大学生的必修课程,在教学过程中需要快速准确地对程序进行评测,并将结果及时地反馈给学生。而在教学领域中,传
随着网络技术的日益发展,尤其是Internet的日益普及,网络安全问题受到越来越多的关注。入侵检测系统(IDS)是继防火墙、数据加密等传统安全保护措施后新一代的安全保障技术,得
20世纪末,社交网络的出现迅速吸引了大量的因特网用户,这类提供实时交互功能的网站改变了人们沟通和交流的方式,创造了巨大的社会和经济价值。社交网络规模日益增长的同时也
随着信息时代的到来,作为计算机通信、信息存储、internet网络传输等信息技术的关键环节,图像压缩编码算法的研究是当今信息技术里最活跃的研究领域之一,尤其是进入21世纪以
设计独立于PC机平台的视频图像采集、处理系统是数字视频理论与图像处理理论与嵌入式技术的综合运用。研制出这样的系统并使其具有功能强、性价比高是本毕业设计课题立意之所
目前P2P(Peer-to-Peer)技术发展迅速,并得到广范的应用,特别是在文件共享领域。早期的基于P2P的文件共享系统是非结构化的,例如Napster、Gnutella和Freenet等;而目前的基于P2P的文
自从20世纪80年代,移动通信开始进入公众民用通信领域至今,已经经历了20多年的发展,随着底层通信技术的进步和网络架构的成熟,基本电信业务的各种需求已经得到满足,各种增值
信息技术的发展促使企业内部、企业与企业之间的信息化协作成为必然。在协作过程中,不同的参与方通常应用不同的工具对业务过程建模,并生成相应的规范。这些规范在术语含义、