基于神经网络方法的蛋白质二级结构预测

来源 :东北大学 | 被引量 : 0次 | 上传用户:caikesbad
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
神经网络作为机器学习的重要方法,在生物信息学领域中取得了广泛的应用,尤其是生物序列的模式分析中,如蛋白质的分类、启动子的识别与分类等等.神经网络也同样被应用于蛋白质二级结构预测中,神经网络通过学习现有的氨基酸序列与二级结构间的关系,可以对蛋白质的二级结构做出预测.相比其它机器学习方法,神经网络在这些应用中,具有高效准确的特点.我们设计完成了用神经网络预测蛋白质二级结构的系统,我们在实现中着重研究了两类问题,一是如何对氨基酸进行编码,二是如何根据生物特性对神经网络的预测结果进行进一步的后处理以及如何合并多个神经网络的预测结果.在第一个问题上,我们分别根据概率和氨基酸的生物特性提出了多种编码方法;在后处理及结果的合并上,我们根据蛋白质二级结构的生物特性,提出了预测结果的修改规则.同时,为了得到更准确的预测结果,我们在训练神经网络时采用了神经网络集合的方法,并根据网络的效果提出了神经网络集合中各神经网络结果的合并规则.在三类分类器和并过程中,我们根据系统的实际情况提出了可行的合并策略,并对各种合并策略的效果进行了比较和分析.我们的实现采用的是不基于同源信息的方法,我们的方法与此类的其他方法相比达到了其他方法所达到的正确率,同时我们提出的编码及后处理过程较好的改善了预测系统的SOV指标,达到了采用同源信息方法所达到的水平.
其他文献
目前,基于嵌入式平台开发的产品越来越多,USB技术的应用也越来越广泛.该课题研究内容正是嵌入式平台上的USB设备驱动开发.由于Linux免费提供了全部操作系统的源代码以及详尽
数据挖掘是从数据中发现有价值信息的重要方法,特别在海量数据环境的背景下数据挖掘更是备受关注。传统的数据挖掘经历数据预处理、特征构建、模型训练、结果评估的过程,但该过
随着Internet的普及和电子邮件的广泛使用,电子邮件的防毒迫在眉睫,邮件过滤网关硬件专有系统的开发正好迎合了这一需求。本课题基于POP3协议的邮件过滤网关的研究是对冠群金辰
Java作为一种新型的语言问世时间虽然很短,但它有一其独具的魅力,日益受到广大企业应用开发者的青睐,与之相关的技术也层出不穷。Sun公司力图使Java不仅仅是作为一种有生命力的
近年来,随着科学技术的迅速发展,能源负荷监测作为一个热门话题,对于电力系统的智能化发展具有至关重要的意义。传统的能源负荷监测方法一般是在每个负荷的配电输出端安装带有通
随着大数据时代的到来,数据的存储和访问不再囿于传统的封闭环境;同时,信息安全也关乎国家安全、企事业利益和个人隐私。以往在封闭环境中成熟的数据安全体系,是以单个系统为
本论文的全文包括五章内容。第一章简单介绍了WebGIS的概念和发展现状,尤其是了当前WebGIS的信息安全的发展状况。第二章具体介绍了WebGIS的体系结构以及安全问题。第三章则是
学位
目前专家系统推理机的研究分为三类:本地推理机基于本地的知识库进行推理、本地推理机基于网络知识库进行推理和网络推理机基于网络知识库进行推理.随着网络技术的发展以及信
本课题研究了基于API截获的远程实时监测技术。其中,如何实现稳定高效的数据采集、制定功能完备的应用层协议、设计健壮的服务器端软件是关键。本文论证了利用截获Windows API