基于神经网络的蛋白质二级结构预测问题的研究

来源 :北京工业大学 | 被引量 : 5次 | 上传用户:dlxfmc
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
蛋白质二级结构预测问题是生物信息学的重要问题之一。本文对蛋白质二级结构 预测问题进行了研究,建立了蛋白质二级结构预测数据库。研究了蛋白质的基本组成 成分氨基酸的编码方式。基于 BP 神经网络建立了单神经网路和多神经网络的预测模 型。并利用它们对蛋白质二级结构进行了预测研究。其主要研究内容和成果如下: (1)蛋白质二级结构评测数据库的建立 论文首先从同源蛋白质数据库(Homology Derived Secondary Structure of Proteins,简称 HSSP)中提取出 36 个蛋白质文件:针对其包含复杂的数据形式,设计 了一个提取数据的方法,对蛋白质数据进行预处理,提取出氨基酸序列。建立了由这 些氨基酸序列构成的数据库。为蛋白质二级结构预测打下了良好的基础。 (2)5 种氨基酸编码方式的比较研究 论文针对正交编码、5 位编码、Codorl(基本型)编码、Codorl(扩展型)编码及 Profile 编码等 5 常用的编码方法。利用 BP 神经网络,建立了蛋白质二级结构预测的评测模型。 运用该模型研究分析了这 5 种编码方式对蛋白质二级结构预测精度的影响。结果表明, 用富含“生物进化信息”的 Profile 编码方式可以得到较高的预测结果。 (3)基于多神经网络的蛋白质二级结构预测模型 论文提出了一个由 7 个 BP 神经网络组合成的多神经网络的蛋白质二级结构预测模 型,该模型采用“profile”编码方式和氨基酸间的“距离”为激励输入信息,对蛋白 质二级结构进行了预测。论文对从 36 个蛋白质提取的共 4000 个氨基酸的进行了预测研 究和分析。结果表明,本文的多神经网络优于 Zhu 等人提出的多神经预测模型[19],它 把蛋白质二级结构预测的平均精度从 66.1 502%[19]提高到 68.8903%。 本课题得到了国家自然科学基金的支持。
其他文献
<正>由李凤鸣教授、谢立信院士担任主编,各学组首席专家担任分卷主编的《中华眼科学》(第3版)于2014年9月由人民卫生出版社出版发行。本书第1版原名为《眼科全书》,荣获新闻
科学数据管理与共享是促进科技基础能力建设,充分发挥科技资源整合作用,提升科技创新能力的基础,是可持续发展的重要保障。通过对国际科学数据管理与共享的发展历程进行系统
目的探讨外伤性虹膜根部离断复位手术的新方法。方法采用改良褥式缝合法修复虹膜根部离断15例(15只眼)。结果所有病例均获良好修复,外形改善,房角开放,视功能不同程度地提高
介绍了我国汽车生产及进出口情况,分析了目前汽车产业消费钢材的品种结构,以及汽车用钢的主要发展趋势,重点分析了汽车制造中消费量较大的棒材和板材的具体消费情况,对分析汽
<正>"高高乌蒙山呀!长长金沙江,咱们彝州美呀!楚雄好地方……"每次听到楚雄电视台滚动播出的这首歌曲,我的整个身躯都会游离到楚雄鹿城名川秀水和繁华的都市中去,那一刻,"我
期刊
存款保险制度是国家为维护银行信用、保护存款人利益、稳定金融秩序而建立的金融保障制度。日本在20世纪70年代初步建立了存款保险制度,其后几经改革,最终形成了由政府与银行
在当前互联网盛行的时代,自媒体新闻、互联网技术等,对传统媒体的发展模式和新闻传播方式产生了较大的影响,受到互联网、自媒体的影响,传统媒体的发展面临巨大的挑战。微博、
经前门或后门耦合的电磁脉冲,尤其是上升沿为纳秒级的快脉冲,会在电子设备内部产生快上升沿,大幅值的电压或电流脉冲,会导致电子设备不能正常工作甚至损伤烧毁。由于多数脉冲防护器件的防护参数均针对雷电电磁脉冲,该参数可能不再适用于快脉冲。且防护器件由于自身特性导致在实际应用中存在不足,不仅影响防护能力甚至会影响正常工作,因此准确评价快脉冲下防护器件防护性能具有重要意义。1)基于气体放电管(GDT)、压敏电
在二十一世纪,随着信息技术的快速发展,仅靠传统上的良好的生产效率以及产品高质量已经不能满足快速变化的市场需求,企业若要在激烈的市场环境中生存下来,就需要企业将自身放
随着互联网的普及与移动新媒体的崛起,传统直线传播模式的缺陷逐渐显露,代之而来的是全新互动式传播方式受到青睐,互动式广告应运而生。互动式广告架起了广告主和消费者即时