用于蛋白质二级结构设计的深度生成模型的研究与应用

来源 :北京交通大学 | 被引量 : 3次 | 上传用户:LFBLLFBL
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
目前国内外对蛋白质二级结构的研究方向主要是预测,即给定蛋白质的一级结构序列来预测其所属的二级结构。本课题提出了一种新的研究思路——生成特定的蛋白质二级结构。从预测到生成,这对蛋白质二级结构的研究是一种理论上的创新,同时也为生物工程和生物制药等提供了便利,具有实际意义。另一方面,深度生成模型在图像、文本等方面的已经取得了一定的成果,而在生物序列方面的研究较少。本课题在生成蛋白质二级结构的研究中选择使用深度生成模型,这也是深度学习方法在生物序列生成中的尝试与应用。为了实现蛋白质二级结构的生成,本课题做出以下几个贡献:(1)构建了完备的蛋白质二级结构数据集。在PDB数据库中下载蛋白质数据文件,并提取出其中的二级结构数据,同时,针对不同的模型进行不同的数据预处理与编码,最终得到适用于模型的训练集;(2)验证了一般性的LSTM网络不适用于蛋白质二级序列的合成。本课题构建了一个LSTM网络,通过生成二级结构序列作为对比,我们在实验中发现LSTM生成的样本重复率高、多样性差,精确率的均值较低、标准差较高。该实验结果表明一般性的LSTM网络不适用于蛋白质二级结构的生成,因此本课题还需要设计更好的蛋白质二级结构序列生成模型;(3)提出了一个新的算法ssp-SeqGAN,用于生成高精度的蛋白质二级结构序列。和SeqGAN方法类似,我们采用了基于强化学习结合GAN的方法。SeqGAN是生成离散序列的一般性算法,它不适用于直接生成高精度的蛋白质二级结构序列。为了解决这个问题,首先,我们重新设计了判别器D的网络结构,在CNN的池化层之前与全连接层之前分别加了 BN层,得到模型SeqGAN-BN;第二,我们在SeqGAN-BN的基础上改进了模型的预训练方式,得到新的模型ssp-SeqGAN。ssp-SeqGAN的主要贡献是提出了新的具有更高多样性与对抗性的负样本的构造方式,有效的提升了预训练的结果。实验结果表明一般性的LSTM生成序列的精确率仅略高于随机生成的序列,其不适用于蛋白质二级结构的设计。我们提出的新模型ssp-SeqGAN生成序列的精确率比SeqGAN有了显著的提升,并且其精确率的标准差较低,证明了 ssp-SeqGAN可以稳定地生成具有较高精确率的样本。综上,本课题提出了一个用于设计蛋白质二级结构序列的深度生成式模型ssp-SeqGAN。在生成蛋白质二级结构序列的研究中,ssp-SeqGAN比现有常规序列模型LSTM以及用于生成离散序列的模型SeqGAN相比均有更好的效果。
其他文献
纳米银作为一种新型材料,具有抑菌、导电、催化等多种优点,而广泛应用于信息、医疗、能源、制造等多个方面。近年来研究显示,纳米银对多种细菌具有良好的抑菌性,因此有很大的
【正】 一、目前汉字笔画笔形检字法的混乱现象非常严重。建国以来,特别是近十余年来,新编、修订或重印的各种工具书,对于汉字笔画笔形的排列,真是五花八门,极不一致,缺乏统
设置4个NaCl浓度梯度(0、0.3%、0.6%、0.9%),对12份燕麦种质进行萌发期耐盐性研究和评价,以期筛选出耐盐性较强的燕麦种质材料。结果表明:不同的燕麦种质材料对盐胁迫的耐受
目的总结基层医院胃癌及早期胃癌筛查水平。方法回顾分析上海市金山区中心医院枫泾分院自1992年1月~2007年12月接受电子胃镜检查患者的胃癌筛查结果。结果16年间因症状共行胃
<正> 众所周知,高速钢的马氏体(M)针是较难看到的。淬火高速钢在金相显微镜中只能看清的是原奥氏体的晶界及未溶的碳化物。这是由于高速钢的M合金化程度较高,不易受一般的浸
当前理工类院校"思想道德修养与法律基础"实践活动开展存在理工专业特色不够鲜明、践行效果缺乏有力监督、考核考察方式较为陈旧等问题。任课教师缺乏因校备课施课意识、课程
词汇不仅是语音、语义、语法的载体,还是语用和文化的载体。传统的词汇教学,基本上是结合课文来讲解,老师用满堂灌的方式进行教学,基本上以老师为主体,忽视学生的主观能动性
文章对洗钛废酸(含硝酸、硫酸、氢氟酸)与钛铜复合棒封顶残余铜料、废旧金属铜反应制取国标二级五水硫酸铜的生产工艺进行了研究,对生产过程中产生的废液、废气阐明治理方案,
将3年生‘大富贵’芍药于2003年11月5日用不同浓度的赤霉素(GA3)和生根粉(ABT)喷淋根部后上盆,置背阴处直至2004年2月5日移入温室促成栽培,于4月2~22日先后开花.调查结果表明,
当前,碳酸饮料企业要反思在战略竞争中的趋同性思维,践行多元化发展思路,推动企业创新实践工程,促使每个碳酸饮料企业在竞争中找准自己的战略方向和管理模式。文章在波特五力