蛋白质二级结构特征分析与相互作用预测

来源 :哈尔滨工业大学 | 被引量 : 0次 | 上传用户:huodong004
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着人类基因组计划的完成,生物学走向以功能基因组学为标志的后基因组时代。作为后基因组时代的一个研究分支,蛋白质组学的研究扮演着重要的角色,这是由于生物体所执行的各种生命活动都离不开蛋白质以及它们之间的相互作用的参与。随着蛋白质测序技术、X-射线晶体衍射技术和蛋白质功能分析方法的日益发展和成熟,人们可以获得大量的蛋白质序列、结构和功能数据,这给我们创造了一个机会:采用数据驱动的方法来预测未知的蛋白质的结构和功能。本文采用机器学习的方法对蛋白质组学中的一些重要问题进行了深入研究。本文的研究内容包括以下几个部分:第一,首先分析了本文预测中所使用的蛋白质序列的特征属性,包括氨基酸的物理化学特征和氨基酸的组成和位置特性,采用模式挖掘算法为每个物种构建了类似人类语言的词典——蛋白质模式词典,并对每个模式词条赋予相应的二级结构信息。并根据模式词典中的词条采用最少分词思想,应用词网格技术对待预测的蛋白质序列进行切分。第二,在蛋白质二级结构预测中,提出了一种基于蛋白质模式词典的二级结构预测方法,并根据氨基酸的物理化学特征,构建物理化学特征模板,用以弥补词典中未登录词的预测,结合最大熵模型为蛋白质确定最佳的二级结构序列。这种基于蛋白质模式词典的二级结构预测结合氨基酸物理化学特征的方法,在Q3和SOV的评价指标下,取得了较好的效果。第三,在蛋白质相互作用预测中,采用了CTD编码方式解决蛋白质序列长度不一致导致输入向量维数不同的问题。结合支持向量机方法预测蛋白质相互作用。此方法仅需要蛋白质序列,不涉及到蛋白质的先验知识,具有普遍适用的特性。并取得了较好的试验结果。
其他文献
提出采用虚实结合的方法对地铁闸机控制系统进行通行逻辑验证。可根据需求随意控制行人的行走速度、身高体重、携带行李大小、行走过程中的动作等通行要素,并对通行要素排列
ZSM-23是一种具有十元环一维孔道的高硅分子筛。在长链烷烃加氢异构反应中,其适宜的孔道尺寸和独特的孔道结构可以限制多支链烷烃的生成,进而减少裂化反应的进行,提高单支链
文章采用火试金富集,ICP-AES同时测定矿样中金、银、铂、钯的分析方法。确定了测定项目的分析谱线和最佳工作条件。各元素的检出限均小于5μg/L,回收率为97.05%-104.63%,RSD
森林火灾作为最严重的自然灾害之一,给人类带来了严重的经济损失。传统的基于传感器的森林火灾检测技术,检测效果不甚理想,存在大量的误检漏检现象。为此,相关研究人员开展了
透过对古诺及其歌剧作品的研读和分析,结合古典主义与浪漫主义的时代特征,将在"真"与"美"的矛盾与妥协中的古诺所形成的独特的"抒情气质"进行深层思考,并在历史的角度加以定
<正> 资金清算业务是银行的基本业务。从本质上说,银行业务就是资金在帐户间的运动。 按照中国人民银行总行的统一部署,将在全国各地逐步建立金融地面区域网(简称“地网”)。
近日,国务院印发《实施更大规模减税降费后调整中央与地方收入划分改革推进方案》(以下简称《方案》),推出保持增值税“五五分享”比例稳定、调整完善增值税留抵退税分担机制
本文对《现代汉语词典》中有区别词性词义作用的轻声词进行了统计和分类,并从多个角度就如何区分有区别词性词义作用的轻声词和同形的非轻声词进行了初步的探讨。
针对台州电厂10号锅炉引风机多次发生失速的情况,在介绍轴流引风机失速机理基础上,根据实际工况对引风机失速原因进行了分析,认为空预器腐蚀堵塞严重导致管路阻力特性变化、