多肽/蛋白质序列特征提取及其应用

来源 :湖南农业大学 | 被引量 : 0次 | 上传用户:JEEFHARDY
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
实验确定抗菌肽类似物生物活性和蛋白质磷酸化位点费时费力费钱,因此根据现有数据采用定量序效模型(Quantitative Sequence-Activity Model, QSAM)研究抗菌肽序列与生物活性间关系、建立自动化预测蛋白质磷酸化位点方法非常重要,能为多肽类药物的设计与合成和蛋白质磷酸化组学研究提供指导信息。特征提取和建模方法是抗菌肽QSAM与蛋白质磷酸化位点预测的关键步骤。多肽/蛋白质一级结构即氨基酸序列决定其结构与功能,且高级结构甚难测定,因此在多肽/蛋白质结构与功能预测时,直接基于氨基酸序列提取特征更具实际应用价值。基于统计学理论与结构风险最小的支持向量机(Support Vector Machine, SVM)是机器学习领域的集大成者,包括支持向量分类(Support Vector Classification, SVC)和支持向量回归(Support Vector Regression, SVR)。SVM在大样本时训练建模极为耗时,松弛变量核密度估计(Relaxed Variable Kernel Density Estimation Algorithm, RVKDE)是大训练样本时SVM的合适替代者。本文在简要介绍现有多肽/蛋白质序列特征提取方法的基础上,发展了几种新的序列特征提取方法,基于SVM或RVKDE将其应用于抗菌肽QSAM建模或蛋白质磷酸化位点预测,结果报道如下:1.抗菌肽QSAM建模。本文整体考虑多肽/蛋白质一级结构,提出了三种仅基于氨基酸序列、计算简便、适于不等长氨基酸序列、可捕获多肽/蛋白质序列上下文关联特征的序列特征提取新方法:氨基酸理化性质地统计学关联(Geostatistics-Amino Acids531properties, GS-AA531)、多尺度组分与关联(Multi-Scale Component and Correlation, MSCC)、氨基酸理化性质地统计学关联与多尺度组分的组合GS-AA531-MSC。将其应用于两个抗菌肽体系(等长肽与不等长肽)的序列特征提取中并以SVR建立QSAM模型。模型的拟合、留一法、独立测试结果表明,结合特征选择的新方法GS-AA531与GS-AA531-MSC预测精度明显稳定优于其他参比方法,在多肽QSAM研究中有广泛应用前景。2.蛋白质磷酸化位点预测。蛋白质磷酸化作为一种极为重要的蛋白质翻译后修饰,几乎参与了生物体内的所有生命活动过程。本文提出了统计序列外部特征的统计差表(Statistical Difference Table, SDT)、统计序列内部特征的多尺度组分与关联特征(MSCC)与统计差的组合特征MSCC-SDT等两种新的多肽/蛋白质序列特征提取方法,基于RVKDE或SVC建模,将MSCC、SDT、MSCC-SDT三种特征提取方法应用于蛋白质磷酸化位点预测研究中。在经典数据集Phospho.ELM上的预测结果表明,基于三种特征提取方法的模型预测性能分别是MSCC-SDT>MSCC>SDT,与AutoMotif Server AMS, NetPhos, DISPHOS, PHOSIDA和Scansite等几种激酶独立的在线网站预测结果比较:MSCC-SDT稳定优于所有在线网站预测结果,MSCC优于大部分网站结果,SDT仅优于少数网站结果。因此综合序列内部特征(MSCC)与外部特征(SDT)的组合预测方法更适合于蛋白质磷酸化预测研究。
其他文献
虚拟化技术是服务器相关技术中非常基础的一项。虚拟化技术使得在单台服务器上可以运行多台虚拟机,高效复用了服务器各项资源。在大规模系统上,业务对内存的要求比较高,这时
区域性水环境问题具有跨界性、广泛性、治理长期性等特征,加强对区域性水环境问题的合作治理是当前水环境治理重要的实践和研究方向。本文选取白洋淀这一典型案例,基于多元主
牡丹江大桥已建成30多年,其为双向四车道。随着改革开放后经济的高速发展,现役的牡丹江大桥已无法满足日益增加的交通流量的需求。为此牡丹江市政府组织专家论证,拟将其进行
目的 制备小鼠肝癌H22细胞与树突状细胞(DC)相融合、经筛选获得新的高表达共刺激分子的杂交瘤苗H22-DC,并分析H22-DC的生物学特性及诱导特异性CTL活性。 方法 利用Metrizamid
输电线路作为供电过程中最重要的一个部分,在输电的过程中有着非常重要的作用。尤其在一些偏远地区,输电线路的大面积铺设可以很好地解决人们的用电问题。供电系统的管理问题
智能水凝胶是一种能对外界刺激作出响应的一类软质材料。其中,电场响应性水凝胶是一种以电场为外界刺激源的智能水凝胶。这一类水凝胶通常在电场作用下其自身的物理、化学性
"十三五"期间,"数字出版"首次被列入国家"十三五"规划纲要,成为国家顶层设计。同时地方高校也在国家高等教育"十三五"规划下正在实现转型发展。学报的发展应适应双重转型发展
目的:探讨TGFβ1、TGFβRⅠ和TGFβRⅡ在肝细胞癌(HCC)发生发展过程中的作用及其与HBV感染的关系。 方法:运用免疫组织化学SABC法对36例HCC和42例HCC癌旁肝组织的转化生长因子
“点化”原为道家用语,其后“点化”成为一种修辞手法,是一种引用方式。点化理论散见于历代文论、诗词话中,与点化有关的研究多是围绕点化理论本身和点化与其他修辞方式的区
目 的: 检测HPV16/18 E6、p53、p21WAF1、PCNA在喉癌中的表达水平,研究其表达的相关性及与临床、病理参数的关系,探讨HPV在喉癌病因学中的作用及作用机理。方 法: 选取喉癌