论文部分内容阅读
蛋白质折叠规律研究是生命科学重大前沿课题,折叠分类是蛋白质折叠研究的基础。目前的蛋白质折叠类型分类基本上靠专家完成,不同的数据库分类并不相同,因此迫切需要建立一个基于统一原理的蛋白质折叠类型分类方法及分类数据库。我们在前期蛋白质折叠研究中,以核心结构的拓扑连接和空间排布为依据,建立了统一原理的蛋白质折叠类型数据库LIFCA,为蛋白质折叠分类方法研究奠定了基础。本文基于LIFCA数据库,提出了一种新的折叠类型分类方法,用于β类蛋白质折叠类型分类。研究内容主要包括以下几个方面:1. β类蛋白折叠类型模板信息数据库的构建在蛋白质折叠类型分类数据库LIFCA中,选取了样本量大于2的31种β类蛋白质折叠类型。通过结构特征分析,确定了31种折叠类型对应的模板,并从DSSP数据库中提取相应模板的特征参数,形成β类蛋白折叠类型模板信息数据库。2. PH domain-like barrel折叠类型分类方法的建立和评价以PH domain-like barrel折叠类型为研究对象,选择序列相似度小于25%的61个样本组成实验集,利用该折叠类型模板与待测蛋白的空间结构比对信息,提出了一个新的折叠类型打分函数Fscore,建立了基于Fscore的蛋白质折叠类型分类方法并用于该折叠类型的分类。用此方法对Astral1.75中序列相似度小于95%的16711个样本进行检验,分类结果的特异性为99.97%。结果表明:特征参数抓住了折叠类型的本质,打分函数Fscore及基于Fscore建立的分类方法可用于PH domain-like barrel蛋白质折叠类型自动分类。3. β类蛋白折叠类型的分类检验及软件实现LIFCA数据库中,样本量大于2的β类蛋白折叠类型有31种,样本量总数为574。利用β类蛋白折叠类型31种模板信息和Fscore打分方法,对574个样本进行敏感性检验和特异性检验,并与TM-score方法的结果作比较,敏感性检验与TM-score结果相似,特异性验结果优于TM-score结果。上述折叠类型分类方法,可以通过LIFCA-Fscore程序实现自动分类。β类蛋白折叠类型分类方法的建立,可为其它蛋白质折叠类型分类方法的研究提供指导,并为进一步的蛋白质折叠类型自动分类方法的建立奠定基础。