基于智能计算模型的蛋白质功能位点的预测

来源 :中国科学技术大学 | 被引量 : 0次 | 上传用户:daiguangying
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
计算机和网络技术的飞速发展,为分子生物学研究提供了新的强大于段。蛋白质功能位点的预测因其在医学特别是在揭示生命奥秘、功能蛋白质组学研究方面具有重要意义,引起了生物和医学工作者的极大关注。利用生物实验手段获取蛋白质功能位点是非常耗时耗力的,这就要求我们借助于计算的手段从序列预测其功能位点。对于蛋白质翻译后的磷酸化修饰位点和酶的催化活性位点的预测问题,本文提出了两个基于智能计算模型的预测方法。其主要内容和贡献包括: (1)蛋白质磷酸化位点预测蛋白质磷酸化作为翻译后修饰的一种,目前常见的预测方法主要有基于组的GPS方法、基于Bayes决策论的PPSP方法和基于支持向量机(SVM)方法和隐马尔可大方法(HMM)等机器学习方法,它们基本都依赖于序列保守性特性。本文提出了融入蛋白质结构信息的基于BP神经网络模型的预测方法。有关文献表明,磷酸化位点更倾向于出现C(Coil)形式二级结构和B(Buried)形式三级结构。我们实验评价标准MCC的值为0.87,优于Scansite2.0和PredPhospho预测方法。在此基础上,我们进一步提出了两阶段神经网络模型的预测方法,第二阶段的模型去提炼第一阶段的结果,对于蛋白激酶PKA,我们得到的灵敏度和特异性分别为93.26%和94.14%。 (2)酶的活性位点预测酶作为一种特殊的蛋白质,对化学反应起到加速催化作用。它的催化活性位点是这一功能的重要参与残基。到目前为止,关于活性催化位点的预测有多序列比对方法、计算几何方法、演化跟踪方法以及能量函数计算方法等,但是都没有给出令人满意的结果。本文提出了基于朴素贝叶斯模型的方法,并且使用了新的残基二级结构属性,给出了比较满意的预测精度和时间效率,灵敏度和特异性分别为:88.6%,93.7%。实验证实了恰当的模型选择、充足的数据集以及合适的输入属性(残基属性)对提高预测精度和时间效率都起到积极作用。 本文工作的特色和创新在于:①考虑到了结构和功能的关系,融入二级结构和二级构信息,并且给出了一定的简化表示方法。对于二级结构我们只考虑了H、E、C三种状态;三级结构也只考虑了E、B两种状态。除此以外,在神经网络基础上,增加到两个阶段,并且融入了磷酸化修饰的模体信息,第二阶段对第一阶段的结果进行了提炼;②首次运用朴素贝叶斯统计分类模型来解决酶的活性位点预测问题。在其输入参数中,不仅充分考虑到了序列保守性特征,而且更多的结构信息、残基生化属性也被考虑。七种状态较为详细地描述了氨基酸的二级结构。关于三级结构,我们从更多的角度体现它,使用了残基溶剂可访问性值、表面裂口信息以及反映残基弹性的B-Factor值。这个模型和方法给我们预测其他功能位点(磷酸化位点、蛋白质与蛋白质相互作用位点)提供了很好的参考,同样适合他们的预测。
其他文献
电子商务系统是依赖网络实现的商务系统,需要利用Internet基础设施和标准,于是电子商务系统底层即网络层就成为了各种电子商务应用系统的基础。由于它提供了信息传送的载体和用
如果认为分布式计算为计算模式提供了一片新的天地,那么Web服务出现则使得分布式计算从研究到应用跨出了重要的一步。Web服务以其低耦合性、易用性、复用性和组合性,为可复用性
随着计算机网络的快速发展,信息安全变得越来越重要。为了保证信息系统的安全性,密码技术被应用于信息系统中。在密码技术中,需要众多的算法和协议,它们都需要敌手不知道、也无法
纹理技术在影视娱乐、工业设计和虚拟仿真等方面有广泛的应用,关于纹理的研究一直是计算机图形学、计算机视觉以及图像处理领域的研究热点。基于样图的纹理合成是继纹理映射技
机动目标跟踪在军事和民用领域有着广泛的应用。国内外许多专家学者对之进行了深入的研究,取得了丰硕的成果。由于跟踪环境和目标机动性能发生变化,各种应用系统对机动目标跟踪
无线多跳网络是一种有特殊用途的对等式网络,具有无中心、自组织、可快速展开等特点。多播在无线多跳网络中扮演着重要的角色,目前已成为研究热点之一,本文主要分析和研究了无线
公开密钥基础设施(Public Key Infrastructure,PKI)是以公钥密码系统为基础、提供安全服务的通用性安全基础设施,在网络传输与信息保密过程中提供密钥的产生、分发、管理、撤
在平面上嵌入一棵树T,T的每个内部顶点的度数至少为3并且T至少有一个内部顶点。作一个圈C连接T的所有叶顶点,T的所有叶顶点组成C上的所有顶点。这样得到的平面图称为Halin图。
高斯混合(GMs)函数表示图象内容是一种流行的方法,它比直方图方法能够更有效地描述图象内容,基于GMs的距离度量算法的研究已经成为基于内容图象检索的研究热点。本文主要研究基
本文以综合风险防范领域为研究背景,围绕空间数据集成、数据共享、空间数据库引擎等关键技术展开研究,完成了空间数据和属性数据的无缝集成;设计并实现了综合风险防范数据库管理