基于序列特征组合与核非线性回归预测蛋白质折叠速率

来源 :大连交通大学 | 被引量 : 0次 | 上传用户:gg5921
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
蛋白质是一类重要的生物大分子,是生命活动的主要承担者,也是构成细胞的基本有机物。蛋白质可凭借相互作用在特定的酸碱度、温度等环境下自己组装自己,获得其功能性结构和构象的过程称为蛋白质折叠。而蛋白质折叠速率是一个衡量蛋白质折叠快慢的重要参数。理解蛋白质折叠速率对探索蛋白质折叠机制具有深远意义。近些年,很多科研人员给出了预测蛋白质折叠速率的方法和基于这些方法的多种不同特征参数。本文基于序列特征组合与核非线性回归对蛋白质的折叠速率进行预测,主要工作包括以下两个方面:1、依据氨基酸的物理化学性质和氨基酸序列结构特征在不同类别的蛋白质中的作用,选取氨基酸的9种物化属性,将它们和氨基酸序列的LZ_c复杂度特征值进行组合来表征蛋白质。利用蛋白质的多维特征向量建立多元核非线性回归模型,用该模型计算了83个蛋白质的折叠速率预测值。由Jack-knife检验方法分析了在不同类别的蛋白质中不同组合特征值与相应折叠速率之间的相关性。实验结果表明:多元核非线性回归模型其预测精度及可行性高于线性回归模型,计算复杂度低和方便易操作等优点。2、考虑到氨基酸的共识疏水性、?-螺旋的趋势、一个电源在?-螺旋的N末端、骨干二面角概率、金属结合倾向参数、平均远距离接触和序列复杂度对蛋白质结构和功能的影响,选取并融合这些特征参数来表征蛋白质序列,得到蛋白质序列的多维特征向量。通过蛋白质折叠速率实验值与蛋白质的特征向量之间建立多元核非线性回归模型,计算了29个二态蛋白质和35个多态蛋白质的折叠速率预测值。经jack-knife检验,二态蛋白质、多态蛋白质的折叠速率与这些特征参数之间有很好的相关性,印证了这些特征值影响不同折叠类型蛋白质的折叠速率。
其他文献
三维颅面数据配准,就是寻找大小和姿态都不一样的颅面模型间点与点的一一对应,实现目标颅面和参考颅面上点与点的精确匹配。目前颅面配准方法依赖于手工标定的特征点,费时费
随着大数据时代的到来,互联网上的信息飞速地增长,这在给人们更多选择的同时,也带来了信息过载问题。推荐系统就是在这种背景下产生的。融合社交网络信息的社会化推荐算法是
学生课堂问题行为普遍存在,尤其在技工学校文化基础课程中,学校重技能教育而忽视文化基础课程教育,学生对文化课堂不重视,对课程内容缺乏兴趣,问题行为尤为突出。这些问题直
表面等离子体激元(Surface plasmon polaritons,SPPs)是一种特殊的电磁波,它在金属-介质界面产生,并沿着界面传播。研究发现SPPs能够克服衍射极限的限制。因此对SPPs的研究能
啦啦操是一项具有独特魅力的体育项目,在中国发展数10年的历程中,啦啦操以其团队协作、奋发向上、自信热情于一身的特点,从刚开始的仅限于高校体育项目发展到成为今天青少年
Michael加成作为一种重要的C-C(X)键形成反应一直受到广大化学工作者的青睐,并被广泛深入地进行研究。而“一锅法”在有机合成中可快速增加分子的复杂性且无需分离反应中间体
光线被近地大气中各类尺寸的气溶胶分子散射与折射,结合一定的温湿度条件致使雾、霾等复杂天气出现,导致计算机视觉系统获取的初始图像严重退化,对比度低,无法采集到足够的信
作为一种新型建筑材料,纤维混凝土被广泛应用于工程中。目前纤维增强混凝土主要选用短纤维,但随机方向分布在混凝土内的短纤维利用率较低,对混凝土的增强效果有限,而纤维织物
介观层次的描述方法已经越来越广泛被用于研究实际的生化反应系统。已有研究表明,细胞内的许多生化反应过程存在大量不可避免的噪声,介观尺度上的系统噪声会使得具有相同基因
图像作为接受信息和传递信息的最主要媒介之一,在现代人们的日常生活、航空航天、医疗诊断、军事公安以及其他科学领域中发挥着至关重要的作用.然而在实际应用中,由于成像系