【摘 要】
:
蛋白质和核酸作为两类生物大分子,二者的相互作用参与了生物体众多的生命活动。研究蛋白质与核酸的相互作用不仅可以观察蛋白质构象在结合中的变化,也可以解析氨基酸分子与核苷酸结合的键能变化来分析二者的结合机制。已有大量研究表明在蛋白质与核酸相互作用的接触面上,有一小部分的氨基酸残基与核酸的结合对结合自由能的变化起到至关重要的作用,这些氨基酸残基称之为热点残基。热点残基作为蛋白质与核酸相互作用自由能的主要贡
论文部分内容阅读
蛋白质和核酸作为两类生物大分子,二者的相互作用参与了生物体众多的生命活动。研究蛋白质与核酸的相互作用不仅可以观察蛋白质构象在结合中的变化,也可以解析氨基酸分子与核苷酸结合的键能变化来分析二者的结合机制。已有大量研究表明在蛋白质与核酸相互作用的接触面上,有一小部分的氨基酸残基与核酸的结合对结合自由能的变化起到至关重要的作用,这些氨基酸残基称之为热点残基。热点残基作为蛋白质与核酸相互作用自由能的主要贡献者,引起了研究者的广泛关注。在过去的几年中,已经发展了一些计算的方法来识别蛋白质-RNA和蛋白质-DNA相互作用界面热点残基。现有的蛋白质-RNA热点残基预测方法大都需要蛋白质的三维结构作为先验知识,而目前已知蛋白质序列的数量远远大于已知结构的数量,因此开发基于蛋白质序列的方法是非常有必要的。而对于已有的蛋白质-DNA热点残基预测工具,大多是运用分子动力学模拟的方法开发出来的,这种方法在处理大规模样本时预测效率不高,且结果不稳定。针对这些局限性,本论文主要通过以下两个工作对蛋白质-核酸作用界面的热点残基预测方法进行改进:1.提出了一种基于序列信息的蛋白质-RNA相互作用界面热点残基预测方法。我们使用了伪氨基酸组成的序列编码方式,考虑到了邻近残基对目标残基的影响,从而可能从整条序列上提取有效信息来揭示蛋白质-核酸互作模式。我们首先利用物理化学属性将蛋白质序列数值化,然后利用伪氨基酸组成的编码方式从每条序列中提取出维数相同的特征向量,结合相对溶剂可及表面积和氨基酸替代矩阵特征,我们用三种分类器(基于径向基核函数的支持向量机、基于sigmoid核函数的支持向量机和K-近邻分类器)构建了最终的集成学习模型。我们的方法最终取得的F1=0.843,MCC=0.657,AUC=0.893。与现有其他工具相比,该方法在独立测试集上的表现是最优的。2.提出了一种基于结构信息的蛋白质-DNA相互作用界面热点残基预测方法。考虑到现有的方法还不能大规模的预测蛋白质-DNA界面上的热点残基,本文利用机器学习的方法构建了一个基于广谱性结构特征的预测工具。我们一共收集了四类特征包括溶剂可及表面积、结构、序列和网络特征共114维,利用随机森林变量选择的特征选择方法筛选出10维最优特征子集,并采用支持向量机构建最终的预测模型。结果表明,我们的方法F1=0.721,MCC=0.531,AUC=0.803。在独立测试集上比较其他方法可知,我们提出的预测方法能够更好地预测蛋白质-DNA界面热点残基。本文提出的两个预测方法与现有的蛋白质-RNA和蛋白质-DNA界面热点残基预测工具相比,性能均有显著提升。本文的研究内容可以为我们理解蛋白质-核酸相互作用机制和相关药物研发提供理论上的指导。
其他文献
优质炼焦煤因其较好的粘结性和结焦性在高炉冶炼行业扮演着无法取缔的角色,但随着煤炭资源的大幅度开采和长期不合理利用,优质炼焦煤资源的储量急剧下降,高硫炼焦煤的占比则
永平油田在区域构造上属于松辽盆地东南隆起区登娄库背斜带北缘上的一个局部构造,该构造被称为扶余Ⅰ号构造,本研究区的油气藏类型复杂并且油气分布规律尚不明确。在利用已有的地震、钻井、岩心以及前人的研究成果上,对永平油田的油气成藏的基本条件进行了研究,总结了松辽盆地南部永平油田油气成藏规律。依据层序地层理论与砂组的划分特征,将泉头组四段划分为4个砂组,并在此基础上利用三维地震数据体,完成对泉四段顶界的构造
近年来,高速铁路凭借超强的运载能力、日益提高的行驶速度等优势得以迅速发展,这对铁路通信质量提出了更高的要求,因此推进LTE移动通信技术在高速铁路无线宽带通信系统中应用已成为当下研究的焦点。但当列车高速行驶时,LTE-R系统通信性能仍会受到多普勒频移、噪声等不利因素影响,故进行有效的信道估计及准确的信号检测是解决上述问题的关键。本文首先通过对LTE-R通信网络架构及物理层关键技术的研究,完成了MIM
现有白光LED用荧光粉因存在发光效率、显色性不足等问题,新材料荧光粉可对现有的荧光粉存在的缺陷进行改善,同时对其发光机理进行深入的探究。本文选取了两种结构不同的铝酸盐LaSrAl3O7、Sr3YAl2O7.5为基质,对其结构及自身发光特性进行探究,通过稀土离子Eu3+,Tb3+的单掺杂和双掺杂制备出颜色可调直至有白光发射的荧光粉。通过凝胶-燃烧法制备铝酸盐基质LaSrAl3O7、Sr3YAl2O7
咔唑/芳胺类发光材料因具有优良的光学性能和空穴传输能力而在有机光电领域具有广泛的应用,其中基于咔唑的长寿命室温磷光材料和基于芳胺的高发光荧光材料成为近年来的研究热
物种的极限分布区域对气候变化非常敏感。作为中国特有树种油松(Pinus tabulaeformis),其人工林生态系统更容易受到气候变化的威胁。为了了解不同气候梯度下油松的生长情况以及气候因子对油松的响应变化,探讨油松分布的适宜气候区域。本文以油松人工林为研究对象,采用树木年代学的方法,测量了油松分布北界55个(人工林)采样点的1227棵油松、2552个样芯的年轮宽度,用负指数和线性拟合曲线进行去
吐哈油田温西三区块是典型的低渗透砂岩油藏,注水开发多年后,含水率接近极限,面临进一步提高采收率的挑战。随着水驱的进行,储层物性发生变化,剩余油赋存位置及动用机理也发
天女木兰(Magnolia sieboldii K.Koch,Ms)是集观赏、药用价值于一身的木兰科落叶小乔木,种子具有深休眠特性,繁育困难。ABA(abscisic acid,ABA)受体PYR/PYL/RCARs基因家族作为ABA信号传导通路的起始组分发挥着重要的作用,对于揭开种子休眠解除的作用机制具有重要意义。本研究基于天女木兰种子转录组数据,筛选出天女木兰中5个AtPYRL同源基因(MsP
丛式井井场动液面监测技术在油田开发生产中有着广泛的应用。无论是在采油、试油还是修井作业中,丛式井动液面的监测都是一项重要的工作,是安全生产、科学生产的重要保障。在
旋风分离器在气固流化床系统中常用于循环催化剂的分离回收,分离器通过料腿将催化剂重新送至流化床层,重新参加气固反应。工业上为保证料腿的正常排料与密封性,料腿长度均较