基于结构数据的蛋白质结合位点的分析与预测

来源 :河南师范大学 | 被引量 : 0次 | 上传用户:tonze5082
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
蛋白质在生命过程中发挥着重要作用,蛋白质往往通过与配体的相互作用,实现其生物学功能,例如细胞遗传信息的传递、细胞代谢、物质运输和信号转导等。因此,蛋白质与配体分子的相互作用研究,对发现蛋白质功能具有十分重要意义。本文首先通过分析和预处理获得了可靠的数据集,然后融合三维几何计算方法与数据挖掘技术,构建出蛋白质结构分析数学模型。我们提出了一种改进的描述蛋白质表面结构形态计算方法,同时结合蛋白质物理化学性质,实现了DNA结合蛋白质(DNA-binding Proteins)和RNA结合蛋白质(RNA-binding Proteins)分类预测,取得了较好的实验效果。此外,针对蛋白质与小分子的复合物数据,分析了蛋白质与小分子复合物的结合位点特征,实现了蛋白质小分子的结合位点预测。全文工作包括两个部分:(1)DNA/RNA结合蛋白结合区域分析与分类预测。蛋白质-核酸的相互作用研究对理解生命活动具有重要意义。我们针对DNA/RNA结合蛋白的结合区域,计算出结合区域中残基周边的分子体积和表面积,然后计算结合区域残基周边的表面形态,依据计算结果将残基分为三种类型:凸起型,平坦型和凹陷型。并进一步获得了蛋白结合区域的溶剂可及性和二级结构特征。通过对比发现,两种核酸结合蛋白的结合区域残基形态结构、溶剂可及性、二级结构存在显著的差异。基于这些特征构建出SVM分类预测模型,运用10折交叉验证方法进行分类预测,取得了较好的分类结果。(2)蛋白质与小分子结合位点的特征挖掘及分类预测。蛋白质与小分子结合位点的研究对药物研发及设计具有重要意义。目前传统的检测蛋白质小分子的结合位点的实验方法,费用高昂且耗时耗力,例如针对某一特定配体的蛋白质小分子开发的研究工具往往存在效率较低,难以推广使用的缺点。文章中,我们提出了一种基于XGBoost模型的分类预测方法,通过分析蛋白质的进化信息、物理化学性质,获得了高维的序列特征,使用平均降低准确率法(mean decrease accuracy)筛选出重要特征,最终构建的分类模型,取得了非常显着的预测效果。
其他文献
提出一种对旅行时进行抛物线插值的地震射线追踪方法(简称PTI方法),它比基于旅行时线性插值方法(简称LTI方法)计算结果更准确.PTI和LTI方法都是基于2D网格单元模型,用于计算地震波的旅行时和射线路径.首先介绍了相关方法的一些基本概念.旅行时和射线路径都是在网格边界上进行计算的,因此,射线路径在同一恒速网格内是直线.其计算过程有两步.第一步,计算旅行时,第二步追踪射线路径.然后给出了LTI算法
对油底壳零件的压装工艺要求进行了详细分析,对压装专机的结构设计、压装夹具设计、液压气动控制系统的设计和工作原理,进行了深入的分析和阐述,并对优化设计后的压装效率更高的
主动配电网作为分布式发电和需求侧管理资源的重要集成平台和有效管理途径,已经成为了智能配电网研究领域的前沿。主动配电网故障恢复作为主动配电网的关键技术问题,关系到系
为了提高冲击破岩掘进机喷雾降尘效率、改善工作面环境和安全状况,建立了适合分析影响降尘效率因素的数学模型,利用Matlab仿真分析影响降尘效率的主要因素。降尘效率随粉尘颗
随着经济全球化的发展,各个国家之间的贸易日渐频繁。参与国际贸易的国家都能从国际贸易中获得收益。然而,每个国家在参与经济全球化的国际贸易时,并没有因为能从国际贸易中
<正> 二次世界大战后,神经化学传递学说在基础医学方面还是一个新兴的课题,但40年后神经递质的研究便取得了显著的进展。在十九世纪40年代,还仅对末梢的神经递质的乙酰胆硷及