基于距离约束的蛋白质空间结构预测

来源 :苏州大学 | 被引量 : 0次 | 上传用户:riyueshen1969
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
蛋白质作为生命活动的重要承载者,它的结构对于生物学和医学研究有着重要的意义,利用计算手段预测蛋白质结构逐渐成为生物信息学的重要课题。本文的研究内容是从一级结构提取距离约束,并将距离约束应用到蛋白质三级结构预测中。蛋白质的空间结构是由残基间的相互作用决定的,残基之间存在很多约束,这些约束中又包含了很多重要的结构和功能信息。本文基于对蛋白质进化配对信息,采用机器学习方法,将进化配对训练成距离约束,从而将粗粒度的进化配对转化成细粒度的残基间距离约束,为蛋白质结构预测提供了相对精确的约束条件。本文采取了一种新的采样方法,即改进的混合蒙特卡洛算法,将学习到的距离约束加入采样方法中,对构象空间的三维坐标进行采样,并通过距离约束控制采样。当距离约束加入到采样过程中时,采样的精度得到了提高,并能够得到相对较多的近天然结构的构象。
其他文献
Domain理论由D.Scott在20世纪70年代初建立,其目的是为计算机程序设计语言的指称语义学提供数学模型.其中序与拓扑的相互作用,相互结合是这一理论的基本特征.正是这一特征使D
状态估计是配网监控调度中心的核心功能。其目的是根据系统网络结构和量测数据来获取配电系统实时准确的运行状态,以便对配电系统的运行进行调控,从而预防安全事故发生,保证系统安全经济运行。当前较为广泛使用的是基于传统加权最小二乘法的静态状态估计,该方法只能反映单个时间断面的系统状态,无法呈现动态多时间断面的数据特征。卡尔曼滤波的出现可以满足动态系统状态估计要求,并在系统运行趋势预测中占有重要地位。本文对配
中国的A股市场具有我国的特色。本文旨在构建股票上涨期间不同板块交替上行中技术特征的识别方法,用来指导投资者把握不同时间强势板块的轮动,从而指导投资者踏准上涨过程中
对采自内蒙古自治区鄂尔多斯库布齐沙漠对三种样地中379个蜥蜴胃的内容物进行分析,其中草原沙蜥(Phrynocephalus frontal is)47只,密点麻蜥(Eremias multiocellata)48只,丽斑
随着工业化进程的发展,近年来我国水体藻类水华污染严重,大量繁殖的藻类释放出大量有毒的藻毒素。藻毒素是一种肝毒素,它对水环境和人的身体健康已经造成不可忽视的危害。因
自工业革命以来,由于人类的活动大气中CO_2浓度持续增加,导致环境问题日益严重,对城市气候以及生存环境带来了显著影响。因此减排增汇成为可持续发展中的重要内容。城市绿地作为城市重要的自然生态系统,是城市生态系统中所存在唯一的自然碳汇。绿地能够通过其自身的光合作用固碳释氧,从而减缓城市区域内气候恶化的趋势。因此在城市边界内,植物群落的碳汇作用对城市碳循环有积极影响。同时,在城市中的植被也因自身的相关措
河岸带生态系统在陆地与河流相交边界的两侧到不受河水影响的位置,属于陆生生态系统与水生生态系统的生态过渡区。河岸缓冲带在涵养水源和保持水土等方面具有重要的生态服务功能。河岸带生态系统在增加动植物物种种源、提高生物多样性和生态系统生产力、治理水土流失、稳定河岸、调节微气候、美化环境、开展旅游活动等均有重要的现实和潜在价值。河岸带独特的植被、土壤、地形、地貌和水文特性决定生态系统独特性、复杂性与动态性。
随着我国经济的高速发展,城市化水平逐步提升,促使我国的基建业和城市建设日益繁荣。我国的工业发展水平逐步进入中后期阶段,铁矿石作为工业生产主要原料之一,对铁矿石价格进行准确的预测和掌控,可以在铁矿石价格谈判时提供重要参考依据,同时为钢铁企业提供一个反映铁矿石市场情况的指示器。首先,通过分析全球以及我国的铁矿石供需市场的发展现状,明确了铁矿石供需市场的格局。并且从供需、成本、政策、市场类型和金融五个角
最近,垃圾分类成为人们关注的焦点。截止目前我国已有46所城市开始严格执行垃圾分类政策。Reduce,Reuse,Reimagine:Sorting outthe Recycling System(《少排放,重利用,再构想:重整回收系统》)一书对中国当前的垃圾分类有一定的借鉴意义。本翻译实践报告所选材料来自该书的第一章和第九章,第一章主要介绍了再循环生态系统的重要性;第九章主要向人们介绍了垃圾分类的
随着现代科技发展,人工智能技术的研究受到广泛的关注。基于数据的机器学习是其重要的研究内容,即从收集的数据样本中学习规律,并且使用这些规律对未来观测数据或无法观测的事物进行预测。然而现实环境中存在大量的繁琐复杂的现象与事物,随着收集观测事物的数据信息的增多,“维数的诅咒”随之出现,它指的是,在缺乏简单假设的情况下,估计一个具有多个变量的函数达到一定精度所需的样本量在变量数量上呈指数增长。高维数据虽然