信息度量的蛋白质序列、结构、质谱数据研究

来源 :大连理工大学 | 被引量 : 1次 | 上传用户:zcktjbb
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
蛋白质是生命机体的基本组成成分,是连结分子运作和生物功能的主要组成部分,因此对蛋白质的研究有助于理解分子机理,更加清晰的了解生命活动的规则。目前,运用数学、信息学、计算机科学等学科的工具对蛋白质进行研究的生物信息学——蛋白质组学已经成为异常活跃的研究领域之一。本文以信息论方法和优化方法为工具,以蛋白质序列、蛋白质结构、人体组织的蛋白质组为研究对象,以提取蛋白质序列、蛋白质结构、蛋白质组的可区分表达的特征信息为目的,主要针对蛋白质序列比较及其应用、蛋白质结构比较和质谱数据分类这三个方面进行了研究。本文的主要研究成果如下:在第二章,首先针对蛋白质多序列比对问题,建立了多序列比对的整数规划模型,证明了该模型最优解的存在性,并且构造了优化算法用于求解该模型;根据氨基酸的亲疏水性质,构造出蛋白质磷酸化位点周围的亲水残基序列间隔分布来模拟磷酸化位点周围的物理化学环境,同时设计了预测磷酸化位点的算法;再者针对外膜蛋白和其他膜蛋白及球蛋白的区分问题,利用蛋白质的子序列分布和FDOD函数进行了研究,此方法在一些公用数据集上的分类精度高于已有的一些算法。在第三章,主要研究了蛋白质结构比较问题。首先基于完全信息集的概念,提出了一种蛋白质结构描述方法——中心碳原子距离序列的子序列分布表示,并基于这种表示方法和FDOD函数,给出了一种蛋白质结构的偏差度量,并设计了一种蛋白质结构比较方法,应用该方法对一些公用数据集进行了聚类分析,取得了较好的聚类结果,表明了该方法的有效性。其次,用间隔为3的中心碳原子的距离分布来近似刻画蛋白质结构的局部几何,用中长程作用的线陛序列分布来刻画蛋白质结构的整体拓扑,给出了一种蛋白质折叠的几何-拓扑混合表示,并基于这种表示和FDOD函数,给出了一个蛋白质结构的偏差度量,设计了一种新的蛋白质结构比较方法和分类方法。应用这种方法对一些公用数据集进行了聚类分析和分类试验,取得了较好的聚类结果和分类结果,表明了该方法的有效性;最后,在功能预测实验平台上,基于蛋白质结构的接触向量表示,系统比较了FDOD函数、交叉熵和欧式距离三种度量,试验结果表明:FDOD函数更适合于度量接触向量表示之间的偏差。在第四章,以人体组织的蛋白质组为研究对象,应用基于FDOD方法的分类器对癌症病人和良性携带者的蛋白质质谱数据进行了分类,分类精度令人满意;以分类精度高且使用的特征少为目标,建立了质谱数据特征选择问题的多目标规划模型,将该多目标规划模型转化为了一个单目标规划模型,并简单分析了该模型最优解的存在性。
其他文献
目的:溃疡性结肠炎(UC)是一种漫及结直肠的慢性非特异性炎症,以长期持续或间断发作的腹泻、粘液脓血便等为主要临床症状。中医理论认为UC是以脾胃虚弱为本,以湿热蕴结、瘀血
[目的]观察经皮后凸椎体成形术后残留腰背痛中药熏洗治疗的效果。[方法]将收治的经皮后凸椎体成形术后残留腰背痛病人60例随机分为对照组和观察组各30例,对照组给予常规术后
箱型主梁的焊接工艺是保证起重机桥架质量的重要因素,介绍了双梁桥式起重机主梁制作工艺。采用4次函数曲线确定主梁起拱的程度,翼板和腹板对接过程中采用陶瓷衬垫实现焊缝单
目的探讨原发性高血压患者颈动脉内膜-中层厚度(intima—media thickness,IMT)与肾动脉阻力指数(resistance index,RI)、搏动指数(pulse index,PI)的相关性,及其对高血压患者的临床意义
2009年,国务院在充分考虑中国国情,调研农村实际情况,总结以往实施农村养老保险经验的基础上,开始在全国10%的县(市、区、旗)进行新型农村社会养老保险试点工作,以后逐步推广,到2012
在文献综述的基础上,界定技术创新文化定义,明确技术创新文化内涵分析框架:技术创新观念文化、技术创新制度文化和技术创新行为文化;应用此框架深入分析日本技术创新文化内涵,日本
电煤采购决策是发电行业管理决策的重要组成部分。将运筹学范畴的运输问题模型引入决策,对模型建立、预处理、求解等步骤进行了研究。探讨了在不同目标函数和约束条件下的模
近年来,国外关于不同的注释方式对二语附带性词汇习得的研究越来越多。但国内研究却寥寥无几。本文对国外的相关研究做了全面回顾,并发现:复合式的注释比单一的注释对附带性
2002年底,在我国南方发现了一种新型的传染性严重急性呼吸系统综合征(severe acute respiratory syndrome,SARS),并波及众多国家和地区,引起广泛关注。随后经过各国研究者通力
化学计量学是一门新兴发展的交叉学科,它运用数学、统计学和计算机科学等方法设计最优化学量测策略,通过对化学数据的分析处理最大限度地获取化学及相关信息。当前化学计量学