质谱蛋白质组中肽段及其修饰鉴定算法研究

来源 :中国科学技术大学 | 被引量 : 0次 | 上传用户:canyang419
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
蛋白质组学(Proteomics)已经成为当前生命科学研究新的主旋律,其中的蛋白质序列鉴定对于系统了解蛋白质的结构、功能及进化关系等生物学知识具有十分重要的意义。质谱技术具有高灵敏度、高准确度、易于自动化等特点,基于质谱议的鉴定方法已日渐成为蛋白质组学中一个标准的方法平台。质谱蛋白质组中肽段及其修饰鉴定问题涉及海量数据处理和分析,目前有多种计算方法,其中最流行的就是数据库搜索方法。该问题研究可以分为两类:无修饰的和含有修饰的肽段鉴定,本文分别给出了这两类问题的串联质谱鉴定算法。   1.无修饰的肽段鉴定   RT-PSM算法是近年提出的一个非常优秀的鉴定算法,该算法在保证较高的灵敏度和特异性同时,其鉴定时间相对于SEQUEST和X!TANDEM有较大减少。本文在RT-PSM算法的基础上,设计了一个肽段鉴定算法FPI-PSM。FPI-PSM对蛋白质酶切成肽段后,根据肽段的质量进行了索引,使得可以使用折半搜索的方法在肽段数据库中进行搜索,提高了搜索算法的速度;同时提出有效峰提取的优化策略,提高了鉴定算法的精度。采用公认的ISB数据集进行测试,与RT-PSM算法相比,FPI-PSM算法的灵敏度提高了5个百分点,每个质谱的平均鉴定时间从13.6ms下降到5.6ms。   2.含有修饰的肽段鉴定   目前,翻译后修饰盲搜索鉴定算法主要有两种:MS-Alignment和点处理模型,这两种算法鉴定结果的准确性都依赖于打分前翻译后修饰类型的确定。本文给出了一种穷举的、通过盲搜索肽段数据库来完成一次修饰的肽段鉴定算法EAI-PTM。EAI-PTM没有预先给定修饰类型,搜索肽段数据库中给定质量范围内的所有肽段,经过两步实验质谱和理论质谱之间的互相关计算,给出最佳匹配的肽段及对应的修饰类型。在模拟质谱和实验质谱上的测试结果显示,一次修饰鉴定结果rank1的准确性为80%,A-correct值可以达到90%。在ISB数据集的一次修饰模拟质谱鉴定结果的准确性上,相对于MS-Alignment的57.3%和点处理模型的60.38%,EAI-PTM的算法准确性达81.1%。  
其他文献
随着信息技术及相关产业的发展,网上在线数据库已成为一个巨大的信息资源仓库,这些在线数据库信息不能被传统搜索引擎检索,只能通过向接口提交查询来获取,这些信息被称为Deep
互联网规模的不断扩大,必将促使具有海量地址空间的1Pv6协议在全球范围内逐步取代地址资源匮乏的lPv4协议。又随着移动通信和无线接入技术的飞速发展,以及便携式移动设备的普及
随着计算机科学技术的飞速发展,计算机软件的规模日益庞大,调试和维护越来越困难。而另一方面,软件的安全形势严峻,对未受信源提供的代码的安全执行问题逐渐凸现出来。在这种
原油开发过程是一个比较庞大且复杂的系统工程,涉及数据种类较多,对于原油产量的影响程度也各不相同。目前的油田生产管理多以原油产量为中心,原油产量成为衡量油田生产水平
随着工业化和各种科学技术的发展,将图形图像处理技术应用到地震勘探工作中已成为一种研究趋势,而地震剖面图像增强已成为地震剖面预处理中的研究热点。但是,由于图像增强算
目前,数据挖掘(Data Ming,DM)采用较新的技术是粗糙集(Rough Set,RS)。它在分析和处理不完整、不一致和不精确的数据并进行知识的约简时不需要先验经验。粗糙集主要的研究内
随着计算机及其应用技术的迅猛发展,人类获取数据的能力得到很大程度的提高,数据流(Data Streams)已成为重要的数据来源之一,因此有关数据流的挖掘算法也已成为一个重要的前
近年来,为了满足材料科学、结构力学以及生物学等学科对于物质微观结构探索的需求,国内外先后建立了几个大型的同步辐射装置和中子源装置。气体中子探测器是这些装置中的重要
随着网络技术的不断发展,网络入侵的方法和手段也日益丰富,传统的静态防御、被动防御很难满足当前网络安全的需求。基于蜜网(honeynet)技术的主动防御的安全体系逐渐成为网络
随着Internet和信息技术的迅速发展,三维模型已成为继声音、图像和视频之后的第四种多媒体数据类型。三维模型检索技术成为多媒体信息检索领域新兴的研究热点。三维模型检索