Open-pFind:新一代开放式搜索引擎显著提高肽段质谱鉴定率

来源 :第三届全国质谱分析学术报告会 | 被引量 : 0次 | 上传用户:zxg668888
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
目前,蛋白质组学已经成为本世纪生命科学的研究重点[1]。其中,人们主要使用质谱技术对生物样品进行分析,基于质谱数据的蛋白质鉴定已经成为蛋白质组学的核心技术[2]。尽管质谱仪和相关计算技术近年来发展迅速,但由于质谱数据的规模巨大,而且生成机理非常复杂,对质谱数据进行深入、完整和高效地分析十分困难,一个直接的表现就是质谱数据的解析率不高。据统计,在较早的中低质量精度数据上,质谱数据解析率仅为15-35%;即使在领域内著名实验室产出的高精度数据上,解析率也只有50%左右[3]。质谱数据的解析率不高直接影响着肽段和蛋白质鉴定数目和鉴定精度的提高,因此,海量质谱数据的深度解析问题亟待解决。本文正是围绕这一问题开展了一系列研究,设计和实现了新一代开放式搜索算法Open-pFind。在四组典型质谱数据集上,Open-pFind解析率均达到了70-85%(图1a),比同类软件鉴定结果多出50.5-117.0%。对于高质量的串联质谱图,Open-pFind甚至基本实现了完全解析(图1b)。同时,在搜索空间是常规引擎5个量级的基础上,Open-pFind的速度仍然是常规引擎的2-3倍,是同类开放式引擎的数十倍甚至上百倍。在超大规模人类蛋白质组数据集上,Open-pFind报告了超过12,000种蛋白,且准确度远远超过以往常规分析结果。因此,Open-p Find实现的新一代开放式搜索引擎有望成为蛋白质组学日常数据分析的主力工具,为提高质谱数据解析的数量与质量提供可靠的计算技术。
其他文献
  毒品是指国际禁毒公约和我国法律法规所规定管制的、直接作用于人的中枢神经系统,使人兴奋、抑制或致幻,连续使用能使人产生依赖性的精神药品。新型毒品主要是相对鸦片、海