论文部分内容阅读
糖类作为生命体中的重要大分子,在一系列生命活动中扮演极为重要的角色。与蛋白质的直链构型不同,糖是分支构型的树形结构,这使得糖的鉴定非常困难。质谱技术的高灵敏度、高特异性使其成为鉴定糖分支结构的主要手段。 目前常用的基于质谱技术的糖结构解析算法主要分为谱库搜索方法、结构库搜索方法和De Novo方法。现有的结构库搜索方法和De Novo方法都是基于二级质谱的。但是,二级质谱对糖分子碎裂不充分,往往无法得到唯一的鉴定结果。而近期研究表明多级质谱有能力唯一鉴定糖分支结构。 另外,王耀君等人提出了智能选峰算法GIPS,采用了多级质谱策略,取得了很好的结果。但是他们的研究在证明方法的鲁棒性与可靠性上仍显不足,主要有三个问题:算法参数设置未充分说明、可重复性存疑以及没有在复杂生物样品上测试。 针对GIPS研究上的不足,本文进行了进一步实验探究;针对现有结构库搜索方法无法得到唯一鉴定结果的问题,本文提出使用多级质谱的结构库搜索算法GIS;针对现有De Novo方法均没有使用多级质谱的问题,本文提出了使用多级质谱的De novo算法gNovo。具体成果如下: (1)验证了GIPS算法的鲁棒性与可靠性 本研究对GIPS算法进行了鲁棒性验证,在不同参数取值下对GIPS算法进行了测试。测试表明不同的参数取值并不影响GIPS算法的鉴定结果,为之前研究中参数的选取提供了依据。本研究还在13个标准糖样品上重复了整个GIPS多级质谱糖结构鉴定流程(包括多级谱实验),证明了GIPS糖结构鉴定流程具有良好的鲁棒性。本研究还使用GIPS鉴定人类血清中的的糖结构,成功鉴定了57个糖结构,证明了GIPS算法在复杂样品上的可靠性。 (2)提出了多级质谱糖结构结构库搜索鉴定方法GIS 本研究提出了一种基于多级质谱鉴定糖结构的结构库搜索策略GIS。GIS定义了一个鉴定糖分支结构的算法流程,包含一个对多级质谱谱图与谱峰的筛选方案,一个多级质谱谱图标注算法以及一个候选结构打分算法。多级质谱谱图标注算法充分考虑了同位素峰丰度分布。候选结构打分算法使用谱峰的两个特征来衡量峰的可靠性:理论与实际的同位素峰丰度分布的相似性和标注峰的丰度。GIS成功鉴定了17个标准糖样品,4个从RNase B上分离的糖样品与11个从人类免疫蛋白上分离的糖样品,证明了GIS算法的有效性。 (3)提出了多级质谱糖结构De Novo鉴定方法gNovo 本研究提出了一种基于多级质谱鉴定糖结构的De Novo搜索策略gNovo。gNovo定义了一个鉴定糖分支结构的算法流程。gNovo包含多级质谱标注算法,糖结构拼接算法与候选结构打分算法。多级谱标注算法基于单糖成分进行碎裂标注并生成整体结构的子图限制,简化了之后的拼接步骤,加快了拼接速度。拼接算法实现了在标记算法得到的糖结构子图限制条件下搜索候选结构,充分利用了多级质谱信息,实现了快速而准确的拼接。候选结构打分算法衡量了候选糖结构各个分支间的平衡性,候选结构分支间越平衡,候选结构打分越靠前。本研究使用gNovo鉴定了12个标准糖样品,实验结果表明gNovo对大多数样品鉴定结果较好。