论文部分内容阅读
气相色谱质谱法是一种常用的仪器分析方法,它结合气相色谱高效分离能力和质谱可提供丰富的结构信息的优点,是分析挥发性或半挥发性小分子化合物的重要分析方法。目前,在气相色谱质谱数据的处理中,定性分析主要依赖于基于相似度匹配的库搜索或保留指数数据库查询的方法,并使用标准品进行验证。由于数据库内存在大量相似的质谱,搜索结果中可能包含相似度匹配非常接近的一组化合物。在实际的定性过程中,分析工作者只能选择相似度最高的备选结构作为定性结果,大大降低了分析结果的准确度。更加重要的是,一些未收录于标准物质质谱数据库的化合物基本无法定性。针对这种困境,作者提出了三种解决的新思路:1)挖掘质谱特征和保留指数规律,并利用质谱特征和保留指数的互补性进行定性;2)建立专用质谱和保留指数数据库;3)消除仪器间质谱差异,实现高相似异构体的定性分析。在定量分析上,利用质谱数据离散性的特征,提出了两种识别特征离子的方法,并与迭代目标转换因子分析法结合发展了半自动化的多元分辨方法。本论文的主要内容包括:一、提出利用中性丢失和质谱特征离子构建质谱分类器和预测结构特征的新方法。本文运用数据挖掘和逐步求精的方法确定中性丢失和特征离子,并构建质谱分类器的方法;提出了差异性分析的方法从原始质谱数据中提取特征离子和中性丢失信息,并构建未知化合物的结构特征的预测机。与模式识别方法比较发现,由中性丢失和特征离子构建的质谱分类器和结构特征预测机具有以下优点:a)能取得更好的分类或预测效果;b)在逐步求精过程中选出的变量得到经典质谱裂解理论的解释,变量具有较强的可解释性,模型也更具有拓展性;c)中性丢失被巧妙的利用作为一个变量用于质谱分类和特征提取。(第二章)二、运用差异分析提取质谱特征,并结合保留指数发展新的定性分析方法。首先,运用数据挖掘和逐步求精的方法对NIST05标准物质质谱数据中的烷烃进行了挖掘,建立了烷烃和直链饱和烷烃的识别方法;接着,利用差异分析对数据中90单甲基烷烃的标准质谱进行了挖掘,得到了质谱局部特征并建立局部特征与甲基位置之间的关系。结合保留指数和分子离子峰的信息,建立了自动化识别单甲基烷烃的方法。该方法利用互补的左右凹陷,保留指数和分子离子峰的信息相互支撑,相互验证,为提高准确的定性结果提供了保障。最后,对蜡脂质谱和保留指数进行深入的挖掘,根据不同不饱和度蜡脂质谱谱图地貌的差异把蜡脂的质谱分成三类。针对每类质谱,提出了利用特征离子计算蜡脂中脂肪酸部分和脂肪醇部分碳原子数和不饱和度的公式。通过模拟数据的演示,实际数据和标准品数据的验证,说明差异分析可以有效的提取出质谱特征,也说明质谱特征结合保留指数的方法能够更加准确的定性样本中的未知化合物。(第三、四章)三、提出了建立专有保留指数和质谱数据库的方法。结合质谱特征和化学计量学方法建立无需标准品的定性新方法,并用于五种食用植物油,杜仲果油和人类血浆样本中脂肪酸进行了定性定量分析。本方法利用固定的色谱条件测定所有样本,保证利用数据库内保留指数定性的准确度;利用化学计量学多元分辨的方法弥补因固定色谱条件造成的色谱峰重叠的不足;利用通过质谱特征识别出的样品内部的直链饱和脂肪酸甲酯的保留时间信息计算其它脂肪酸甲酯的等效链长,减少因不同进样批次引起的保留指数误差,从而实现在不使用标准品的情况下对脂肪酸甲酯进行准确定性。通过标准品混合物的验证,证明该方法在无需标准品的情况用于常规脂肪酸的检测分析。分析结果表明杜仲果油确实具有开发制作营养品的价值;同时该方法为利用人体血清中脂肪酸轮廓诊断疾病提供了坚实的定性定量分析方法学基础。(第五章)四、发展了两种异源质谱的校正新方法,并用于质谱和保留指数都极相似异构体的识别。首先,提出了加权平均相对强度比向量的方法。该方法直接计算训练集中每对异源质谱中相对强度大于阈值的质谱峰的强度比,所有质谱得到的强度比的平均值作为最终的比值向量。相对强度小于阈值的质谱峰不参与强度比计算和平均值计算,训练集中所有相对强度都小于阈值的质荷比视为未校正,设其强对比为1。所有的质荷比的强度比组成最终的加权平均相对强度比向量,又称校正向量。其次,发展了分段直接标准校正法(最小二乘回归)的质谱校正方法。训练集和两类测试集的检验证明了这两种方法不仅能够很好把训练集中的质谱转化为目标条件下的质谱,且适用于具有不同的支链,官能团,双键位置和顺反异构的脂肪酸甲酯的质谱。最重要的是,它们可以消除仪器或条件引起的质谱差异,提高高相似质谱定性的准确度,能够在基本解决质谱定性的问题。(第六章)五、提出了两种潜在特征离子识别的方法,并用于迭代目标转换因子分析法中浓度矢量的初始化。第一种方法是通过比较渐进因子分析法所确定得组份起始点和结束点,并与单个质荷比所对应的色谱图中的组份起始点和结束点进行比较分析,从而到达识别各组份的潜在选择性离子;第二种方法通过比较不同流出区域的质谱差异,以识别潜在选择性离子。对于多组份体系提出了分割法的策略,即从多组份体系中依次提取当前组份的流出窗口,分别获得各组份的浓度曲线,然后利用最小二乘回归方法计算得到纯物质的质谱,最后由标准质谱同样利用最小二乘回归方法计算出最终的各组份的浓度矢量。与HELP法的结果比较说明,这两种方法能够快速的获得高质量的解析结果。通过低信噪比数据体系,墨旱莲挥发油,97#汽油样本的数据的测试,结果证明这两种方法能够满足常规分析检测的需要。(第七章)