论文部分内容阅读
长期以来,复杂体系重叠信号的定性、定量分析一直是分析化学领域中极具挑战性的问题。随着仪器技术的发展,分析体系复杂程度的不断提高,建立高效的信号解析手段具有十分重要的意义。而利用信号解析算法以及多元校正方法都可以达到重叠信号定性、定量分析的目的。本论文以复杂体系的气相色谱—质谱联用(GC-MS)信号和近红外光谱(NIR)信号为研究对象,建立了一系列适合复杂体系重叠信号定性、定量分析的方法,并对复杂体系的高通量分析进行了尝试和深入研究,为复杂重叠信号的定性、定量分析提供了有效的工具。具体内容主要包括以下几个方面:(1)将因子分析中“窗口”的思想与独立成分分析(ICA)相结合,提出了用于复杂GC-MS信号解析的WICA方法。即首先在单一组分存在的窗口下,提取组分的质谱信息,然后利用提取质谱中的选择性荷质比计算组分相应的色谱信息,如此所有组分的信息可以按照保留时间的方向依次得到。将提出的WICA方法成功用于杀虫剂以及烟草重叠GC-MS信号的解析,并与适应性免疫算法(AIA)进行比较,结果表明WICA方法对于严重重叠的GC-MS信号具有很强的解析能力。(2)针对化学信号非负的特点,提出了NNICA方法,即首先利用ICA方法对体系的信息进行提取,然后利用后旋转策略使提取的信息非负。将NNICA方法用于两种重叠分析化学信号,即药片拉曼光谱信号以及烟气GC-MS信号中化学信息的提取。实践证明,在没有先验知识的情况下,NNICA可以有效地提取复杂分析化学信号中的有用信息,为复杂体系重叠信号解析提供了新的手段。(3)基于自适应免疫算法(AIA),提出一种非负免疫算法(NNIA)用于复杂重叠GC-MS信号的高通量分析。由于非负校正的特点,无需过分考虑色谱分离条件,在快速洗脱的条件下,重叠信号中的组分信息可以按照保留时间的方向依次得到,这为实现复杂体系重叠GC-MS信号的高通量解析提供了可能。将提出的NNIA方法成功用于6组分模拟GC-MS信号以及40种农药混合物的GC-MS信号的解析,结果表明,NNIA可以有效解析复杂体系重叠GC-MS信号,为复杂体系重叠GC-MS信号的高通量分析提供新的途径。(4)基于样本在蒙特卡洛交叉验证中的统计规律提出了一种奇异样本的识别方法,即首先利用蒙特卡洛交叉验证建立一定数量的模型,然后按照预测误差平方和(PRESS)排序并统计每个样本在不同模型中的出现频次。由于奇异样本的特殊性,其出现频次将与正常样本具有显著差异。而后通过对四组数据进行考察,结果表明:此方法可以有效地识别近红外光谱中的奇异样本,比常用的留一法交叉验证(LOOCV)方法具有更强和更准确的识别能力。(5)提出了独立因子诊断(IFD)方法,用于考察复杂近红外光谱PLS模型因子数对模型预测能力的影响。结果表明,高次序的因子数对预测结果的贡献最大,但是低次序的因子数对预测的贡献也不能忽略。通过对三组近红外光谱数据的考察,结果表明,IFD方法可以有效地评价偏最小二乘(PLS)模型中各个因子数对模型的贡献,进而给出合适的因子数。此外,对于复杂近红外光谱PLS模型较大的因子数有利于提高模型的预测能力而并没有明显的过拟合现象发生。(6)提出了权重多尺度回归方法(WMR)用于复杂体系近红外光谱的多元校正。即利用小波变换建立多个频率的子模型,然后利用PLS对每个频率子模型建模,最后利用加权平均的策略得到最终的预测结果。而后将WMR方法应用到烟草近红外光谱上,并与光谱预处理后的PLS方法进行比较,WMR方法无论在预测能力还是在模型稳健程度方面都得到了明显的改善,有望成为复杂近红外光谱建模的有效工具。