论文部分内容阅读
近红外光谱分析是一种快速简便的绿色分析技术。采用漫反射、透反射等方式直接快速测量固体样品,同时在方法学上提出了挑战。因为需要克服由于光散射造成的光谱基线漂移和倾斜等干扰。多元散射校正(MSC)、标准正态变量变换(SNV)和Savitzky-Golay平滑(SG)是重要的光谱校正方法。可用于校正由于散射、温度波动等对光谱造成的干扰,还可用于在不同仪器之间的模型传递。MSC方法假设每个样品光谱与定标样品平均光谱满足线性关系。但谱段较宽时,整体线性化的假设难以成立。分段多元散射校正(PMSC)方法提出可移动p+1+q模式的局部校正窗口,实现光谱的分段线性校正。并通过几个实例,取得了明显优于MSC方法的预测效果。然而,受限于当时计算机的运算速度,PMSC方法没有实现全局的优选。另一方面,不同波段的光谱校正参数通常是不同的,由于算法的复杂性,波段选择和光谱校正交互式同时优化的算法还未见报道。本研究进行两方面的方法推广:(1)构建基于偏最小二乘(PLS)模型的PMSC方法的优化平台,实现对校正窗口模式的全局优选;(2)分别基于SG、SNV、MSC和PMSC四种光谱校正方法,结合移动窗口PLS(MW-PLS),提出MW-SG-PLS、MW-SNV-PLS、MW-MSC-PLS、MW-PMSC-PLS四种集成方法,实现光谱校正和波段选择的交互式同时优化。以土壤有机质的近红外分析为例,验证了提出的几种方法。主要成果如下:(1)PMSC-PLS方法:(1)建立PMSC-PLS模型全局优化算法平台,实现对校正窗口的全局筛选。最优模型的检验预测均方根误差和检验预测相关系数(RMSEPV,RP,V)分别为0.184 g·kg-1和0.975,其预测效果明显优于MSC-PLS模型;(2)研究发现,PMSC-PLS模型的校正窗口分为三类:过度校正,适度校正和不足校正。本例中,窗口宽度过小(m<61)的为过度校正;窗口宽度过大(m>800)的为不足校正;适当的校正窗口宽度为61800。(2)交互式优化方法:采用整体初筛参数优化策略,四种集成方法均实现了交互式优化运算:(1)最优MW-SG-PLS模型的RMSEPV和RP,V分别为0.187 g·kg-1和0.969,明显优于SG-PLS和MW-PLS模型;(2)最优MW-SNV-PLS模型的RMSEPV和RP,V分别为0.186 g·kg-1和0.970,明显优于SNV-PLS和MW-PLS模型;(3)最优MW-MSC-PLS模型的RMSEPV和RP,V分别为0.188 g·kg-1和0.970,明显优于MSC-PLS和MW-PLS模型;(4)最优MW-PMSC-PLS(对称校正窗口)模型的RMSEPV和RP,V分别为0.177 g·kg-1和0.971,明显优于对称校正窗口情形PMSC-PLS和MW-PLS模型。因此,光谱校正和波段选择的交互式优化,优于单独的光谱校正,也优于单独的波段选择。(3)上述方法中,同时进行了校正窗口优化以及波段选择的MW-PMSC-PLS模型的预测性能最优。本研究实现了校正窗口可变MSC方法的全局优化,也实现了光谱校正与波段选择交互式优化。这些方法拓展了近红外光谱的应用途径,可为复杂体系的近红外光谱分析提供重要的参考。