论文部分内容阅读
近红外光谱分析是一种可通过直接测定物质的光谱响应,利用数学和统计计量方法建立模型对物质的成分进行定性、定量测定的环保型快速检测技术。它具有耗时较短、成本较低、非破坏性等优点,可以实现快速实时分析。由于近红外包含有多种成分的信息,而且光吸收强度不大、光谱谱峰严重重叠,这对于定标预测模型的建立和优化、数据的分析和模拟带了极大的困难,因此,计量学算法的研究尤为重要,如在光谱噪音的消除、信息波段(或波长)的优选以及不同的建模方式等方面,计量学算法的参数优选和组合优化将是影响近红外建模效果的重要技术手段。 本文研究几种线性与非线性的计量方法在近红外范围内建立不同的回归校正模型,探究不同的算法改进在近红外数据分析体系中的适用能力。一方面基于偏最小二乘(PLS)算法原理,研究利用主成分分析(PCA)的马氏距离结合交叉验证的残差分析去除异常样品;并同时研究了以 PLS为基础的光谱的波段优选的算法改进:组合间隔偏最小二乘(SiPLS)和向前间隔偏最小二乘法(FiPLS)。另一方面,分别利用PLS和FPLS来改进SPA的核心计算过程,研究了连续投影(SPA)算法在光谱信息波长优选方面的优化方案。此外,基于波长重要性选择,研究了蒙特卡洛(MC)与无信息变量消除法(UVE)的组合优化,实现离散波长的优选,在一定程度上提高了模型的预测能力,同时讨论了基因遗传算法和随机森林算法在近红外波长选择中应用的可行性。 改进的计量分析方法应用于鱼粉灰分和汽油辛烷值的近红外定量检测。通过实际数据分析,证实了本文所研究的计量学方法能够有效地用于鱼粉、汽油的近红外光谱分析。