论文部分内容阅读
近红外光谱法(Near Infrared Reflectance Spectroscopy, NIRS)具有快速、方便、准确等优点,以及无损易于实现在线实时分析、多种组分同时测定和利于实现研究对象的质量控制。近年来随着计算机技术和化学计量学的发展,近红外光谱技术已广泛的应用于畜牧业、农业、食品、烟草业、化工、医药等领域。目前,在化学计量学中,偏最小二乘法是最典型的、应用最为广泛的化学计量方法,具有预测能力强和模型相对简单等优点。但基于全谱建立的PLS回归模型,虽然包含了目标组分的所有化学信息,但同时也将非目标组分信息以及目标组分的微弱吸收用于建立模型,这些不相关的信息或相关信息不大的会影响校正模型的质量和精度,因此选择目标组分的特征光谱谱区对近红外光谱测试,改善和提升近红外光谱分析的优势具有重要的影响。本文利用近红外光谱分析技术,对重庆本土自然资源中的一些天然产物的成分进行了分析研究,尤其是通过波段选择提高了近红外光谱分析技术的准确性和精度,实验研究了不同间隔偏最小二乘法在选择目标组分特征光谱的应用及其分析:1.利用近红外光谱法对金佛山方竹笋的蛋白质分析,采用间隔偏最小二乘法(iPLS)与反向间隔偏最小二乘法(BiPLS),实现蛋白质光谱特征波段选择。iPLS与BiPLS的效果均优于基于全波段的PLS模型,尤以BiPLS模型效果最佳。该方法快速无损,有效地减少建模的变量数,使模型预测精度得到提高。2.利用近红外光谱法结合三种不同间隔偏最小二乘法测定金佛山方竹笋中粗脂肪的含量,并选择其有效光谱范围。预测结果表明,本实验所建方法快速、可靠,可推广并应用于收购方竹笋的质量控制。3.近红外光谱法同时测定木香中木香烃内酯和去氢木香内酯,并结合间隔偏最小二乘法选择活性成分的特征光谱范围,预测结果表明,本实验可以缩短建模运算时间,选择目标组分的特征光谱。4.近红外光谱法测定黄连中小檗碱的含量,并结合间隔偏最小二乘法分析其特征波段。结果表明,经过特征波段选择后,有效地减少建模的变量数,预测精度得到提高。1.基于不同PLS算法的方竹笋中蛋白质分析的近红外光谱特征波段选择利用近红外光谱法对金佛山方竹笋的蛋白质分析,采用间隔偏最小二乘法(PLS)与反向间隔偏最小二乘法(BiPLS),实现蛋白质光谱特征波段选择。将全波段划分为12与17个波段,对全波段和每个小波段分别用PLS回归建模,然后优化组合各个区间,建立BiPLS模型,用交互验证均方差(RMSECV)与预测均方差(RMSEP)对模型进行评价。结果表明:iPLS与BiPLS的效果均优于基于全波段的PLS模型,尤以BiPLS模型效果最佳。当间隔数为12时,所选特征波段5、3、6、12、4、2、11建立的模型效果最佳,其交互验证均方差RMSECV与预测均方差RMSEP分别为0.321%、0.218%。该方法快速无损,有效地减少建模的变量数,使模型预测精度得到提高。2.基于不同PLS算法的方竹笋中脂肪分析的近红外光谱特征波段选择利用近红外光谱技术结合化学计量学方法,建立了南川方竹笋中脂肪含量测定的新方法,实现了脂肪光谱特征波段的选择。首先确定最佳子区间数,然后应用间隔偏最小二乘法(iPLS)、前向间隔偏最小二乘法(FiPLS)和后向偏最小二乘法(BiPLS)三种算法选择有效谱段范围以及建立定量校正模型,并对光谱预处理方法进行了详细的讨论。结果表明,FiPLS算法预测效果最佳。相关系数(R)为93.50;交叉验证误差均方根(RMSECV)为0.586%;预测误差均方根(RMSEP)分别为0.500%;预测结果表明,本实验所建方法快速、无损且可靠,可推广并应用于收购方竹笋的质量控制。3.近红外光谱法快速同时测定木香中木香烃内酯和去氢木香内酯利用近红外光谱技术结合化学计量学方法,建立了木香中木香烃内酯和去氢木香内酯含量测定的新方法,实现了木香烃内酯和去氢木香内酯光谱特征波段的选择。首先确定最佳子区间数,然后应用间隔偏最小二乘法(iPLS)、前向间隔偏最小二乘法(FiPLS)两种算法选择有效谱段范围以及建立定量校正模型,并对光谱预处理方法进行了详细的讨论。结果表明,FiPLS算法预测效果最佳。木香烃内酯和去氢木香内酯的预测误差均方根(RMSEP)分别为0.478%、0.346%;预测结果表明,本实验所建方法快速、无损且可靠,可推广并应用于收购木香的质量控制。4.基于iPLS的黄连小檗碱近红外光谱特征波段选择在黄连小檗碱近红外光谱分析中,利用间隔偏最小二乘法(interval partial least square, iPLS)实现小檗碱光谱特征波段选择。分别将全谱波段划分为15、16、17……23、24个子区间,然后对全谱和每个子区间分别用PLS回归建模,用预测均方差(RMSEP)相关系数R对模型进行评价。结果表明:经过特征波段选择后,分为17个子区间时模型效果最好,其决定系数、预测误差均方根分别为94.99、0.096%,有效地减少建模的变量数,预测精度得到提高。