论文部分内容阅读
近四十年来,向日葵迅速发展成为了产量仅次于大豆的油料作物。不同批次和质量的葵花籽因为品质的区别,价格也存在较大差异。当前,种子市集上葵花籽品种繁多,鱼龙混杂,以次充好的情况频繁发生,极大地损害了农民的利益。为保证消费者权益,有效的鉴定葵花籽的油用品质,迫切的需要建立一种有效的检测方法对葵花籽中的蛋白、水、油脂含量等主要指标进行定量分析,对样品品质进行定性分析以便分类识别。近年来,近红外光谱分析技术因具备快速在线分析能力,且有不破坏样品完整性、无污染等优点在各种农业检测领域得到了广泛应用。本文利用上海荧颯光学公司所提供的油料普查作物的葵花籽为测试对象,用标准化学方法测定蛋白质、油脂、水含量,通过实验室和公司联合研发的光谱仪测定样本的近红外光谱,结合化学计量学方法开展了葵花籽近红外光谱识别和定量的分析研究。本文主要从光谱的预处理、波长筛选方法、校正模型建立等方面深入探讨了近红外光谱技术在识别和定量检测中的几个关键问题;以校正模型的预测正确率为评价指标开展了近红外光谱辨别不同葵花籽品质的研究。旨在为葵花籽品质的无损检测提供新的参考。主要研究工作如下:1)本文比较了同波段下各种不同预处理方法以及方法组合对葵花籽光谱数据的处理效果,分别在几种预处理方法中找出了蛋白、水、油脂三种指标对应的最优预处理方法。在不影响分析精度的前提下比较了各种波段组合,以及在最佳预处理下比较了无关信息向量消除法等三种波段优化方法建立偏最小二乘(PLS)模型的效果。研究表明,小波变换的预处理效果最佳,无关向量消除下的波段选择效果最优。2)采用基于正交化的偏最小二乘降维法对样品进行光谱样本的分类和识别,仿真结果显示,分类识别的准确率高达92.30%,最低为84.21%。应用了偏最小二乘(PLS)和BP神经网络的近红外光谱分析方法对葵花籽光谱进行定量建模,并用留一法的内部交叉验证法对模型进行验证,以测试样本的均方根误差和百分比误差为评价指标,结果表明采用两种不同的化学计量学方法建立的定量模型中以BP神经网络最理想。3)将经过基于正交化的偏最小二乘法降维法分类后的样品,在较为理想的几种预处理和波段筛选的方法下,分别建立葵花籽光谱数据与蛋白、水、脂肪含量之间基于BP神经网络和基于PLS的定量分析模型。研究结果表明,在对葵花籽样本质量相关的三种组分进行定量分析时,经过基于正交化的偏小二乘降维方法分类后使用PLS进行定量分析的模型准确率最高。其效果优于未分类的葵花籽BP神经网络模型。而经过分类后的BP神经网络模型可能因为样本过少泛化能力低,其性能是四种模型中最差的。