论文部分内容阅读
花生是一种重要的食用植物油和蛋白质来源,花生中水分和蛋白质等组分的含量会显著影响其品质及其储藏和加工过程,而且不同品种花生中水分和蛋白质含量差别很大。因此,对花生品种的鉴别以及品质指标的测定是花生生产和销售过程中不可或缺的环节。传统测定方法不仅费时费力而且大多需要破坏样品的完整性,为了克服这些缺点,结合了计算机视觉和光谱技术的高光谱成像技术应运而生。本研究主要利用高光谱成像技术进行花生品种分类以及水分和蛋白质含量检测,具体研究内容及结果如下:(1)利用可见和近红外高光谱成像技术(400-1000nm)以及分类器分析对五个花生品种进行鉴别。利用7种模式识别分类器建立了分类模型。其中偏最小二乘判别分析(PLS-DA)、线性判别分析(LDA)和概率神经网络(PNN)分类器在全波长范围内,校正集的正确分类率(CCR)都达到了100%,预测集的CCR分别为93.33%、94.44%和71.11%。另外,为了对高光谱图像进行降维,利用连续投影算法(SPA)选择6个重要变量(416、518、572、633、746和928 nm)用于简化分类模型。简化后的基于PNN分类器的分类模型同样取得了较好的效果,其校正集的CCR为83.81%,说明高光谱成像技术和分类器分析可以快速无损地鉴定花生品种。(2)利用从高光谱图像中提取的光谱数据和测定的相应水分含量化学值,结合PLSR技术以及光谱预处理方法建立了定量校正模型。比较了在400-1000nm和1000-2500nm两个波长范围内所建模型的效果,并选择了更好的波长范围用于进一步对花生中水分含量进行分析。在400-1000nm波长范围内利用全波长建立的未经预处理的PLSR模型的预测效果最好,它的预测集的决定系数R2P最高为0.930,预测集的均方根标准误RMSEP最低为0.054%。利用回归系数法(RC)和连续投影算法选择携带最重要水分含量信息的重要波长,用于解决共线性问题和去除冗余信息。同时,比较了利用上述两种方法选择的重要波长建立的PLSR模型的预测能力。最后,用于实现花生中水分分布可视化的优化后的RC-MLR模型的预测效果最好,它的R2P和RMSEP分别为0.937和0.051%。说明可见和近红外高光谱成像系统(400-1000nm)可以检测花生中水分含量分布。(3)探究了利用长波近红外高光谱成像技术(1000-2500nm)对花生中蛋白质含量进行无损检测的可能性。利用提取的光谱数据和相应的传统方法测定的蛋白质含量化学值,结合PLSR技术以及光谱预处理方法建立了校正模型。利用全波长建立的未经预处理的PLSR模型的预测效果最好,它的R2P为0.885。利用回归系数法和连续投影算法选择了在全波长范围内对蛋白质含量检测模型影响最大的重要波长。通过比较上述两种变量选择方法,8个(1153、1567、1972、2143、2288、2339、2389和2446 nm)被回归系数法选则的重要波长的预测效果更好,相应的简化后的RC-PLSR预测模型的R2P为0.870。最后,为了更好地消除共线性问题对预测结果的影响,利用回归系数法选择的重要波长建立了RC-MLR模型,说明了高光谱成像系统具有对花生中蛋白质含量进行快速无损检测的潜力。