论文部分内容阅读
马铃薯作为稻谷、小麦、玉米外的第四大主粮,将其加工成馒头、面条、米粉等主粮食品,必将促进马铃薯相关产业的快速发展。马铃薯主粮化,生产是基础,加工技术是手段,产品质量检测是关键。马铃薯品质的好坏直接影响其加工产品的质量。目前马铃薯品质检测多数还依赖于传统化学方法进行,这些方法依然存在耗时、费力、破坏样品、污染环境等缺点,无法满足马铃薯主粮食品化快速发展的需求。近年来,高光谱成像技术作为一种新兴的、绿色无损检测技术,具有多波段、分辨率高、非破坏性等优点,在马铃薯品质无损检测应用中取得了一定的进展。但高光谱数据是三维立方体数据,冗余信息多,计算工作量大,处理过程复杂,运行速度较慢,直接影响建模速度和预测精度。为了进一步提高其检测速度和精度,需要不断深入探索和研究高光谱数据处理流程中各个环节的数据数理方法,为高光谱技术的应用发展提供理论指导和技术支持,进而促进马铃薯品质高光谱无损检测技术的进一步推广。论文以克山马铃薯为研究对象,分别以马铃薯内部组分含量、内部缺陷类别以及品种类别为评价指标,综合运用光谱分析技术、化学计量学、数理统计学和数据挖掘等方法,针对马铃薯品质无损检测过程中的光谱预处理、建模(定量、定性)、特征波长选择等数据处理方法进行探索性研究,以提高马铃薯品质无损检测速度和精度。主要研究内容和结论如下:(1)比较了光谱预处理和建模方法对马铃薯水分、淀粉、蛋白质和还原糖样本模型的影响。分别对马铃薯各样本集建立主成分回归(PCR)、偏最小二乘回归(PLSR)以及支持向量机回归(SVR)模型,并采用平滑13点、一阶导数、二阶导数、SNV和去趋势变换、MSC、归一化、正交信号校正及这些预处理方法的组合与原始光谱的建模效果进行比较。实验结果表明:马铃薯水分、淀粉、蛋白质和还原糖含量的最优检测模型均为PLSR模型,其中水分含量最优检测模型为光谱经正交信号校正预处理后,提取8个主成分时所得,该模型的校正集和验证集决定系数Rc2、Rp2分别为0.7948和0.7870,校正集和验证集均方根误差RMSEC、RMSEP分别为0.3882%和0.3735%;淀粉和还原糖含量最优检测模型为光谱经平滑13点预处理获得,最优淀粉含量检测模型采用12个主成分数,模型的Rc2、Rp2、RMSEC及RMSEP分别为0.8312、0.8286、0.4498%和0.3986%,最优还原糖含量检测模型在主成分数为16时获得,模型的Rc2、Rp2、RMSEC及RMSEP分别为0.8516、0.8464、0.0729%和0.0758%;蛋白质含量最优检测模型为光谱经多元散射校正预处理后,提取的主成分个数为15时获得,该模型的Rc2、Rp2、RMSEC及RMSEP分别为0.7919、0.7904、0.0456%、0.0414%。(2)研究了马铃薯内部各组分定量分析模型的特征波长选择方法。比较分析了遗传算法(GA)、无信息变量消除法(UVE)、竞争性自适应重加权算法(CARS)、连续投影算法(SPA)和随机蛙跳算法(Random-frog)5种方法对马铃薯样本高光谱特征波长选择的能力。确定了Random-frog算法对马铃薯样本高光谱特征波长的筛选结果最优。(3)研究了马铃薯内部黑心病的识别模型。比较了不同光谱预处理方法和模式识别方法对黑心马铃薯和合格马铃薯定性分析结果的影响。分别采用高斯平滑、移动平滑、SG平滑、MSC、一阶导数、二阶导数、变量标准化、正交信号校正、去趋势变换及其组合等光谱预处理方法对其原始光谱进行预处理,建立反射光谱信息的马铃薯黑心病的不同识别模型。结果表明:采用SG导数法与正交信号校正组合式预处理的光谱所建BP神经网络和PLSLDA模型对马铃薯黑心病的鉴别效果较好,模型对样本的总体识别正确率达到96.84%。(4)研究了马铃薯内部黑心病识别模型的特征波长选择方法。采用了随机蛙跳(Random-frog)、子窗口重排分析(SPA)及间隔影响分析(MIA)方法进行波长筛选,分别建立BPNN和PLSLDA识别模型。试验结果表明:MIA变量选择方法结合BPNN建模的识别效果最佳,模型对校正集、验证集及总体样本的识别正确率分别为99.29%、92%和97.37%。该模型采用的波长变量为45个,约占全波长变量的1/5,隐含层节点个数为6个。(5)研究了马铃薯品种识别模型。以克山马铃薯的尤金885、早大白和中薯5号三个品种为样本,比较不同光谱预处理方法和模式识别方法对马铃薯品种识别结果的影响。试验结果表明:光谱经过去趋势变换预处理后所建立的DA模型和BPNN模型效果较优,模型的总体识别率均为98.15%。(6)研究了马铃薯品种识别模型的特征波长选择方法。采用了无信息变量消除法(UVE)、竞争性自适应重加权算法(CARS)、遗传算法(GA)、Random-frog算法及遗传算法结合连续投影算法(GA-SPA)5种方法进行光谱特征波长优选,分别建立DA和BPNN识别模型。试验结果表明:GA-SPA-BPNN模型可在一定程度上提高马铃薯品种分类的识别能力,该模型对校正集、验证集及总体样本的识别正确率分别为100%、95.24%和98.77%。