基于近红外光谱技术的板栗品质无损检测方法研究

来源 :华中农业大学 | 被引量 : 0次 | 上传用户:liaobz
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
板栗是我国重要的经济作物,种植面积和年产量均居世界第一位,但是由于产后贮藏和加工技术研究不足,采后损失率高达30%,其单位产值也低于其他国家。快速、准确地鉴别霉变板栗,获取合格板栗内部主要成分信息,对于减少产后损失,实施按质贮藏、加工,保证产品质量和提高产业经济效益具有重要意义。近红外光谱是一种新兴的无损检测技术,具有速度快、易操作等优点,已广泛用于蔬菜、水果等农产品的品质检测中,但尚未应用于木质壳物料的定性定量分析。该文研究利用近红外光谱技术对板栗品质进行无损检测的方法,主要内容包括:利用无监督的系统聚类和主成分-系统聚类模式识别方法、有监督的偏最小二乘判别分析法、支持向量机判别法和偏最小二乘-支持向量机判别法等模式识别方法,对板栗内部霉变进行定性判别分析,并比较了不同光谱预处理方法,包括微分(Derivaion)、多元散射校正(MSC)、标准正态变量变换(SNV)等对判别结果的影响;利用主成分回归分析(PCR)、偏最小二乘回归分析(PLSR)建立板栗果仁样本和带壳板栗样本主要成分含量的定量检测模型;并比较了多种样本集划分方法,包括浓度梯度法(Concentration gradient)、Kennard-stone算法(Kennard-stone algorithm)和SPXY算法(Sample set partitioning based on joint x-y distances algorithm)),以及多种光谱预处理方法,包括微分、MSC、SNV对检测模型的影响;此外尝试采用正交信号校正法、间隔偏最小二乘法、投影权重法、遗传算法、无信息变量消除法和连续投影算法等方法对定量检测模型进行了优化与简化。主要研究结果和结论如下:1)首次验证了利用近红外漫反射光谱鉴别带壳板栗内部霉变的可行性,并且探讨了对不同霉变程度样本的鉴别能力,确定了利用近红外光谱技术鉴别外观无差异的完整板栗内部霉变情况的最佳方法。结果表明:带壳板栗样本的漫反射光谱能够携带反映其内部霉变程度的信息;利用近红外漫反射光谱可以对板栗内部霉变进行定性判别;有监督模式识别方法的判别准确性要高于无监督模式识别方法;对板栗样本霉变与否的判别准确性要高于对霉变程度的判别。判别样本是否霉变时,采用偏最小二乘判别法结合多元散射校正预处理所建模型的判别正确率达到99%,交互验证的敏感性和特异性为0.94;而主成分-系统聚类法的最高判别正确率为89%。判别样本属于合格类别、轻度霉变类别或者严重霉变类别时,采用偏最小二乘判别法结合多元散射校正处理所建模型的判别模型判别正确率最高,达到97%,模型交互验证的敏感性和特异性分别为0.91和0.92;主成分-系统聚类法结合伍氏算法计算类间距离的正确率为76%。2)验证了利用近红外光谱对外覆木质壳物料内部成分进行定量检测的可行性。针对样本带壳、栗仁两种状态下的近红外漫反射光谱,系统地对比了不同样本集划分方法、光谱预处理方法、回归模型建立方法对样本光谱特征和参考值的关联能力,证实了利用近红外光谱技术检测板栗内部品质具有良好的应用前景。结果表明:通过近红外光谱分析技术可以对板栗内部主要成分进行定量检测;利用SPXY法进行样本集划分最适合;偏最小二乘回归法的建模效果优于主成分回归法;栗仁内部主要成分的检测结果优于带壳板栗的检测结果;微分预处理对板栗样本光谱信息的提取能力优于其他预处理方法;基于栗仁光谱的分析模型其预测精度与待测成分的含量浓度正相关,而基于带壳板栗光谱的分析模型则无此规律。3)在栗仁光谱分析中,水分含量检测模型的校正集相关系数、预测集相关系数、校正均方根误差和预测均方根误差分别为0.9359、0.8437、1.44和1.83,糖分含量检测模型的校正集相关系数、预测集相关系数、校正均方根误差和预测均方根误差0.9072、0.8649、0.76和0.74,淀粉含量检测模型的校正相关系数和预测相关系数分别为0.9168和0.8376,校正和预测均方根误差分别为1.07和1.26,蛋白质含量检测模型的校正集相关系数、预测集相关系数、校正均方根误差和预测均方根误差分别为0.9044、0.8029、0.29和0.40。在带壳板栗光谱分析中,水分含量检测模型的校正集相关系数、预测集相关系数、校正均方根误差和预测均方根误差分别为0.8270、0.7655、2.27和2.35,糖分含量检测模型的校正集相关系数、预测集相关系数、校正均方根误差和预测均方根误差0.8379、0.5891、1.12和1.32,淀粉含量检测模型的校正相关系数和预测相关系数分别为0.9137和0.8432,校正和预测均方根误差分别为1.09和1.24,蛋白质含量检测模型的校正集相关系数、预测集相关系数、校正均方根误差和预测均方根误差分别为0.8748、0.7324、0.35和0.38。4)利用正交信号校正法、间隔偏最小二乘法、投影权重法、遗传算法、无信息变量消除法和连续投影算法方法对板栗内部主要成分检测模型进行了简化和优化,4种主要成分中,以水分模型的优化效果最显著,其模型相关系数提高和变量减少幅度最大;其次为蛋白质模型,利用正交信号校正、投影权重法和连续投影算法均能提高其预测能力;糖分模型可以通过正交信号校正来提高预测相关系数和模型稳定性,然而其余方法只能实现模型的简化;淀粉模型的各项精度指标均能通过正交信号校正得以优化,但是其余方法不同程度地降低了模型的预测性能。5)比较了各种特征波长提取方法对4种成分检测模型的优化效果:间隔偏最小二乘法能够在减少50%的波长变量后得到与全变量模型性能相近的结果;投影权重法能够利用少于总数35%的波长变量基本保持模型的性能,但是其对预测性能的提高能力比较有限,仅能提高蛋白质模型的预测能力;遗传算法每次得到的特征波长变量数变化较大,对波长变量的保留率最高为30%,但是特征波长变量的选择频率较高,其模型性能整体欠佳;无信息变量消除法对波长变量的滤除率在90%以上,多次计算所选取的变量数的特征波长位置基本一致,模型性能亦无显著差异;连续投影算法针对各成分所选取的变量不超过变量总数的3%,该法所选29个水分特征波长所建模型为最优水分检测模型,然而其对糖分模型和淀粉模型的优化效果并不显著。
其他文献
以欧拉双流体模型和两相流体动力学理论为基础,采用K—ε湍流模型对上升管内固液两相流流化过程中两相速度分布、流场特性以及局部压力变化进行了模拟.结果表明管内颗粒存在非
目的第三代抗癫痫药物为2008年以后批准上市的抗癫痫药物,包括拉科酰胺、卢非酰胺、瑞替加滨、吡仑帕奈、醋酸艾司利卡西平、布瓦西坦以及司替戊醇。本文的目的为评价第三代
<正> 更年期综合征是在绝经前后出现的一系列以植物神经功能紊乱症状为主要表现的症候群.其中部分患者症状比较严重,甚至影响正常生活和工作.笔者自1985年来采用中医分型论治
近年来全国大学生数量急剧攀升。大学生是社会的新鲜血液,大学生的综合素质的高低影响着社会的发展,而学校是培养大学生的主要基地,大学生的校园生活在很大程度上影响着大学
为分析慢性非传染性疾病史对患脑卒中风险的影响,调查了辽宁省阜新市农村地区年龄在35岁以上居民的流行病学特征,基于基线调查的数据,选取合适的变量,在明确变量的特征形态基
<正>布迪厄的场域理论认为文学场在权力场的内部占据被统治的位置,"无论它们多么不受外部限制和要求的束缚,它们还是要受总体的场如利益场、经济场或政治场的限制"(1)。比之
用集成在移动船载温盐剖面仪(MVP)的激光型浮游生物光学计数仪(LOPC),于2012年7月底在南黄海35°N断面调查浮游动物丰度的水平和垂直分布情况,并对获得高时空分辨率的数据资
我国国内上市公司中,国有资本占多数。不过目前我国国有企业在财务方面也暴露出了一些问题:会计信息失真、金融超额支付不合理、国有资产流失。这三个问题的核心在于对财务收
研究背景:自发呈报系统数据库是药品不良反应监测的重要依据,是实现有效药物警戒的基石,随着时间的推移、数据的积累以及国家对药品安全性问题的重视,上报至国家药品不良反应
作为一种新兴的金融创新方式,融资租赁行业在我国快速发展的同时,越来越多的问题开始暴露。融资租赁公司在融资租赁业务中面临最主要的风险就是信用违约风险。文章通过案例分