论文部分内容阅读
目的:(1)采用近红外光谱技术结合化学计量学方法建立文县、临洮和陇西党参的分类模型。(2)采用红外光谱技术结合化学计量学识别来自不同产地不同产期的当归。(3)近红外光谱技术结合偏最小二乘回归、遗传算法-多元线性回归建立当归醇提物和阿魏酸的定量模型。方法:(1)采用近红外光谱技术对36个党参样本进行分析,获得在12000-4000cm-1波数范围内的近红外光谱,通过数据标准化(SNV)+二阶导数预处理后,建立图谱数据对应党参药材产地信息的数据库,利用主成分分析(PCA)对党参样品进行分析,采用随机森林(RF)算法建立采自文县、临洮、陇西3个产地的党参分类模型。(2)采集2007年、2008年岷县、宕昌、陇西、临洮当归种植地当归样品共136份,系统分为7类并编号。采用红外光谱技术(近红外、中红外)获得各样本的红外光谱图,建立图谱数据对应产地产期信息的数据库。近红外光谱通过SNV+一阶导数预处理后,采用PCA进行分析,并利用RF识别方法建立7类当归的分类模型;当归中红外光谱(4000~400 cm-1)经过预处理后,进行主成分分析,再用RF识别方法建立当归的分类模型。(3)运用中国药典中相应方法测定136个当归样本的醇提物及阿魏酸的含量。结合各自近红外光谱数据建立含量与图谱相关的数据库。分别运用偏最小二乘回归(PLSR)、遗传算法-多元线性回归(GA-MLR)两种算法对当归样本的原始光谱、SNV+一阶导数光谱和SNV+二阶导数光谱建立4个产地当归醇提物和阿魏酸的定量方程,并选出最佳预处理方法及定量模型。采用相关系数R、均方根误差RMSEC和交互检验相关系数Rcv对所建模型进行评价。结果:(1)RF所建党参分类模型的分类准确率为88.89%。(2)RF结合近红外光谱所得模型的分类准确率为94.85%,RF结合中红外光谱的分类准确率为93.75%。(3)通过对比两种算法所得模型的Rcv值,选择GA-MLR建立的定量模型。岷县、宕昌、陇西和临洮产当归醇提物定量模型交互检验的Rcv分别为0.8812、0.8976、0.8819和0.9423,RMSEC分别为0.0107、0.0092、0.0110和0.0065;阿魏酸定量模型交互检验的Rcv分别为0.8922、0.8496、0.8870和0.9393,RMSEC分别为0.0029、0.0069、0.0059和0.0035。结论:通过上述研究表明,红外漫反射光谱法结合RF不需要对样品进行复杂繁琐的前处理,即可初步实现党参的产地鉴别、较准确识别当归的产地、产期。红外漫反射光谱法结合GA-MLR可较准确的预测当归中醇提物及阿魏酸的含量。但模型尚需进一步通过扩大样本、优化算法等进行改进和验证。