论文部分内容阅读
目的 为提高人工种植天麻的质量,基于Group-Lasso变量筛选构建随机森林回归模型分析影响天麻品质形成的关键因子。方法 基于Group-Lasso法,对2007—2022年天麻质量研究文献中天麻素含量及产地环境变量等数据进行变量筛选,并在筛选出的变量基础上建立随机森林回归模型及计算变量重要性得分。结果 最终选择了产区、生长状况、种质类型、产地气候类型、产地土壤类型、最热月均温、产地年降水量、产地年日照时数和无霜期9个变量,基于被选变量与天麻素含量建立随机森林回归模型,模型的均方误差(mean square error,MSE)和平均绝对百分误差(mean absolute percentage error,MAPE)分别为0.103 2和14.08%,特征重要性排序显示天麻素含量的最大影响因素是产地年降水量,其次是产地土壤类型、无霜期和产地年日照时数。结论 随机森林回归模型有相对较低的误差和较高的预估精度,更适合用于对天麻种植环境的分析和天麻素含量的估算,为人工种植天麻提供参考。