论文部分内容阅读
自2011年以来,玉米已超过水稻成为我国种植面积和产量双第一的作物。黄土高原地区的光热条件较好,是我国玉米的优势产区。然而,该地区的降水在年内分配不均,频发的干旱是限制玉米产量的主要因素。因此,结合表征干旱以及玉米长势的多源数据,在生长季内对产量进行及时、准确地的预测,对保障区域粮食安全具有重要意义。当前用于玉米产量预测的方法主要可以分为机理模型和统计模型,这两类模型中的大多数为辐射驱动型。由于建造和维护成本等问题,具备太阳辐射(Rs)观测能力的站点数量较少,难以支撑区域尺度上相关研究的开展。此外,机理模型中被广泛应用的作物生长模型(cropping system models,CSMs)在干旱等胁迫条件下对作物的生长和发育过程的模拟存在缺陷,且难以同遥感植被指数等多源数据进行结合。尽管统计模型应用简便,但是此类方法难以对预测结果给出合理的解释。因此,如何将机理模型和统计模型各自的优势相结合,以进一步提高产量预测的可靠性已成为当前相关研究的一个难点。本研究尝试结合作物模型、遥感植被指数、干旱指数、气象等多源数据,构建一种基于机器学习算法的玉米生长季内动态产量预测的综合性方法。首先,本论文针对黄土高原地区Rs数据普遍缺失的问题,利用机器学习算法估算了不同时间尺度的Angstrom-Prescott(A-P)公式的经验系数a和b,提供了适用于中国地区不同时空分辨率的系数a和b的数值产品,并估算了黄土高原298个一般气象站逐日Rs。其次,利用日光诱导叶绿素荧光(sun-induced chlorophyll fluorescence,SIF)以及自校准帕默尔干旱指数(sc PDSI)来评估黄土高原地区植被生长季内干旱的发生规律以及不同植被对干旱的响应。最后,分别基于作物模型和机器学习算法构建玉米生长季内动态产量预测方法,并尝试结合将两种方法结合构建一种玉米生长季内产量动态预测的综合性方法。本论文的主要研究内容和结论如下:(1)中国大陆地区的A-P模型系数存在明显的时空变异性。其中,系数a的和系数b在全国四个不同气候区的校准值均值范围分别为0.16–0.23以及0.53–0.58。日尺度A-P系数校准值的变异性较大,进而导致基于该系数的逐日Rs的估算误差明显大于基于月尺度和年尺度系数的Rs估算结果。相较于日尺度A-P系数,月尺度和年尺度A-P系数(包括FAO的推荐值和本研究的校准值)在逐日Rs的估算中造成的误差相对较小。然而,FAO推荐的A-P系数在中国大多数地区高估了系数a,同时低估系数b。此外,月尺度A-P系数获得了最高的Rs估算精度,但仅略微优于基于年尺度A-P系数的估算结果,同时极大地增加了Rs估算的复杂程度。考虑到操作的便捷性以及相应的精度,本研究推荐在中国地区使用年尺度A-P系数来估算逐日Rs。(2)黄土高原地区植被生长季内的光合强度同干旱指数之间的相关性受植被类型及生育阶段的影响。基于黄土高原地区2006–2020年4–10月份逐月SIF和sc PDSI的动态,发现该地区的干旱在研究时段内整体呈现缓解趋势,而植被光合能力逐年增强。此外,在生长季内不同时段的SIF与sc PDSI的相关性存在变化,在生长季早期的相关系数达到显著水平的面积超过50%。最后,不同植被的SIF与sc PDSI之间最大相关系数及其对应的滞后时间存在差异,表明不同植被对干旱的敏感性不同:林地对干旱的抵抗能力最强,农田次之,灌木和草地最弱。研究区西北部干旱和半干旱地区对干旱事件较东南部的半湿润地区更为敏感。(3)基于CERES-Maize模型和气象数据融合的逐日产量预测方法可在玉米抽雄后获得较高精度。在玉米生长季内逐日产量预测中,抽雄前产量预测的不确定性较大,而抽雄后(约收获前50–60 d)逐日产量预测的精度迅速提高。例如,陕西榆林站2010年玉米生长季内逐日产量预测的平均绝对相对误差(absolute relative error,ARE)和变异系数(coefficient of variation,CV)在抽雄前分别为23.8%和20.2%,在抽雄后变为5.7%和6.6%。利用不同相近年份进行生长季内产量预测,基于播前10 a气象数据的产量预测获得最高预测精度,逐日产量预测的平均ARE为11.7%。利用k-NN算法筛选的气象相似年份进行的生长季内产量预测,基于生长季内累积降雨筛选的相似年份气象数据取得了最小的预测误差,逐日产量预测的平均ARE为11.5%。两种优化算法较使用全部气象数据的原始预测均能够提高精度并减少耗时。考虑到运算的复杂程度以及数据需求,建议在黄土高原地区使用播前10 a气象数据进行动态产量预测。(4)基于多源信息和随机森林算法的玉米生长季内不同生育阶段的产量预测中表现较为稳定。利用生长季内不同生育阶段的EVI(enhanced vegetation index)、sc PDSI、SIF以及气象因子,建立了玉米动态产量预测的随机森林模型。相较于CERES-Maize模型在生长季前期较大的产量预测误差,基于遥感植被指数和干旱指数构建的随机森林模型在全生育季内的产量预测中表现更为稳定。在三叶期、拔节期、抽雄期以及成熟期产量预测误差的均方根误差(root mean square error,RMSE)在620–720 kg ha-1范围内波动。基于不同因子组合的随机森林模型随着生育进程的推进整体预测误差减少,但是不同因子的表现存在差异。此外,利用随机森林这种机器学习方法构建的玉米产量预测模型的预测精度并未随着输入因子数量的增加而提高,在三叶期、拔节期、抽雄期以及成熟期的最优预测因子组合分别为:EVI、EVI、SIF以及气象+SIF。(5)集合CERES-Maize模型逐日的预测产量、多源数据以及随机森林算法能够在玉米生长季内各阶段进一步产量预测的稳定性和精度。相较于单一随机森林模型和CERES-Maize模型的产量预测,综合性模型同时具备了机器学习模型的稳定性和作物模型的动态性特点。综合模型在生长季内各阶段均提高了玉米产量的预测精度,在玉米生育期内的4个不同预测节点的决定系数R~2均大于0.9,RMSE和n RMSE(normalized root mean square error)的范围分别为255–463 kg ha-1和3.5%–6.3%。此外,基于随机森林算法将CERES-Maize模型动态预测的产量和各生育阶段的产量预测因子(包括EVI、sc PDSI以及SIF)相结合,能够在抽雄至成熟阶段内不同日期稳定提高玉米产量预测精度。该方法可以克服遥感植被指数和干旱指数在时间上不连续,进而无法逐日进行玉米产量预测的缺点,能够提高产量预测的时效性。总之,本研究构建的综合性产量预测模型在玉米生长季内动态产量预测中具有较好的应用前景。