常用机器学习模型在土壤属性空间预测与数字化制图中性能表现对比研究

来源 :郑州大学 | 被引量 : 0次 | 上传用户:shoretxm
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
土壤空间预测与数字化制图的精度受预测模型应用、土壤样点规模与采样策略、研究区空间尺度与地貌特征、成土环境复杂程度、协变量数据质量等多种因素共同影响与制约。本研究以河南省为案例研究区,基于9种不同土壤样点规模、5种土壤采样方法,4个研究尺度、应用6种最具代表性的机器学习(Machine learning,ML)算法对耕地表层土壤p H实施空间预测与数字化制图,用以对比分析上述各因素对ML模型性能表现及土壤p H预测精度的影响。所获结果发现:1)在省域尺度上,6种ML模型性能表现及其土壤p H预测精度存在明显差异,基于树结构的随机森林(RF)和Cubist模型表现最好,两种模型预测结果的决定系数(R~2)均可稳定在0.78以上,误差(RMSE)保持在0.5以下。2)当研究区土壤样点规模从200个经由400个、800个、1200个、1600上升到2000个时,无论使用何种采样方法,所选用的ML模型的性能表现与表层土壤p H预测精度均呈快速上升的总体趋势;当样点规模达到并超过2000个时,ML性能表现趋于稳定,预测精度上升快速趋缓,表明2000个土壤样点可能是应用这些ML模型预测研究区耕地表层土壤p H的样点阈值。3)当土壤样点规模足够大时,采样方法对ML模型性能和土壤p H预测精度的影响很小,五种采样方法的效果相差不大。当土壤样点规模小于2000个时,采样方法对模型性能与预测精度的影响逐渐凸显。比较而言,k-均值采样方法在样点规模较小时具有优势。当样点规模为1000个时,k-均值采样仍可使随机森林和Cubist预测的R~2仍能维持在0.80左右;在样点规模小至200个时,k-均值采样方法下5种ML模型预测的R~2仍在0.55以上。4)目标区域空间尺度大小对于ML模型精度存在影响,树状结构模型(RF,Cubist)在设置的四个尺度上的预测结果具有精度优势。其中,在省域和地区(黄淮海平原河南部分)尺度上,RF模型表现最优;在区域(许昌市)和县域(襄城县)尺度上,Cubist模型表现更为突出,预测结果具有更高的林氏一致性系数(LCCC)和更低的误差;使用同一套数据,RF模型在地区尺度上的性能表现(R~2=0.87)优于省域尺度(R~2=0.81)。5)不确定性分析结果显示,省域尺度上,90%预测区间宽度大小顺序如下:SVM<ANN<Cubist<RF,表明RF预测的可靠性最高;平均73.9%的验证样点表层土壤p H观测值落入模型90%预测区间,表明该模型的可靠性被轻微高估,但处于可接受范畴。另外,数据显示模型预测的不确定性与样点规模无明显关联。
其他文献
近年来,“互联网+”药品供应链已走进居民生活,线上药品销售已成为新趋势。2019年新版《药品管理法》从政策上首次允许网络渠道销售处方药。据《2020年数字化医疗洞察报告》显示,线上购药的渗透率已达31%。同时,消费者储备药品已成常态。由于原有的定点回收模式的便民性差、居民满意度差、回收点设置难、居民参与性差等劣势日渐凸显,过期药品的回收工作没有得到预期的良好效果。而“互联网+”药品供应链中过期药品
学位
随着我国建筑业的快速发展,对各种建筑物结构的安全、抗震能力、功能等都提出了越来越高的要求;同时,我国建国初期及改革开放后,各类基础设施及建筑物如雨后春笋般兴建,时至今日已有六七十年的历史,进而导致这些建筑物面临重新加固、修复、改造等一系列难题;同时,由于地震、台风等自然灾害的破坏以及公众对建筑物结构安全性能的日渐重视,加固业将成为最为热门的行业,加固公司也将成为建筑行业的生力军;然而,我国加固企业
学位
腺苷酸环化酶(adenylyl cyclase,AC)催化ATP生成环化腺苷酸(adenosine3’,5’-cyclic monophosphate,cAMP)。cAMP作为第二信使,可以调控下游多种信号通路,包括直接结合环化核苷酸门控离子通道(cyclic nucleotide-gated channels,CNGCs),来调节生物体内多种重要生命活动。本研究以甘蓝型油菜为材料,利用转基因、生
学位
体育学科核心素养不再是健康素养与体育素养的简单融合,而是高度凝练了运动技能、体育精神文化及体育健康行为于一体的完整体系。党和政府对体育教育改革工作给予高度重视,强调要全面贯彻党的教育方针,促进中小学生运动能力、健康行为、体育品德等核心素养的形成,为实现“健康中国”“体育强国”贡献体育学科的独特力量。作为学校体育课程改革的内在驱动力,将体育学科核心素养融入初中体育教学,对加快体育教育高质量发展,坚定
学位
城市作为一种社会-经济-自然复合生态系统,表现出明显的复杂性、人为性、风险性和综合性,一旦形成就受到多种要素的影响冲击与慢性的扰动。城市洪涝灾害已成为影响城市地区经济社会发展的主要自然灾害之一,防灾减灾问题在国家、城市发展及学术研究等各层面上均引起了广泛关注和高度重视。城市韧性作为一种城市风险治理的新思路,重点提升城市系统自身组织、功能协调、适应不确定性的能力,关注自然要素和人为因素变化所具有的可
学位
技术创新作为提升产品核心竞争力和创新质量的关键影响因素,对企业赢得竞争优势以实现长期可持续发展意义显著。而面向特定技术领域,通过研判技术发展趋势,明晰潜在研发热点,进而识别技术机会是企业精准高效实现技术创新能力的重要路径,但现有基于专利信息挖掘的技术机会识别大多较少考虑技术主题发展趋势及创新过程的随机动态属性,且较少从多维角度进行创新主题的分解和细化,由此极大地影响了技术创新机会识别结果的精准性。
学位
环化腺苷酸(adenosine 3’,5’-cyclic monophosphate,c AMP)是最早发现的“第二信使”信号分子,能够参与细胞代谢、基因转录和信号转导等多种生命活动过程。c AMP由腺苷酸环化酶(adenylyl cyclase,AC)直接催化ATP生成,并被磷酸二酯酶(phosphodiesterase,PDE)水解,这两种酶的拮抗作用决定了细胞内c AMP的稳态水平。一般认为
学位
解磷菌(Phosphorus-solubilizing bacteria,PSB)可以提高植株对磷营养元素的吸收率,对促进植物生长具有重要作用,是目前农业促生菌研究的热点之一。然而,由于土壤中存在微生物的竞争作用以及土壤养分不足等因素,影响了解磷菌在农业生产中的开发和利用。生物炭(Biochar,BC)是一种多孔隙、吸附能力强的环境友好型载体,可为解磷菌在土壤中的生长和定殖提供合适的栖息地。目前有
学位
陆地棉(Gossypium hirsutum L.)是生产天然纤维的主要作物。转录组测序技术(RNA-Seq)迅速发展,已成为研究棉花基因表达最主要的技术手段之一。纤维强度和长度是衡量纤维品质的重要性状,受多基因的控制。如何在保证纤维产量的同时提高纤维品质,是陆地棉育种亟需解决的问题。本研究前期利用纤维品质优异的大铃材料中R014121与纤维品质较差的早熟品系EZ60杂交,构建分离群体,通过高通量
学位
党的十九大提出生态优化、绿色发展理念,其中化肥减量增效是重要内容,目前化肥减量增效主要集中在对氮肥用量的调控。河南省连续14年实现年粮食产量超千亿斤,但存在盲目施氮和氮肥用量过大现象,氮肥长期的不当投入严重损害了生态环境,也使部分地区施氮的增产潜力缩减。在此背景下是否应大幅度降低氮肥用量,减量应该在什么基础上减,以及该如何确定适用当前农业生产的施氮量成为主要问题。本研究综合河南省“3414”田间试
学位