论文部分内容阅读
人口过快增长和过度集聚已经成为城市管理的重大挑战。进行人口空间分布精细化监测,对城市科学管理和资源配置优化有不可忽略的意义。上海市是我国的一个超大城市,其在人口控制和城市管理领域的挑战具有典型性,有必要研究针对超大城市的人口空间分布精细化监测的体系。对城市进行人口空间分布精细化监测需要快速准确地获取人口空间分布数据。已经有较多研究探讨了获取人口空间分布的方法,但以往研究多遵循自上而下的思路,在行政单元上使用统计数据建模,难以在格网粒度上直接讨论人口空间分布与影响因素的关系;此外,过去研究缺少对模型内部机制的探索和解释。本文选取夜间灯光数据、土地利用数据和兴趣点(下称POI)数据等多种不同来源的空间数据,提取了如夜间灯光强度、土地利用类型面积占比和POI核密度等与人口空间分布关系紧密的特征,应用随机森林算法,创建并训练了基于500米格网的人口空间精细化分布模型,并对模型进行评价和解释,还生成了上海市500米人口空间分布格网数据。具体的研究结果分为以下两个方面:(1)基于随机森林算法和多源空间数据建立人口空间精细化分布模型。本文得到的模型整体精度较高,R~2约为77.4%,整体平均绝对误差大约是217人,模型的检验结果表明模型具有较强的泛化能力。(2)采用一种基于决策路径估计的随机森林解译方法,计算了影响模型估算结果的特征的贡献,并探讨了特征贡献与模型的关系。研究发现主要的住宅类土地利用类型对模型估算结果有重要影响,其贡献值随着特征值的增大而增大;一些属于人类活动功能性的服务也对模型估算结果产生一定影响,如医疗保健服务、生活服务类POI等。应用本文的研究方法可以较为方便快速地得到城市人口空间分布情况,能够为城市精细化、精准化管理和决策提供有力支持。本文提出的基于随机森林算法的人口空间分布模型可以推广到其他城市,也可以建立不同城市格局的情景,模拟不同情景下城市的人口空间分布状态。