基于随机森林与多源大数据的昆山市通勤量模型研究

来源 :南京大学 | 被引量 : 0次 | 上传用户：wooicheang

【摘要】

：

【作者】

：

秦艺帆

【机构】

：

南京大学

【出处】

：

南京大学

【发表日期】

：

2023年01期

【基金项目】

：

国家自然科学基金项目:公平和可达双重维度下的大城市公共交通实质性优先分析方法与优化（51778277）； the National Natural Science Foundation of China:Research on Essentially Prior Urban Public Transport Analysis and Optimization in

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

通勤出行是城市居民日常活动中的重要组成部分,其中通勤发生量、通勤吸引量与OD间通勤量不仅是通勤需求预测关心的指标,相关研究成果对于规划管理政策制定或城市建设项目评估等更是有重要的决策参考意义。随着大数据时代的到来与机器学习技术的蓬勃发展,目前国内外研究已有利用手机信令数据为代表的大数据以及以机器学习为代表的新兴技术对通勤量研究进行了新探索,虽然一定程度上弥补了以往研究中数据获取成本高、效率低、覆盖范围小等数据层面的不足,改善了传统方法与模型存在的假设条件不合理、结构不灵活、估测精度较低等问题,但是大多数研究中大数据的作用局限在作为抽样调查数据的替代或者为传统模型增加影响因子,而机器学习方法的使用仍旧基于单一的居民或家庭出行调查数据,致使新数据与新技术拟合与预测通勤量的潜力未充分施展。不仅如此,已有研究对于影响因素的选择不够全面,也缺乏不同影响因素与通勤量之间复杂关系的深入讨论。本文取机器学习领域的随机森林作为估算、预测与分析通勤量的研究方法,基于手机信令数据、地图兴趣数据、路径规划数据、用地现状数据以及房价房租数据等多源数据,在系统归纳分析通勤量的影响因子基础上以昆山市中心城区为实证区域,提出了融合随机森林算法与多源大数据的通勤量模型（通勤发生量模型、通勤吸引量模型、研究单元间通勤量模型）构建方法。继而识别了对通勤量最为关键的因子并深入探究了各关键因子与通勤量间的复杂非线性关系,以期为大数据时代背景下昆山多元复杂的通勤需求预测分析提供服务,为昆山规划管理部门针对性地制定土地利用、交通管理等相关政策等提供科学的决策依据。本文主要内容与结论如下:（1）建立适用于通勤量估算或预测的特征集。遵循特征工程的流程,分别为通勤发生量模型、通勤吸引量模型以及研究单元间的通勤量模型设计人口就业、建成环境、社会经济、通勤出行、单元区位、单元面积六方面特征,通过分析平均精确度下降值（Mean Decrease Accuracy）的方式选择16个、19个、16个对模型性能影响较大的特征参与模型构建。（2）提出基于随机森林的通勤量模型构建方法。基于随机森林算法,以研究单元的通勤发生量、吸引量以及研究单元间通勤量为因变量评估结果并分析误差产生原因,结果表明:（1）通勤发生量模型和通勤吸引量模型取得较高的精度和泛化能力,R~2分别达到0.81和0.69。（2）研究单元间通勤量模型分结果可信度差且存在过拟合问题,其R~2不足0.2,表明当前手机信令数据的精度和质量尚不足以支持较小的研究单元尺度下OD间通勤量的估算与预测。（3）通勤发生量模型和吸引量模型估算结果较可靠,通勤发生量估算值、吸引量估算值与对应实际值的R~2分别达0.87和0.78,此外多重共线性现象不影响结果。（4）误差主要由于研究数据或研究尺度限制、绿地水体特征缺乏而导致,表现在:低估“宿舍-工厂”密集片区生成量,略高估市区核心地段、花桥边缘区的生成量,并且高估分布有大面积绿地水体的研究单元的发生量。（3）识别对通勤量最为关键的因子。通过分析特征重要性,研究发现通勤发生量与吸引量的关键因子较为相似,并且各自前七个关键因子的累计重要性均达到94%以上。具体表现在:居住人口密度和就业人口密度分别是对通勤发生量、通勤吸引量最为关键的因子,重要性分别达0.60和0.52。居住人口密度、就业岗位密度、单元面积、平均通勤距离、平均换乘次数、平均租金均是两类通勤量的关键因子。不仅如此,平均房价和建设密度分别对发生量、吸引量有一定影响。（4）探讨关键因子与通勤量之间的非线性关系。通过分析特征贡献的数值分布、变化趋势与空间差异,研究发现:（1）居住人口密度、单元面积和就业岗位密度对通勤发生量与吸引量估算值有决定作用,而其他因子能够对结果起到修正作用。主要体现在:上述三个关键因子的特征贡献值域和高密度数值区间均较大,可以极大地将随机森林节点输出值从偏差改变至估算结果,而其他因子的特征贡献范围和高密度数值区间则较为局限。（2）关键因子对通勤发生量与吸引量的影响程度随自身值的增加呈现不同趋势。就发生量而言,居住人口密度和就业岗位密度的影响力随其值增加,达到峰值后保持不变,转折点对应50000人/km~2和70000人/km~2,该规律与单元面积限制有关;平均公交换乘次数i与平均通勤距离i的影响力呈现先略微下降,后迅速上升,最后保持稳定的分段规律,转折点对应0.8次和5km、1.3次和9km,不同分段与研究单元公共交通发达程度、通勤距离类型有关。就吸引量而言,居住人口密度、就业岗位密度、平均公交换乘次数j与平均通勤距离j影响力的变化规律与其在估测发生量时呈现的趋势一致,但是前两者影响力峰值发生改变并且后两者对吸引量更重要;建设密度的影响力与其值存在负相关关系,但负向影响的程度不大。（3）关键因子对通勤发生量与吸引量的影响程度存在与其变化趋势、发生量与吸引量空间分布特点、自身值空间分布特点有关的空间差异。其中,居住人口密度影响程度较高的地区与通勤发生量密度、人口密度的高值区分布一致,即核心区、城北西路沿线以及核心区周边沿交通干道分布居住区;就业岗位密度影响程度较高的地区与吸引量密度、就业岗位密度高值区相对应,且高值区拓展到核心区外的企业密集区;平均换乘次数和平均通勤距离的影响程度总体呈现内低外高的“核心-边缘”格局,分别对应其变化趋势的两段规律;建设密度的负向影响主要分布于核心区和周边主要的居住片区,而正向影响则分布于工业园、产业园,这与核心区研究单元建设密度高但吸引绝对量较小、吸引大量通勤的园区建设密度较低等因素有关。本文正文共约51 438字,图表123幅。

其他文献

光响应型二维COF基复合材料在光催化还原中的应用研究

近年来,随着人类对化石燃料的过度需求,已经导致了严重的全球能源短缺和CO2过度排放问题,因此我们更迫切的需要开发出可再生的清洁能源（如水裂解产生氢气）以及降低大气中CO2的浓度（如碳中和实现C1化合物生成）。目前,半导体材料已经在光催化还原CO2、水裂解析氢和降解污染物等领域有了广泛的研究,但常见半导体,如锐钛矿,金属硫化物,金属有机骨架（MOFs）等,存在可见光响应范围窄,且表面光生电荷易复合等

学位

肿瘤微环境敏感的纳米显像治疗剂的构建及性能研究

化学疗法是临床上最常规的癌症治疗手段。为解决单一化学治疗产生的耐药性,不能随时诊断和监测药物在肿瘤部位的分布情况,疗效不佳且副作用严重的问题。在肿瘤治疗学领域中,用于癌症治疗的多功能药物输送系统（DDS）引起了人们的极大兴趣,开发具有早期诊断和监测能力,增强的药物递送,有效的生物降解和多种治疗方式协同治疗的DDS仍然是科学挑战。多功能DDS是在单个纳米平台内整合多种治疗方式和成像技术,其结合了每种

学位

功能化纳米药物递送载体的制备及其在协同治疗领域的研究

纳米药物递送系统（DDSs）的出现解决了当前小分子抗癌药物在化疗过程中表现出的局限性,包括病灶部位的药物浓度偏低、水溶性差以及对健康组织的毒性。当前,药物输送的研究主要以精确靶向、精确剂量输送以及低毒性为目标,以实现最佳治疗效果。本论文基于可逆加成-断裂链转移（RAFT）聚合,依据肿瘤微环境的特征合成不同响应类型的功能化聚合物药物递送系统,将化疗与其他治疗方式相结合,以达到抑制肿瘤细胞生长的目的。

学位

小学全科教师跨学科教学能力职前培养路径研究

小学处于基础教育阶段，对学生的未来有着重要影响。小学教师作为学生学习的引导者和促进者，其综合素质关系着小学教育的质量，而在外部环境日益复杂和内部竞争愈加激烈的背景下，小学教师必须具备跨学科教学的能力，包括多元知识体系构建、问题解决能力、组织设计能力等。文章阐述了跨学科教学能力的概念和内容，总结了小学全科教师跨学科教学能力职前培养存在的挑战，最后从多个角度提出了小学全科教师跨学科教学能力职前培养的路

期刊

迈好军旅第一步

报纸

基于韧性矩阵理论的城市灾害韧性实证研究——以“台风利奇马”和“新冠疫情”事件为例

随着风险社会的到来,城市脆弱性和不确定性因素逐渐增加,提升城市抵抗和吸收灾害风险的能力,建设韧性城市,越来越受到国际社会的重视。尽管近年来,我国开展了大量韧性城市研究工作,但如何系统地、动态地认识韧性却一直是学界争论的重难点议题。在网络信息及其终端设施快速发展的背景下,微博等社交媒体平台的运用越来越广泛,逐渐参与到了城市政务管理、突发事件信息传播等方面,而其时间、空间、内容属性,也为城市灾害韧性的

学位

生活圈视角下的社区公共服务设施空间分布模式及其影响因素研究——以南京市主城区为例

我国东部地区大城市已经进入城市化发展的中后期阶段,长期以来的快速土地城镇化进程带来了空间品质低下、公共服务设施建设滞后等问题,尤其是社区尺度的公共服务设施供给与需求的不匹配对城市公共服务的效率和居民生活的便利性产生了负面影响。随着以人为本理念下的生活圈规划成为我国住区规划的主要模式,公共服务设施的高品质供给成为社区生活圈建设的关键环节,对公共服务设施供需匹配程度的评价及其影响因素的探讨是生活圈领域

学位

中国城市化与老年人健康耦合关系研究

当下,中国城市化和老龄化进入叠加快速发展时期,推动产生了城市化和老龄化的“双高”局面,并且这一趋势将持续进行。同时,城镇化发展建设过程中的健康问题越来越受到各界关注,健康中国上升为国家战略,健康老龄化也受到了高度关注。城市化与老年人健康之间的相互影响日益显著,但是目前学术界对于两者的研究相对割裂,缺乏宏观尺度上两者互动关系的分析。本研究在梳理现有理论和文献基础之上,以中国31个省市自治区为样本,选

学位

中国反城市主义思想研究（1900-1990）

当前中国的城镇化存在城市极化发展,乡村、区域发展不足的问题。实践中仍然以强化城市集中作为解决偏重发展的手段。但城市偏向的总体结构,反而是阻碍城乡发展的原因。实践的悖论指明当前偏重城镇化的核心问题,不在于实践,而在于思想,实践背后的城镇化理论陷入了逻辑困局,折射出总体思想环境的一元化。健康的思想环境会通过不同思想之间的竞争来实现自我完善,尤其是批判性思想对于主流思想的超越;但一元化思想环境的出现,意

学位

耳边的朋友：听觉回归中的声音社交研究

在陌生人社交领域,声音作为人与人之间心灵沟通最古老的一种渠道,在新媒体环境下正在重新回归。这表现在各式各样的声音社交软件的崛起及其在受众中的流行。当孤独感成为青年的情感常态,追求“独”与“群”的新时代青年们转向使用声音社交来愉悦身心、获得陪伴,给了听觉文化重新被滋养的空间。本研究对当下中国互联网上的声音社交软件及其使用情况进行了深入考察。通过产品分析、文本分析和深度访谈,解析了声音社交软件兴起的因

学位

基于随机森林与多源大数据的昆山市通勤量模型研究

其他学术论文