论文部分内容阅读
随着感知技术和计算环境的成熟应用,各种大数据在城市中悄然而生。如何有效利用现有的主动或被动式城市感应资源(如手机、传感器、车辆和人等),感知、提取和分析城市的各种时空特征,是建设智慧城市的一项重要研究课题。在本世纪,中国的城镇化规模将进一步扩大,城市居民职住分离现象更加普遍,已经发生在大城市的就业地与居住地的布局失衡问题势必进一步扩散和加重,中国城市将普遍面临交通拥堵、空气污染等一系列问题。通过城市感知和城市计算来随时把握城市发展脉动,必将成为现代化城市规划和管理,解决城市问题的新型手段。本文的研究思路在于通过对城市当中多种异源异构的人类行为轨迹数据的获取、整合、分析和挖掘,来提取关于城市在职住空间方面的知识和智能,有效识别和分析城市职住空间的特征。论文的主要研究内容和结论如下:第一章分析了本研究的背景和意义,并从城市职住空间分析、移动轨迹数据挖掘和基于大数据的城市计算三个方向对国内外相关研究进展进行评述。城市职住空间是本文的研究对象,移动轨迹数据挖掘是本文研究的技术手段,基于大数据的城市计算是本文探讨的研究思想。在“以数据为中心”的城市研究指导思想下,从理论上构建基于多源轨迹的人类行为分析和城市空间特征挖掘研究框架。第二章探讨的是语义轨迹数据模型。数据模型是数据特征的抽象,理想的数据模型是任何以数据为中心的研究工作的基础,体现了对研究对象的准确理解和精确表达。本章首先对传统的轨迹概念和轨迹的语义建模进行回顾,其次,比较了面向关系模型和面向聚合模型在语义轨迹建模和表达方面的差异,认为面向聚合模型更能适应于语义轨迹结构复杂多样、数据规模庞大的特点,之后对模型构建过程进行了阐述;再次,以NoSQL数据库——MongoDB作为数据载体,从数据检索、空间索引和分布式集群三个方面对语义轨迹的数据管理做了分析,并分别探讨了各部分的具体内容。最后,文章通过“副本集+分片”的集群解决方案建立了面向聚合的语义轨迹数据库分布式集群,并将其与传统关系型数据库在创建、访问数据和空间查询方面的性能做了对比。结果表明,面向聚合的语义轨迹数据模型在NoSQL数据库集群中具有更好的访问性能。第三章阐述了城市居民出行多源感知数据的获取和处理。城市居民活动的感知数据来自于各种不同传感器,因而通常是异源异构的,本文将其分为主动参与式感知和被动群体感知。在被动群体感知方面,文章采用两类感知平台——出租车车载GPS数据和时空社交媒体数据。在出租车车载GPS数据部分,主要描述了出租车轨迹OD点的提取方法。在时空社交媒体数据部分,设计了面对新浪位置微博的爬取流程和平台,介绍对其进行空间聚类处理的方法,并对所获数据的基本特征做了分析。在主动参与式感知方面,文章面向居民出行调查数据,提出一种耦合手机定位与网络反馈的居民出行调查方法,对其调查内容和设计思想进行了阐述,对整体的调查流程进行了设计;然后对完整出行调查系统进行详细描述,包括采集部分、分析部分和反馈部分,以及如何对最终调查结果的质量进行评价;最后,对调查结果的有效性进行了分析。第四章讨论利用多源位置感知数据对居民通勤行为进行识别的方法。首先采用上海市出租汽车调查系统衍生的大规模出租汽车运营的GPS轨迹数据,将出租汽车的出行活动行为和特征假设为城市居民(乘客)的出行活动行为,进行了宏观视角下的城市时空结构以及居民活动时空热点的研究。文章重点提出一种基于道路网格划分的出租车OD数据聚类方法和移动模式挖掘方法,并以聚类结果为基础结合“职住因子”进行通勤信息提取,从而为职住空间分析提供信息基础。其次,针对位置微博数据,采用模糊数学方法对居民位置的职住性进行识别,在识别过程中,利用居民出行调查数据所得到的个体行为模式作为识别特征,从异构数据中学习到相互增强的知识,并对识别结果进行了检验。第五章从职住平衡和分离的角度以上海市为例对城市的职住空间特征进行研究。首先对职住平衡的概念和城市空间结构的相关研究进行介绍,以及如何以轨迹数据挖掘的方法对其进行研究作出总结;之后阐述通勤效率的度量方法——过剩通勤,并利用微博数据的通勤行为提取结果对上海市的过剩通勤程度进行研究;之后讨论城市社区的特征属性与职住分离现象的关联关系;最后利用地理可视化方法结合出租车轨迹挖掘结果探讨上海市通勤网络特征。本文第六章对全文进行了总结和讨论,重点指出研究的主要贡献和不足,并展望下一步工作的可完善和改进之处。