论文部分内容阅读
近年来,随着移动互联网、智能硬件和人机交互技术的迅速发展和普及,大量用户正在以前所未有的多样化方式,从不同视角亲历和记录城市发展变迁的点滴细节。另一方面,各种基于位置的服务(如百度地图、Google地图)为人们的日常生活提供了诸如导航、定位和推荐等多种便利功能,并在不知不觉中记录了城市微观层面的发展变迁。这些记录城市演化过程的移动感知数据为研究城市发展提供了全新的机遇和挑战。与此同时,伴随着城市的快速发展,大量兴趣点(简称为POI)会经历新增、稳定发展到最终衰亡的动态演化过程。换言之,POI作为城市功能的基本组成单元,其兴衰演变的过程,正是城市发展的微观缩影。本文开展了针对POI演化预测方法的一系列探索性研究。通过结合来自地理信息系统的POI演化数据和来自城市环境的多源异构移动感知数据,从演化建模、生命周期预测和演化趋势预测三个方面开展了研究工作。具体来说,本文的主要研究内容如下:第一,针对城市中的POI演化这一客观存在现象,研究了POI生命周期建模方法,进而从POI生命周期以及POI演化趋势等形式化手段作为切入点,对城市POI演化模式进行了分析研究。针对POI快照数据的碎片化和分布不均问题,通过应用时序分析方法,有效地表征了POI生命周期。并根据地图数据的时间依赖性,对POI生命周期状态进行了形式化定义。与此同时,利用测度理论,提出了POI流行度联合分布的概念,并以此为基础,对POI演化趋势实现了形式化建模。最后,基于现实世界的大规模POI演化数据,对特定城市的POI演化模式进行了多维度分析。第二,提出一种基于多源异构情境信息融合的POI生命周期检测方法。具体而言,首先将POI生命周期检测问题形式化为两阶段预测问题:通过对不同时间片中的POI生命状态进行多分类预测,进而,利用生命周期估计算法,实现对未知POI的生命周期检测。其次,利用城市地理依赖关系以及多粒度用户移动行为模式,对多源异构情境信息进行有效融合。特别地,针对用户移动行为的多尺度周期性,分别从点域、网格域和基于密度峰值聚类算法的城市划分三个角度,对用户移动行为模式进行全面分析。最后,在特定城市的真实数据集上进行了大量实验。实验结果从特征提取以及POI生命周期状态分类等方面,验证了POI生命周期检测方法的有效性。第三,通过对多类别支持向量机进行扩展,提出了一种基于多任务学习的POI生命周期状态识别方法。该方法可以在有效利用与城市演化相关的多维度领域知识的基础上,结合多任务学习方法和稀有类别分类方法,解决POI生命周期状态样本的不平衡性难题,从而实现POI生命周期状态的有效识别。接着,通过利用不同类别之间的关联,以及综合考虑不同时间片之间的依赖关系,提出了一种全新的多任务多类别分类模型(MMKVM)。特别地,针对MMKVM模型的优化,通过结合拉普拉斯正则化、优化问题的对偶形以及优化问题的子空间分解,实现了一种高效参数学习算法。最后,在特定城市的真实POI演化数据上进行了大量实验。结果表明,提出的POI生命周期状态识别方法相较于主流(多类别)分类算法,性能有了明显的提升。第四,针对易失性POI(简称为vPOI)的演化趋势预测问题,提出了一种基于条件随机场(简称CRF)理论的vPOI演化趋势预测方法,从而实现了POI演化趋势的动态预测。首先,将vPOI演化趋势预测问题形式化为多元回归问题。其次,考虑到模型的可控性以及城市环境中移动感知数据的丰富性,提出了一种动态-连续CRF模型(DC-CRF)。并通过考虑输入与输出变量的关联关系以及输出变量之间的多维度交互关系,设计了多样化的二次特征函数族。进而,通过将原问题的条件概率分布转化为多元高斯形式,并结合最大似然估计,实现了DC-CRF模型的参数估计算法。最后,利用采集自Google地图的POI演化数据以及城市信息系统中所产生的丰富领域知识,进行了大量实验。结果表明,提出的vPOI演化趋势预测方法,在多种预测评价标准中均优于主流回归方法。综上所述,本文面向现代城市发展过程中兴趣点的兴衰变迁,针对城市兴趣点的生命周期预测问题,提出了POI生命周期建模、基于多源数据融合的POI生命周期检测方法、基于多任务学习的POI生命周期状态识别方法以及基于条件随机场理论的易失性POI演化趋势动态预测方法,并通过理论分析及大规模实验验证了它们的有效性,为研究现代城市的演化发展理论和智慧城市新型应用提供了重要的理论和技术支撑。