论文部分内容阅读
随着经济社会的发展和科学技术的进步,土地的利用方式也在不断的发生变化。土地利用分类是确定土地利用现状的基础和前提,主要反映了人类对土地利用的形式与影响。通常可以通过地表地物的表面物理特征和社区的功能划分来确定土地利用类型,不同土地利用分类中存在着不同模式的人类活动。传统社会调查方式成本较高,数据量小且周期较长;遥感技术被认为是土地利用分类的重要手段,但是遥感数据只能捕捉地表地物的物理特征,不能识别居民的人类活动模式。信息化社会的发展进程中产生了大量与人类活动相关的数据。由于移动手机的普遍应用和通信网络的迅速发展,可以从移动手机数据中检索到居民活动以指示土地利用的社会功能。本研究以意大利米兰市电信的手机通话数据作为数据源,数据格式为时间序列。通过Decompose时间序列分解算法将手机通话时间序列数据分解为趋势项、周期项和随机项。首先基于分解算法对手机通话数据进行时空特征分析,在时间分布特征上,分析手机通话数据在24小时内的周期性变化和一周时间内的趋势性变化特征;在空间分布特征上,基于Kmeans聚类算法进行空间聚类和基于归一化值的核密度分析。发现手机通话数据对于人类活动强度和城市空间形态具有一定的代表性。然后基于监督分类的随机森林分类算法,分别采用剩余项(Residual)、趋势周期项(TrendSeasonal)、随机项(Random)三种特征提取方法对手机通话时间序列数据进行特征提取以用于土地利用分类。研究发现在使用随机项(Random)作为特征点进行土地利用分类时精度最高,可达到55.22%。同时本研究基于推特开源的AnomalyDetection时间序列异常检测算法进行手机通话数据时间序列异常值检测并进行修正,发现异常值修正之后的时间序列数据用于土地利用分类时精度有所下降。与国内外相关研究对比发现基于手机数据进行土地利用分类精度都有所偏低,最后尝试分析了出现分类精度较低的原因以及后续工作的展望。本研究为基于手机通话数据的土地利用分类研究提供了新的研究角度和思路。