论文部分内容阅读
随着3S技术的不断发展,时空序列数据的体量迅速增加。同时,数据获取技术与存储能力不断完善,更多不同类型的时空数据成为地理学的研究对象。时空序列数据作为空间地球大数据的典型代表,被广泛应用于多个研究领域,并受到越来越多的关注。这些时空序列数据对时空分析、资源环境监测、地球空间认知等科学研究具有重要意义。在时空序列数据量急剧增加的同时,数据劣质问题更为凸显。受数据获取手段、数据传输、存储等诸多因素的限制,时间序列数据不完整、噪声等问题频繁出现,多要素空间数据的尺度不一致问题更加凸显。这些劣质问题已成为时空序列数据分析、建模、知识挖掘等研究的瓶颈,带来了新的挑战。劣质时空数据的传统处理方法大多假设时空数据分段、分片光滑,或直接借助于经典统计方法来处理。而时空序列数据既有时空局部相关和渐变的一面,又存在着时空数据突变的情况,并且其非线性、非平稳性特征显著,使得传统方法处理这些数据劣质问题具有一定局限性。鉴于此,本文针对时空序列数据的不完整、噪声及尺度差异等问题,深入探讨这些数据劣质问题的处理方法:1)缺失值估计研究:针对时间序列的多值缺失,提出使用非线性回归分析法来处理;针对时间序列的单值缺失,利用改进的非局部平均法来估计,充分考虑时间序列中数据规律的非局部相似性;2)去噪研究:针对时间序列的噪声问题,通过分析噪声统计模型,研究基于非局部平均的去噪方法,充分挖掘序列中数据规律的自相似性;3)尺度转换研究:针对地理空间数据的尺度不一致问题,研究高斯金字塔尺度转换方法,借助于高斯平滑模糊特性,实现空间分辨率的降低。基于以上方法研究,本文利用京津冀地区的多个地理时间序列和空间数据进行实验分析,验证本文方法的有效性。由实验结果可知,在缺失值估计时非线性回归分析法和改进的非局部平均法能够解决传统统计方法处理数据规模较小且模型参数复杂的问题,也克服了传统方法仅考虑局部相邻数据影响的局限,对长时间序列具有较好的适应性;非局部平均法有效地去除了噪声数据,很好的保持了地理时间序列的非线性、非平稳的趋势;高斯金字塔方法解决了传统方法易忽略数据的极端变化情况以及忽略研究对象的空间相似性变异的问题,对空间数据的局部细节特征具有较好的保持性。