论文部分内容阅读
时空非平稳性分析能够深入揭示地理要素的时空分布规律,更好地理解社会现象和环境的动态过程。时空地理加权回归在地理加权回归的基础上,将时间、空间因素同时纳入回归模型,能够有效地解决空间数据的时空非平稳性问题。本文在分析全局多重共线性诊断方法的基础上,提出了加权条件指标方差分解比方法以诊断时空地理加权回归模型的多重共线性,发展了时空非平稳性检验和时空地理加权自回归的两阶段最小二乘估计方法,提出并实现了半监督时空地理加权回归方法,主要的研究内容包括:(1)时空地理加权回归模型能够同时考虑回归系数的时间和空间非平稳性。因此,论文阐述了时空地理加权回归模型的基本原理和估计方法,介绍了时空最优带宽的选取和时空核函数的构建方法。为了减少时空地理加权回归模型未知参数的个数以简化计算,给出了最优时空因子的选择方法。(2)提出了用于时空地理加权回归模型多重共线性诊断的加权条件指标方差分解比和时空非平稳性检验方法。全局模型的多重共线性诊断方法不适用于局部模型,会漏判时空地理加权回归模型的多重共线性。因此,提出了加权条件指标方差分解比方法,用于时空地理加权回归模型的多重共线性诊断。实验结果表明,提出的加权条件指标方差分解比方法能够有效地探测时空地理加权回归模型的多重共线性。此方法的优点在不仅能诊断出时空地理加权回归模型多重共线性的数量和设计矩阵的所在数列,还能探测截距项的多重共线性问题。(3)发展了时空地理加权自回归模型的两阶段最小二乘估计方法。时空地理加权自回归模型不满足独立同分布的要求,无法直接用最小二乘估计方法。最大似然估计方法对大样本数据进行估计会生成大型矩阵,导致计算耗时较长。两阶段最小二乘方法不要求随机误差满足独立同分布,且能够显著减少计算复杂度。因此,提出了时空地理加权自回归模型的两阶段最小二乘估计方法。首先,对回归系数的时空非平稳性进行假设检验,基于CV法选取了最优空间带宽和时空因子,构建时空核函数建立空间回归模型。分别从自相关、方差分析、拟合优度分析、回归系数分析对实验结果进行分析。实验结果表明,时空地理加权自回归在残差平方和、均方、拟合优度和AIC等指标均取得了最优的拟合效果。(4)提出了半监督时空地理加权回归方法。回归分析会遇到因样本不足造成的小样本问题,学者们通常采用半监督学习方法吸收未标记样本,解决样本数量不足的问题。然而,机器学习领域的回归器因没有顾及空间数据的时空特征特别是非平稳性特征,空间回归分析效果不佳。因此,论文提出了适用于地学领域的半监督时空地理加权回归方法。以时空地理加权为差异性回归器,利用标记样本建立空间回归器来训练未标记样本,并选取置信度高的未标记数据扩充标记样本,重新建立回归器以提高整体性能。分别以模拟数据和真实数据进行实验,并对训练过程中回归器的稳定性和预测结果进行分析。实验结果表明,提出的方法在残差平方和、均方根误差、AIC指标均有显著提升,半监督时空地理加权回归方法能够充分吸收未标记空间数据,建立稳定的空间回归器,效果最优,证明了提出方法在少量标记样本条件下优于经典的半监督回归方法。