论文部分内容阅读
随着基于空间位置服务应用的蓬勃发展,对空间数据质量的要求越来越高,为保持空间数据现势性,对数据的更新周期要求越来越短。同名实体匹配是改善空间数据质量、解决空间数据更新问题的关键技术。面状要素,如建筑物、居民地等,作为空间位置服务中使用最频繁的要素,因分布密集、轮廓形状复杂等特点,再加上位置偏差以及多尺度等客观原因,已经成为同名实体匹配最复杂最重要的部分。通过综合分析国内外目前已有的面实体匹配方法,本文以面实体的邻域环境相似性与全局寻优的匹配策略为基础,以居民地为研究对象,分别设计一对一以及一对多的面实体自动匹配方法从而解决多尺度下面实体匹配问题,其主要工作内容和创新点如下:(1)研究了自动确定指标阈值(匹配参数)的方法。在分析了传统设置匹配参数过程的基础上,本文提出通过选取已经确定匹配的样本集,反复训练,结合匹配结果的反馈从而优化匹配参数的方法。相比于以往根据经验设置匹配参数,该方法更加客观,避免了人为主观性设置参数给匹配带来的不确定性。(2)研究了优化同名候选匹配集合搜索效率和准确性的方法。对面实体建立空间格网索引,避免对数据集的全局遍历。同时利用同名实体间的最大距离偏差与几何相似度阈值确定最终的同名候选匹配集合。该方法在优化搜索同名候选匹配集合效率的同时,避免了同名实体的遗漏。(3)提出了一种新的面实体邻域相似性评价方法。在分析了已有的邻域相似性评价方法基础上,本文提出将距离面实体东南西北四个方向最近的要素作为构建面实体邻域环境空间结构的集合,该方法在充分顾及面实体邻近关系的同时,在算法的实现上较快。(4)提出了顾及邻域相似性与全局寻优匹配策略的多尺度面实体匹配方法。综合分析了在多尺度条件下位置偏差对面实体匹配带来的影响,分析了当顾及面实体邻域相似性以及采用全局寻优匹配策略时能有效降低影响。据此,本文提出了顾及邻域相似性与全局寻优匹配策略的多尺度面实体匹配方法。该方法在多尺度条件下,能有效克服位置偏差对匹配造成的影响,特别对居民地这种形状同质化程度高、位置集中的情况下优势更明显,能够大幅提高匹配正确率。