顾及邻域相似性的面实体匹配最优化方法

来源 :武汉大学 | 被引量 : 1次 | 上传用户：zhaoliping1984

【摘要】

：

随着基于空间位置服务应用的蓬勃发展,对空间数据质量的要求越来越高,为保持空间数据现势性,对数据的更新周期要求越来越短。同名实体匹配是改善空间数据质量、解决空间数据

【作者】

：

蓝振家

【出处】

：

武汉大学

【发表日期】

：

2017年01期

【关键词】

：

多尺度面实体匹配位置偏差邻域相似性全局寻优

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

随着基于空间位置服务应用的蓬勃发展,对空间数据质量的要求越来越高,为保持空间数据现势性,对数据的更新周期要求越来越短。同名实体匹配是改善空间数据质量、解决空间数据更新问题的关键技术。面状要素,如建筑物、居民地等,作为空间位置服务中使用最频繁的要素,因分布密集、轮廓形状复杂等特点,再加上位置偏差以及多尺度等客观原因,已经成为同名实体匹配最复杂最重要的部分。通过综合分析国内外目前已有的面实体匹配方法,本文以面实体的邻域环境相似性与全局寻优的匹配策略为基础,以居民地为研究对象,分别设计一对一以及一对多的面实体自动匹配方法从而解决多尺度下面实体匹配问题,其主要工作内容和创新点如下:(1)研究了自动确定指标阈值(匹配参数)的方法。在分析了传统设置匹配参数过程的基础上,本文提出通过选取已经确定匹配的样本集,反复训练,结合匹配结果的反馈从而优化匹配参数的方法。相比于以往根据经验设置匹配参数,该方法更加客观,避免了人为主观性设置参数给匹配带来的不确定性。(2)研究了优化同名候选匹配集合搜索效率和准确性的方法。对面实体建立空间格网索引,避免对数据集的全局遍历。同时利用同名实体间的最大距离偏差与几何相似度阈值确定最终的同名候选匹配集合。该方法在优化搜索同名候选匹配集合效率的同时,避免了同名实体的遗漏。(3)提出了一种新的面实体邻域相似性评价方法。在分析了已有的邻域相似性评价方法基础上,本文提出将距离面实体东南西北四个方向最近的要素作为构建面实体邻域环境空间结构的集合,该方法在充分顾及面实体邻近关系的同时,在算法的实现上较快。(4)提出了顾及邻域相似性与全局寻优匹配策略的多尺度面实体匹配方法。综合分析了在多尺度条件下位置偏差对面实体匹配带来的影响,分析了当顾及面实体邻域相似性以及采用全局寻优匹配策略时能有效降低影响。据此,本文提出了顾及邻域相似性与全局寻优匹配策略的多尺度面实体匹配方法。该方法在多尺度条件下,能有效克服位置偏差对匹配造成的影响,特别对居民地这种形状同质化程度高、位置集中的情况下优势更明显,能够大幅提高匹配正确率。

其他文献

浅谈新时期领导干部的官德建设

新时期我们党正式提出和确立了"德才兼备、以德为先"的领导干部选拔标准,在这样一个大的背景下,研究如何加强领导干部的官德建设无疑具有非常重要的意义。文章从加强领导干部

期刊

新时期领导干部官德建设

基于EVIDEM的新技术医保报销循证决策框架探析

本研究基于EVIDEM构建新技术的医保报销循证决策框架。采用文献分析、专题小组讨论和定性访谈初步构建决策框架,通过专家咨询确定准则的必要性和权重。建立的循证决策框架由

期刊

新技术医保报销循证决策框架

八十年代中国文学中的荒诞

<正> 荒诞是20世纪西方文学的大风格。由于社会、文化和艺术观念等方面的原因,在中国,直到80年代中后期,荒诞才成为重要的文学现象。那么,80年代中国文学中的荒诞是在怎样的

期刊

人与世界尤奈斯库八十年代

跗骨窦综合征的影像学诊断研究

目的观察、分析临床诊断的跗骨窦综合征患者及正常志愿者踝关节X线、MSCT及MRI的影像学表现，探讨对跗骨窦综合征的诊断有指导价值的影像学检查方法，为临床诊断提供更为可靠依据

学位

跗骨窦综合征颈韧带MSCTMRI对照

节能减排降本增效

中国铝业山东分公司节能降本之路非一朝一夕之功,而是一步一个脚印。他们着力内部挖潜和管理创新,推动清洁生产,发展循环经济,加快节能技术改造,建立降本长效机制。这些有效

期刊

中国铝业山东分公司化学品氧化铝降本增效粉煤灰砖氧化铝熟料窑交流电耗烧结法氧化铝发展循环经济碳分分解长效机制

积极构建医联体模式全面探路分级诊疗

<正>为进一步深化医药卫生体制改革,更好实现区域医疗服务资源利用的最大化,促进分工协作机制健康、可持续发展,山东省乳山市紧紧围绕分级诊疗体系建设,全面整合市内外医疗资

期刊

分级诊疗乳山市医联体模式北大人民医院

REFLEXⅢ基质辅助激光解析电离时间飞行(MALDI-TOF)质谱仪的特点及应用

ＲＥＦＬＥＸⅢ基质辅助激光解析电离时间飞行（ＭＡＬＤＩ－ＴＯＦ）质谱仪（图１）是布鲁克公司推出的世界上最灵敏的ＭＡＬＤＩ－ＴＯＦ质谱仪，该仪器配有自动制样机，无网离子的延这引出技术，无网双聚焦反射器，除可测各种分子的分子量外

期刊

基质辅助激光解析电离技术飞行时间质谱仪蛋白质组蛋白质多肽聚糖核甘酸

荧光探针法测定水环境中汞离子的研究

汞离子是环境中的一种重要污染物，主要以无机阳离子的形式排放到环境中，进入水体的汞离子在食物链的生物放大作用下富集，最后进入人体，因此水体中微量的汞离子也会严重危害生物和

会议

荧光探针汞离子水环境安全评估

关注TPM 提升生产效率

<正>全员高效生产维护(TPM)是精益制造中较难执行的工具之一,其要求企业内跨职能范围的设备维护团队共同努力,并适时接受培训。在按照传统方式运行的印刷车间中,设备操作人员

期刊

TPM精益制造高效生产生产效率

关于企业会计准则解释第5号之企业合并的解读

企业会计准则解释第5号解决了合并报表当中区分同一控制下和非同一控制下的合并会计报表难题,而是做一样的会计处理,大大简化操作,便于会计人员接受,准则也不会前后矛盾。

期刊

准则解释合并报表

顾及邻域相似性的面实体匹配最优化方法

与本文相关的学术论文