中文地址编码关键技术的研究

来源 :南京师范大学 | 被引量 : 0次 | 上传用户:zsj1502
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
地址编码是联系空间地理信息与非空间地理信息的桥梁,是各种应用地理信息系统中必不可少的环节,也是数字城市的基础性组成部分。然而,由于中文地址自身的诸多原因,使得中文地址编码存在很多难点问题,以至于国外在地址编码方面的许多成熟技术不能直接应用于中文地址编码。本文在总结了国内外地址编码的相关研究进展的基础上,从地址规范化表达、地址解析、地址模型的构建、地址匹配等几个部分对地址编码的相关技术进行了研究,探讨相应的解决方案,设计原型系统并将其应用到相关的案例中,主要研究内容如下:   (1)中文地址规范化表达:分析中文地址的组成要素,研究不同概念粒度层次的地址要素类型及其等级关系,制定标注规范;提取地址通名,并按照地址要素分类体系对地址通名进行归类。   (2)中文地址解析:在确定中文地址要素分类体系的基础上,从规则和机器学习两个方面出发,设计了基于规则的地址解析算法流程和基于条件随机场的地址解析方法,实现了基于规则的地址解析与基于条件随机场的地址解析。实验证明两者的解析正确率分别达到93.6%与95.7%,符合大规模处理数据的要求。   (3)中文地址模型的自动化构建:在分析人工归纳地址模式优缺点的基础上,从地址要素间的二元关系出发,将数据挖掘中关联规则的方法首次运用到了地址模型的挖掘中,实现了基于关联规则挖掘的地址模型自动构建,对模型进行可视化显示,并探讨其在地址标准化方面的应用。   (4)中文地址匹配:在分析字符匹配相关算法的基础上,根据地址匹配的特点,设计了地址匹配的算法,实现了地址匹配的智能化。并在此基础上,设计了地址定位的相关策略,实现了地址的匹配定位。
其他文献
准确的作物生长和产量品质动态监测预测对于保障粮食安全、促进农业可持续发展具有非常重要的意义。作物模型是作物生长及产量品质预测的强有力工具,然而作物模型由单点模式发展而来,在区域应用上由于区域分异、田块分异等导致作物模型运行要求的输入参数和初始条件难以获取,从而使作物模型的应用受到很大的限制,而遥感的引入将使这个问题得到有效解决。将遥感信息和作物模型相结合,利用遥感信息反演得到的状态变量优化作物模拟
含有三个未知数,并且每个含未知数的项的次数都是一次,一般来说含有三个方程(有时会有特例,但是所有的三元一次方程组都有三个未知数),这样的方程组叫做三元一次方程组 .解三元一次方程组,通常通过加减消元法或代入消元法先把三元一次方程组转化为二元一次方程组,进而再解出二元一次方程组,然后代入其中一个三元一次方程,最后得出三元一次方程组的解.但对于某些特殊的三元一次方程组,我们不能通过这种方法解出方程组的