自然语言空间信息标注及识别

来源 :武汉大学 | 被引量 : 1次 | 上传用户:QQ737618442
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
自然语言是人们日常生活中用于沟通交流的重要工具之一,和人们的认知习惯更加的契合。相比于结构化的计算机语言,非结构化的自然语言更加容易被人们接受。实现热于计算机之间无障碍的“交流”,即实现非结构化的自然语言与结构化的计算机语言之间的无障碍“交流”,成为计算机领域的重点与难点。自然语言中含有地理空间对象、地理空间对象的属性及其地理对象之间的空间关系等大量的地理空间信息。这些空间信息是人们对客观存在及其关系最直接的描写及表达。相比于结构化的地理信息展示,基于自然语言的地理信息服务能够更好的符合人们对于空间信息的认知需求。随着中文文本标注体系的不断完善,从自然语言中抽取非结构化的空间信息并被计算机系统解析可以得到很好的实现。通过构建地理空间信息的标注体系结构,挖掘自然语言中非结构化的空间信息的句法结构,可以将自然语言中的非结构化的空间信息提取出来,并用结构化的计算机语言存储,可以更好地推理出人们对地理空间信息的认知以及描述习惯,更好的实现非结构化的自然语言与结构化的计算机语言之间的“沟通”;将其应用于GIS应用的各个方面,可以提高地理信息服务的质量,更好的服务于人们的生产和生活。本文以实现自然语言空间信息标注及提取,自动识别自然语言中的空间关系为目标,基于现有的自然语言处理的相关技术方法以及中文文本的标注方法,构建基于自然语言的空间信息标注体系、自然语言空间信息描述句法规则,基于条件随机场以及随机森林模型实现自然语言地理空间信息的提取,自然语言空间关系的识别分类。围绕这个主题,主要完成了以下工作:(1)基于《中国地名通名集解》构建了地名通名词典,为包含空间地理实体名称的自然语言语句的分词提供了分词的一个依据;(2)利用归纳总结的方式,对自然语言空间关系描述语句进行了分析,构建了自然语言空间关系描述句法模式;(3)利用基于统计的条件随机场模型对自然语言语料库进行分词解析;(4)结合地理信息的特征及描述语言的特点制定中文文本的地理信息标注体系和标注规范,对自然语言中的地理信息进行标注,构建了标注语料库;对标注后语料库中的词汇进行分类整理,构建了地理实体名称词典、空间拓扑关系词典、空间方位关系词典、空间距离关系词典;对词频进行统计分析,得到人们空间信息认知表达的一般规律;(5)随机抽取标注语料库中的语句作为训练数据,归纳总结了空间关系类型的特征集合,构建了用于空间关系信息识别分类的随机森林模型,对随机抽取的测试语句中的空间信息进行分类识别。
其他文献
目的:评价广泛型侵袭性牙周炎患者在采用不同治疗方法后的疗效。方法:选取20例广泛型侵袭性牙周炎患者,随机分为A组和B组,A组采用龈下超声联合Gracey龈下刮治器进行龈下刮治术1
在对二维码的生成与使用进行系统研究的基础上,将二维码技术首次与AS/RS调度管理系统相结合,并借助各种智能系统下的移动设备,大大改进了AS/RS调度管理系统的入出库效率,使得库存盘点变得简单,解决了人为信息输入的瓶颈。
目的分析不同患龋状态窝沟中的优势耐酸菌构成,了解其在龋病发病中的作用.方法第一年轻恒磨牙窝沟新发早期龋儿童10名,2年无龋儿童10名.取新发龋窝沟处菌斑和同口正常第一恒
针对轧钢机运行时存在功率因数低,谐波含量比较大的特点,依据现场测得的数据,制定了无功补偿和治理谐波的方案,并简述了设备运行的基本原理。设备投入运行后,从现场测试数据表明,电
本文针对切割丝不耐磨问题,通过分析钢丝磨损机理,研发加工工艺管理系统.综合改变压缩率、不同模具参数、不同黄铜丝生产工艺对切割钢丝表面硬度的影响等一系列的参数分析,从
目的 用有限元方法研究双皮层骨种植对牙种植体初期稳定性的影响。方法 建立牙种植体和局部下颌骨块三维有限元模型,利用ABAQUS有限元软件,分析双皮层骨种植对种植体颊舌向和轴