论文部分内容阅读
随着网络技术的飞速发展,万维网已经成为人类最大的信息仓库。面对纷繁复杂的网络资源,如何从中检索出需求的信息成为网络技术研究的热点。近年来,地理信息检索已成为信息检索领域重要的研究方向之一。地理信息检索(Geographic Information Retrieval,GIR)是根据地理查询范围,返回与地理信息查询相关的文档。地理知识库是地理信息检索的基础,它存储了地理实体的知识,主要厂一包括地理实体名称、类别、属性和关系。GIR系统根据地理知识库中的知识识别网页中出现的地名;根据地理实体之间的关系消除地名的歧义并确定网页关联的地理范围。目前,地名辞典和地名库是地理信息检索领域中常用的两种地理知识库,对于消除地名歧义具有重要的作用。但它们是关于地理实体名称的列表,缺少了地理实体语义信息的表达;同时它们虽然可以根据记录地理实体空间边界的覆盖范围实现空间关系推理,但是推理效率低。针对地名库和地理辞典所遇到的困难,本文研究能够充分表达地理实体语义信息并且能够提高空间关系推理效率的地名数据组织模型——地名本体。地名本体是在充分表达了地理实体语义特征和空间关系特征的基础上建立的,因此,有更强的语义信息表达能力,并可以提高空间关系推理的效率。在地名本体中将每个地名实体看作“概念”,地名实体之间的空间关系看作是“概念的关系”。本文首先根据北京城市规则的道路网特点,构建北京城市坐标框架,并对地名实体在城市坐标框架中位置定性表达,在此基础上,结合地名实体分类属性对地名实体“概念”进行明确定义。然后,选取在北京城市定位导航中发挥重要作用的地标,构建层次化的地标参照体系,并依据四方位模型计算地名实体和地标之间的方位关系,以及定性的表达地名实体和地标之间的拓扑关系和距离关系。地名实体和地标之间的空间关系构成了地名实体关系集合,实现了地名实体“概念关系”的表达。最后用三元组的结构对地名本体进行明确的形式化表达,并利用protege本体建模工具结合OWL本体描述语言构建北京城市地名本体。在此基础上,研究基于本体的地名检索服务框架,并设计开发了地名检索的原型系统。