基于HGML的目标信息地理位置检索机制研究

来源 :成都理工大学 | 被引量 : 4次 | 上传用户:pp_dolphin
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,由于计算机、通信技术的飞速发展,空间信息技术得到了极大的提高。日常生活中人们对空间信息的需求日益增长,空间信息具有非结构化、多比例尺、关系复杂、随时间变化及数据量呈海量级别等特点,采用何种方法和技术手段把空间信息更方便的服务于大众变得迫在眉睫。C/S模式和B/S模式的网络服务模式在处理海量的空间信息时均会遇到瓶颈问题,在这种背景下,G/S模式应运而生。G/S模式作为一种新型的、面向大众的空间信息网络服务模式,为海量、异构、多元的空间信息的描述、组织、管理和展示提供了新的解决途径。G/S模式通过“请求—聚合—服务”的工作机制,以数据为中心,在空间信息服务云进行信息汇聚,在客户端进行服务的动态聚合,从而把空间信息的各种服务提供给大众使用,如应急救灾、数字旅游等。G/S模式中存在着大量用于地学浏览器展示空间信息的HGML文件,由于HGML文件属于半结构化数据,描述地理特征要素的目标信息以标签对的形式存储在HGML文件中。使用传统处理结构化数据的方法,无法完成HGML文件中描述地理特征要素信息的检索。对于这种情况,本文通过对HGML的作用和特点以及信息检索理论的研究,解决了G/S模式下基于HGML的检索问题,同时取得了以下成果:(1)设计并实现了一种针对HGML文件的索引构建方法。描述地理特征要素的目标信息以标签对的形式存储在HGML文件中,同一类型的目标信息分散存储在G/S模式下的空间信息服务云中的不同分布式服务器上。通过该方法构建索引,可避免检索时对分散存储在空间信息服务云中的HGML文件进行逐一遍历,实现基于HGML的目标信息地理位置的快速检索。(2)设计并实现了一种针对HGML文件的索引查询方法。地学浏览器的目标信息检索请求具有多样性,且查询目标信息可能存在于多索引库中,为此设计了规范查询格式。通过规范查询格式即可以统一的处理地学浏览器的多样性查询请求,也可执行多线程并行索引查询。同时,设计了规范返回结果格式,规范返回结果格式即满足了地学浏览器对目标信息的解析,也方便了执行并行索引查询的结果合并处理。(3)实现了提供索引查询服务的服务器程序。服务器程序用于接收地学浏览器的查询请求,并把查询请求信息转换成规范查询格式,通过解析规范查询格式构建具体的查询。当索引库有多个时,并行构建每个索引库对应的具体查询,并根据规范结果返回格式合并查询结果。服务器程序为地学浏览器提供基于HGML的目标信息地理位置检索服务。本文的创新点如下:(1)提出了一种针对HGML文件的分词方法。在构建全文索引时,需要通过对索引内容进行分词,来确定满足查询条件的关键词。在HGML中,有意义的“词”是用来表示地理特征要素的标签对,采用通常的分词方式无法满足这种要求,为此设计并实现了基于自定义词典的方法来完成针对HGML文件的分词。(2)提出了一种G/S模式下客户端聚合检索服务的机制。根据HGML的自身特点,以及基于HGML的目标信息地理位置的检索需求,通过采用对HGML文件的分词方法确定检索关键词,设计检索内容进而构建基于HGML文件的索引库。客户端地学浏览器通过向服务器程序发送检索请求,服务器程序处理请求信息后根据规范查询格式构建具体查询,最终处理成规范返回结果格式的结果信息返回地学浏览器,地学浏览器通过解析完成目标信息地理位置的检索。
其他文献
由于信息技术和网络的发展,通过网络实时上课、做实验已经成为可能。而通信原理实验课程由于真实通信设备昂贵、折旧快、维护费用高,一般采用仿真软件来代替真实实验设备,所
随着计算机应用的范围越来越广,处理问题的规模越来越大,计算机硬件得到了迅速发展,近年来已经进入到多核体系结构、个人高性能计算机、千万亿次并行机的发展阶段。为了适应迅速
目前,政务信息化和企业信息化进入“后建设时代”,基础设施和核心应用系统的建设基本告一段落,IT运维成为了与系统建设并重的一项关键工作。业务服务管理是IT运维管理的高级阶段
在雾、霾等天气条件下,由于大气粒子散射和吸收作用,所获取图像的颜色以及对比度、饱和度严重下降,严重影响户外视觉系统的正常运行以及人们的出行。此外,计算机视觉领域中的诸多
现如今实时数据库(RTDB)已获得越来越广泛的应用,实时数据库必须保持数据对象的一致性约束和保证每一个请求到达系统所规定的时间限制。随着系统存储的数据量越来越大,复杂性
1394B协议是在基于1394A协议的基础上,对速度和技术进行了提升的新一代火线协议,其发展趋势是向军事领域发展,将作为新一代军事领域实验室平台搭建的基础协议。新一代1394B协
单篇科研文献文档摘要自动生成在信息检索中具有重要意义,可以为大规模信息检索提供简要信息提示。无监督抽取式摘要生成是文本摘要研究的重要任务,旨在从原文中依据各种文本语
应用程序对计算机硬件特别是处理器的性能要求越来越高,尽管32位处理器还在使用,但64位处理器已经越来越多的受到人们的关注。相对于32位处理器,64位处理器能直接进行64位的整点
微博的兴起使其成为个人情绪表达的重要虚拟场所,微博上产生了大量富有情绪的内容。对微博进行情绪分析,可以了解到社会舆情、情绪倾向等,针对社交短文本的情绪分析不断受到相关
近些年来,P2P技术发展迅猛,得到广泛的应用。比较有代表性的有BitTorrent、eMule等文件共享类应用和QQLive、PPTV等P2P流媒体应用。P2P流媒体技术发展迅速,用户规模增长很快。P2