基于BERT词向量的POI自动分类方法研究

来源 :江苏海洋大学 | 被引量 : 0次 | 上传用户:xiaokeai
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网技术的飞速发展以及移动终端设备的普及,互联网上出现越来越多与空间位置有关的地理信息数据,并应用到地图导航、环境监控、城市规划、土地利用、应急管理等各个领域。兴趣点(Point of Interest,POI)是和大众生产生活息息相关的地理数据,也是位置服务及相关应用的支撑。人们通常利用大众点评、微博等移动应用APP上传和发布美食、酒店、景点等兴趣点信息,使得网络中涌现出大量且更新频繁的POI数据,如何对这些POI数据进行分类和利用,并挖掘出潜在价值,成为地理信息数据分析研究的重点和难点。由于POI的名称最能反映出主题信息,因此本文使用POI的名称来识别和确定其类别。针对POI名称文本存在的特征向量稀疏、语义关系简单等问题,通过对BERT模型进行改进并建立ERNIE-RCNN模型,实现了POI数据的自动分类。同时选取四川省成都市的八类POI数据进行参数优化与调试,并与BERT-RCNN、BERT-CNN、Word2vec-RCNN、Word2vec-CNN、ERNIE-CNN、ERNIE-RNN、ERNIE-RCNN、ERNIE-FC等算法进行对比分析,验证本文模型的有效性。本文主要研究内容如下:(1)基于TF-IDF的POI名称文本特征提取。针对POI名称文本中包含主题类型特征词的特点,利用TF-IDF提取POI名称文本中的特征词,使得POI主题相关的特征词能够被选取并分配更多的权重,为下一步POI分类模型提供特征向量的输入参数。(2)改进BERT模型的POI分类方法。针对POI特征向量稀疏、语义关系简单以及上下文联系不强的问题,改进了BERT词向量模型,提出一种基于ERNIE-RCNN模型的POI名称分类方法。首先利用ERNIE模型的双向Transformer结构和微调获得具有上下文语义信息的高质量POI名称向量表示,然后送入到RCNN模型结构中,经过双向的循环神经网络获取POI的深层次的语义信息,最后调用Softmax分类器对POI进行分类。(3)POI自动分类效果验证。为了验证本文模型的有效性,选取四川省成都市的八类POI数据进行实验,实验结果表明,本文提出的方法模型在POI八个类别数据中分类总体正确率达到95.65%,在各类别中的分类准确率均达到91%以上、F1值达到92%以上,分类性能优于其它对比模型的分类效果。有效说明了本文提出的ERNIE-RCNN模型在POI自动分类中取得良好效果,有利于网络地理信息数据的规范和管理。该论文有图31幅,表10个,参考文献70篇。
其他文献
学位
本文以秦皇岛贝类养殖区、环渤海中心渔港、莱州湾海域和大亚湾大鹏澳渔排养殖海域为研究对象。通过采用修改后的四步提取法提取表层沉积物中不同形态磷,利用单因子污染指数法对表层沉积物中的生源要素进行污染评价,利用相关性分析和冗余分析(RDA)探究了表层沉积物中不同形态磷空间分布及环境影响因素研究了我国沿海多种功能类型海域表层沉积物中不同形态磷的空间分布特征,阐明了表层沉积物中的磷形态和环境因子之间的相关关
学位
为了探究神经肽PACAP和VIP在瓦氏雅罗鱼离子和渗透压调节机制中作用,为我国耐盐碱鱼类品种的开发和盐碱水渔业的发展提供基础资料。本实验选取了瓦氏雅罗鱼碱水种作为实验材料,根据瓦氏雅罗鱼生殖洄游的特性,室内设计了FW-AW、AW-FW的双向实验,测定了血清p H、渗透压、离子(Na+、K+、Cl-、Ca2+)含量,血清激素(PRL、CO R、GH、甲状腺激素T4)含量和PACAP/VIP-PRL-
学位
随着遥感对地观测技术日益精进,获取到的遥感影像数据质量更高、地物纹理信息更细致、成像光谱波段更多,在土地资源调查、自然环境监测、农业生产等诸多领域存在广阔的应用场景。但传统的遥感影像场景分类方法特征提取能力不足,难以捕获遥感影像中丰富语义信息、无法达到解译更高层次内容的目的。因此如何快速、有效、自动地进行遥感影像场景的分类识别,是当前遥感数据分析与解译领域的热门研究课题。近年来,卷积神经网络的成功
学位
桥梁是交通的关键枢纽和控制节点,是国家的重要基础设施之一,对社会和经济发展起着至关重要的作用,桥梁变形监测是工程结构健康监测领域的一项重要课题,基于现场实测信息,实时了解桥梁动态变化情况,对桥梁的承载能力、运营状态和耐久性能等进行监测和评估具有重要意义。本文围绕BDS/Galileo三频约束的BDS/GPS/Galileo短基线模糊度单历元解算方法,和不同高程环境下对流层延迟模型对桥梁监测的影响展
学位
淤泥质海底航道边坡失稳滑塌是人工开挖航道自身求得稳定的一种自然灾害,航道一旦发生滑坡不仅会改变航道水深影响正常航运,还可能造成航段淤浅无法达到通航标准,为港口航道清淤疏浚工作带来困难,给国家、社会发展带来难以估量的损失,因此对航道边坡失稳滑塌进行预测预警对港口发展及其安全运行具有重要意义。目前对于海底滑坡失稳机理和演变机制研究大都基于滑坡灾害发生后,无法对海底航道边坡进行失稳滑塌预测预警。浅地层剖
学位
随着遥感技术的快速发展,包含丰富地物场景空谱信息的遥感影像规模日益猛增,对浩如烟海的遥感影像数据的解译成为了当前的热点、难点问题。语义分割作为一种重要的图像内容解析方法,一直是遥感影像数据的一个重要研究方向。传统的遥感影像处理手段,依赖于数据特征本身以及先验知识,主要通过统计学习的方式得到浅层描述信息,存在耗时、耗力和精度低的问题。近年来深度学习技术的进一步发展,为遥感图像的解析和处理带来了新变革
学位
设施农用地的数量和分布状况影响着耕地产能,代表着农业生产水平,反映了现代农业发展,及时有效地获取设施农用地的空间分布信息是农业生产及管理部门的迫切需求。但由于设施农用地目标地物小、类型多且所处的背景环境比较繁杂,此外还容易受到云雾、阴影等其他遮挡影响,传统的基于浅层学习的遥感分类方法难以满足业务生产部门的需求,基于高分辨率遥感影像,利用深度学习方法对设施农用地进行分类提取具有重要的应用意义。本研究
学位
树木是城区的常见地物,是数字城市建设的最基本元素,也是城市生态和道路景观的重要组成部分,具有重要的景观、生态和社会服务功能。因此,城区树木信息的获取是智慧城市建设中必不可少的任务。机载激光雷达技术作为一门主动式遥感技术已经站在测绘领域的前沿,该技术能够在高速运动的状态下快速、准确获取物体的三维信息。机载激光雷达数据的城区植被和建筑物提取时Li DAR技术应用领域的一大重点,对其进行深入探究极具现实
学位
船舶在海上航行时主要是依靠海图水深结合《潮汐表》来保障船舶的航行安全。海图水深是一个固定值,是静态的水深,由于受到潮汐作用以及海上气候环境的影响,使得实际水位高度时刻在变化,如果能够利用这种水位的变化,将有助于大型船舶乘潮进港,扩大航道通航能力,同时能使船舶穿越海图水深所不能到达的地方,提高海域的空间利用率。因此本文提出了一种基于海洋水动力模式建立高精度瞬时水深模型的方法,以高精度、高分辨率的海图
学位