【摘 要】
:
随着全球化的浪潮到来,信息化导致人们接受的信息呈现了指数型的爆炸增长,而其中各种信息中又以文本数据最为庞大。文本数据通常以非结构化的形式存在,而如何将非结构化的文本信息提取出结构化的信息并且使用计算机进行存储和处理是当前自然语言处理应用场景中一个函待解决的问题。关系抽取能够从非结构化的文本数据中提取到结构化的三元组信息,因此实体关系抽取的方向是解决该问题的关键方向。虽然近年来自然语言处理领域中关系
论文部分内容阅读
随着全球化的浪潮到来,信息化导致人们接受的信息呈现了指数型的爆炸增长,而其中各种信息中又以文本数据最为庞大。文本数据通常以非结构化的形式存在,而如何将非结构化的文本信息提取出结构化的信息并且使用计算机进行存储和处理是当前自然语言处理应用场景中一个函待解决的问题。关系抽取能够从非结构化的文本数据中提取到结构化的三元组信息,因此实体关系抽取的方向是解决该问题的关键方向。虽然近年来自然语言处理领域中关系抽取领域方向的研究取得了长足的进步,但是其现有的主流研究方向主要基于句子级别的关系抽取。但是在实际生活中,许多关系事实隐藏在句子之间,需要对多个句子进行推理才能准确地提取出句子之间的关系事实,因此文档级关系抽取方向更值得去研究。目前在文档级关系抽取任务上,主流的方法是生成一个网络图,然后对这个图的节点进行推理。但目前在网络图上使用传统的图神经网络模型往往只能学习到周围节点的信息,难以捕捉到实体对之间的信息,因此其性能还可以得到进一步地提高。在以往文档级关系抽取领域方向的基础上,提出了一种基于深度学习的端到端的文档级关系抽取模型。该模型包含编码模块、图的嵌入模块和分类模块。该模型能够使用单词预处理模型学习到单词的上下文信息,然后根据规则构建出异构网络图,通过使用异构图的图注意力神经网络模型,使模型相比于以往的文档级关系抽取模型能够更好地学习句子内和句子间的关系事实。并且根据文档级关系抽取的特点,基于启发式规则的方式提出了适用于句子内和句子间关系抽取的元路径。在最新的文档级关系数据集上通过与目前主流的文档级关系抽取模型做对比实验,证明了模型的有效性以及使用异构网络图的必要性,再通过消融实验的方式消除不同的元路径,证明了设计的元路径的合理性。
其他文献
卷积神经网络(Convolutional Neural Networks,CNN)作为深度学习(Deep Learning,DL)最重要的算法之一,采用权值共享的网络结构,降低了网络的复杂度,被广泛应用于计算机视觉等领域。传统的卷积神经网络主要基于中央处理器(Central Processing Unit,CPU)或图型处理器(Graphics Processing Unit,GPU)进行实现。目
近年硬件的快速发展使得其计算能力不断提高,深度学习中新的神经网络算法的提出使得目标检测飞速发展,实时性和准确性都有了很大的提升。然而就车辆和行人多目标检测场景而言,第一模型依赖于强大的算力;第二模型在视频检测中相邻帧之间候选框会出现闪烁问题;第三模型在测试端会出现大量的冗余数据。这将为车辆和行人的检测的实际应用带来极大的困扰。因此,优化车辆和行人的检测算法对解决上述问题兼具理论和应用价值。针对以上
随着移动互联网的发展,社交网络应用得到了迅速普及,覆盖大部分人群。社交网络方便了人们的生活,然而社交网络中也出现了一些有害群体。这些有害群体利用社交网络应用进行沟通和交流,很可能会产生严重的不良后果。群体发现是社交网络研究中的重要课题之一。研究群体发现可以帮助理解社交网络中的群体的结构特征,群体形成的机制,而且可以根据群体发现结果对有害群体进行必要的引导和管控,减少这些群体行为的有害影响。针对如何
社会发展到工业4.0时代,工业生产领域设备众多,但设备在运行使用过程中难免发生故障,如何防止因设备故障影响正常生产,给人们生活带来不便,甚至生命财产安全是设备维护领域需要高度关注的问题,长期以来,对设备的检修都是依靠设备运行期间累积的经验对设备进行定期维护,但这种维修策略不仅费时费力,而且收效甚微,剩余寿命预测技术通过对设备健康状态的监测,对设备进行预测性维护,有效地解决了传统方法的问题,因此有必
随着计算机技术的发展,三维重建技术已成为计算机视觉方向的研究热点之一。基于多视图的三维重建通过对二维图像序列进行稀疏重建、稠密重建、网格构建、网格优化、贴纹理等过程获取重建对象的三维模型。然而每幅图像中包含大量的背景信息,使得重建的效率低下,重建的模型也包含着周围环境的信息。针对以上问题,通过对三维重建相关技术、图像分割相关技术进行研究,设计并实现了一个基于目标分割的三维建模系统。该系统包含两种数
随着城市不断的发展,地铁也在飞速的建设着,全国各城市地铁运营里程和设备数量也随之激增。作为地铁线网信息传输的大动脉,覆盖了公务电话、传输、无线集群等多个子系统,其系统中设备运行维护的工作压力也在不断增加。本课题在实际项目需求的基础上,详细讨论了当前地铁设备运维的工作中,单纯依靠运维专员的故障经验进行故障处理的局限性,结合目前地铁系统原有的集中管理平台数据,针对设备健康度、设备故障告警、故障专家经验
图卷积网络可以利用来自高阶邻接点的协同信号学习用户和物品嵌入,因此被广泛用于推荐系统之中。但是与其他图卷积模型一样,基于图卷积网络的推荐模型会遇到过度平滑问题,即当堆叠更多层时,节点嵌入会变得更相似,最终变得不可识别,从而导致推荐性能下降。在这样的背景下,对图卷积网络推荐模型进行研究,提出了一种基于子图的图卷积网络推荐模型,该模型通过对子图进行高阶图卷积的方式解决在图卷积网络推荐模型中出现的过度平
随着移动互联网时代的高速发展,我国的主流视频网络企业不断壮大,并且更多的企业通过互联网、社交平台、电子商务等渠道来提升品牌价值,优化企业盈利模式,满足消费者的需求。人们逐渐从信息匮乏的时代步入信息过载的时代,为了给广大信息消费者提供精准的信息流,因此推荐系统逐渐成为移动互联网时代性下的核心关键技术。随着网络中视频流数量和视频流用户的数量急剧增加,视频推荐系统在数量累计的过程中往往会遇到冷启动的问题
上下文信息的获取在语义分割任务中非常重要。卷积神经网络(Convolutional Neural Networks)通过堆叠卷积层扩大感受野,效率较低。基于自注意力的方法没有卷积操作中感受野的限制,更适合在语义分割任务中整合全局上下文信息和处理长距离依赖。但现有的自注意力方法普遍存在着参数量大,计算复杂度高的问题。针对以上存在的问题,设计了一种用于整合上下文信息的自注意力方法:点上下文整合(Poi
室外定位技术目前已经相当成熟,包括有北斗卫星导航系统和GPS等在内的全球卫星导航系统,结合惯性器件或者先验数据和电子地图,进行最优估计和匹配,能够得到较为准确的位置估计。但由于其技术原理的局限性,在室内环境下无法进行定位。随着智慧城市、智慧校园等概念的提出,室内导航定位技术成为了不可或缺的一部分。目前室内定位的技术多为低功耗短距离定位,基于无线WiFi的定位技术在实现和部署方面具有天然的优势,硬件