基于上下文感知的神经语义关系分类的研究

来源 :武汉大学 | 被引量 : 0次 | 上传用户:jayleardutt
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在人工智能领域,很多技术的发展都需要关系分类的技术支持,最近,深度学习被越来越多的应用到基于文本的实体关系分类任务,但是之前的方法大部分需要使用句法或依存等结构特征,然而结构特征由于句法解析的时间和空间复杂度太高,导致预处理阶段直接使用很不方便,另外结构特征可能具有严重的领域依赖问题。本文提出了一种基于上下文感知的双向长短时记忆循环神经网络模型来处理关系分类,主要动机是实体对的关系类型可以显式地通过实体对以及实体对周围的上下文来表示。在整个模型中,首先使用双向长短时记忆循环神经网络对存在关系的句子序列执行双向循环计算获得句子的向量序列,然后根据每个单词在句子中出现的位置顺序把向量序列分成五部分,并使用标准的池化函数分别进行池化,最后把池化后的向量进行级联放入softmax中进行关系分类。为了避免使用结构特征,本文只使用了低成本的序列特征,例如词和词性标注特征。本文在不同领域的两个标准任务集上进行模型性能评测,分别是SemEval-2010Task 8和BioNLP-ST 2016 Task BB3,在前一个数据评测集上本文模型获得了与只使用序列特征的关系分类模型相当的实验效果;在后一个生物自然语言领域的数据评测任务BioNLP-ST 2016 Task BB3中本文模型在官方评测系统公布的所有参赛模型中获得了第三名的成绩。同时本文发现实体对中间的上下文对关系分类有至关重要的作用,最后通过统计进一步发现当依存解析不能使用的时候,可以把实体对之间的上下文作为最短依存路径的近似替代。
其他文献
随着互联网的飞速发展,网络上蕴含的多语言信息也呈指数级增长。单语种所获得的检索结果有时难以满足用户信息检索的需求。查询翻译作为跨语信息检索的基础技术,具有重要的研
两轮轮式机器人是通过两个主动轮驱动机器人运动和工作的。它具有一系列的优秀特性:自重轻、承载大、行走速度快、工作效率高等。因为有这些突出的优点,两轮轮式机器人被广泛
在机器学习中,给高维数据集建立一个鲁棒训练模型是非常重要的。其中最大的问题是如何进行数据降维。数据降维分为两种形式:特征选择和特征提取。特征选择是在原有的特征集中
当前,网络已经十分普及。网络在给人们的生活带来便利的同时,也使得许多人上网成瘾,严重影响身心健康和正常生活。网瘾已经成为一个严重的社会问题,其重要特征是上网时长,所
随着社会经济结构调整和现代制造业发展,制造业的需求和特点由早期的注重产量朝着多品种小批量、流程工艺更复杂多变、更快速响应市场以及更高标准的质量监控和回溯机制等方
招标信息是互联网信息的一部分,该类信息对企业销售人员的投标决策发挥着重要作用,快速、有效、准确获得该类信息能够提高他们的工作效率。采用通用搜索引擎获得招标信息会产
手风琴是一个携带和参与都非常方便,并且艺术性极强的一种乐器。我国的手风琴艺术在上世纪80年代末九十年代初曾一度盛行,被我国的民众所普遍熟悉。但是,随着时代的发展,全国
特种设备作业人员认证系统是一套基于开放性的多平台的考试系统,是可用于组织大规模统一考试系统。本在线考试系统既考虑现阶段的实际考试环境需要,又可以按需求实现系统的二
中国正处在互联网高速发展时期,随着网络用户数量变大、互联网普及率逐年提高,网站和信息数量的大幅上涨致使互联网上的信息爆炸问题日益明显,信息涵盖面无论从广度上还是深
高通量测序技术使我们能够全面分析复杂的基因组,而全基因组的分析能够有效地探究生物体内整体的基因表达调控模式,并探究其与肿瘤发生和发展之间的联系,这样的分析将为肿瘤