面向文本关系抽取的关键技术研究

来源 :国防科技大学 | 被引量 : 0次 | 上传用户:zhipeng
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
关系抽取意在抽取文本中实体对的关系,对于知识图谱的构建起着重要作用,是自然语言处理中重要任务之一。关系抽取面临着诸多挑战,尤其是复杂语境和学习能力带来的文档级关系抽取以及少样本关系抽取问题。本文重点研究了针对上面两个问题现阶段的工作以及存在的不足并进行了相应的改进。我们发现以下几个不可忽视的问题:1)现阶段的文档级关系抽取模型一般只从单方面捕获信息;2)文档级关系抽取模型或者是依赖于外部解析器构造分析树等导致继承错误,或者是在图结构的路径推理中将不同轮次的权重视为相同;3)现阶段一些少样本关系抽取采用预训练语言模型的方法,但它们将知识图谱中实体嵌入和token嵌入进行融合时没有很好地将二者映射到相同子空间。针对上述两个问题,我们研究工作如下:·针对文档级关系抽取,我们提出了一种新的方法—IPR-DCGAT:一种基于迭代路径推理的密集连通图注意力网络模型。IPR-DCGAT使用不同类型节点为每个文档构建了一个异构图结构。方法的主要思想在于使用密集连通图注意力网络(DCGAT)来计算相邻节点的注意力权重来更新节点表示;同时通过多轮迭代路径推理算法进一步捕获句子之间的结构信息。我们在三个文档级关系抽取数据集上进行了大量的实验,实验结果相对优于目前最先进的方法。·针对少样本关系抽取,我们提出了一种新的预训练语言模型—A-BERT,同时A-BERT也适用于其他下游任务:A-BERT首先将实体嵌入映射到原始语言模型token的子空间,其次实体和token相互对齐使用注意力机制更新彼此表示,同时新增token-实体对齐任务的优化目标来对语言模型重新预训练。在一个少样本关系抽取和一个实体类型推理数据集上分别进行了实验,方法的结果相对优于目前最先进的方法。
其他文献
报纸
本文主要研究了基于RGB-D相机的救援机器人语义建图方法,以及语义SLAM与导航算法相结合的相关技术。传统的SLAM算法在建图时只考虑环境的几何特征或者纹理特征,这使得救援机器人只能根据环境的浅层信息进行导航和探索,难以完成复杂的自主探索任务。语义SLAM可获取环境的语义信息,并将语义信息与环境地图相结合,帮助机器人从更高的层次去理解周围环境,进而丰富导航方式,使机器人能够完成复杂的自主探索任务。
学位
基于语音对阿尔兹海默病进行识别被证明是一种有效的方法,相较于脑影像和量表,语音更具有经济性和可扩展性,能够适应大规模检测。目前的研究方法较多的采用降维-分类的方式进行,即将语音(通常在10万维以上)表示为低维的特征向量(通常在100维以下),再进行分类获得疾病识别结果。在特征表示方面,研究人员尝试使用局限性更小的内容无关(Content-independent,CI)特征来表示语音,但是传统的特征
学位
近似最近邻搜索是信息检索技术中的一个基本课题,在数据库、推荐系统等领域应用广泛。与精确最近邻搜索算法相比,近似最近邻搜索算法内存占用较小,同时牺牲较小的查询召回率,从而达到极快的查询速度。基于图的近似最近邻搜索算法是最常用的近似最近邻搜索算法之一,相对于基于空间划分、基于哈希和基于量化的算法,因其查询速度快、查询召回率高而被各大商业公司广泛应用。基于图的搜索算法的目标是构建高质量的图索引结构,通过
学位
人工智能模型的训练依赖于大规模高质量的标注数据。通过人工标注的方式可以获取高质量的训练集,但是人工标注效率很低并且代价高昂,尤其对于标注难度较大的文本语料,人工标注很难获取大规模的标注数据。远程监督可以用来自动构建大规模的标注数据集,然而通过远程监督得到的训练集质量并不高,训练集的质量决定着模型的上限,因此如何优化远程监督数据集已经成为当下研究的热点。远程监督在不同场景下面临着不同的问题,其解决方
学位
针对永磁同步电机在弱磁运行过程中因参数变化导致的控制性能下降问题,提出了一种采用单q轴电流调节器的多参数自适应补偿控制策略,以提高电机在弱磁区域内的转矩控制精度。实验结果表明该方法对参数的辨识误差在5%以下,输出转矩与期望转矩的误差小于1%,该方法能有效地抑制多参数变化对电机性能的影响。
期刊
随着无线传能技术的快速发展和无人机在各个领域的广泛应用,利用微波无线传能为飞行中的无人机提供能量保障已成为延长无人机工作时间的有效途径。考虑到微波点对点直接传能在无人机供电方面存在局限性,本文针对面向无人机供电的微波无线传能链路进行建模与优化研究以在一定程度上提高无人机微波无线供电的环境适应性、传输效率和实际应用价值。首先,本文对微波无线电能传输技术原理及其在无人机供电上的应用进行分析,针对面向无
学位
面部表情是人类情感信息传达的重要载体,在人们的沟通交流中发挥着重要作用。随着人工智能的迅速发展,让机器理解人类的情感具有重要的研究意义和实际应用价值。依托课题组视频动作识别与智能分析项目,本文研究基于卷积神经网络的人脸表情识别方法,并应用于课堂教学表情识别系统,协助教师对学生学习状态进行实时了解和事后分析,从而帮助提升教师教学质量。本文的主要研究内容如下:(1)针对轻量级网络Mobile Net
学位
近些年,无人机的广泛应用对空域资源提出了更多的需求,无人机的运行空间将逐步由隔离空域向融合空域扩展,保证飞行安全是将无人机集成到国家空域管理系统的前提。感知与规避(Sense and Avoid,SAA)是实现无人机自主飞行安全的关键技术,设计无人机感知与规避系统时,如何配置和融合使用感知传感器是无人机实现空域信息获取的重要环节。本文首先研究了针对不同任务环境的无人机SAA系统的感知传感器配置算法
学位
人们在浏览电商网站或购物软件上的服装产品时,往往会产生多样化的检索需求,如希望找到在某些服装属性上与查询图片相似的服装,以及希望改变查询图像某一服装属性而保持其它服装属性不变的需求,即服装属性操作,这些需求即为细粒度服装图像检索,当前的搜索引擎对这些需求还无法很好的满足。针对以上的检索需求,需要提取图像与服装特定属性准确相关的特征,深度学习的发展使得这一操作成为可能,本文基于深度学习理论深入研究了
学位