基于深度学习的实体关系抽取方法研究

来源 :重庆理工大学 | 被引量 : 0次 | 上传用户:wjkylin
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着数据化、信息化时代的到来,网络信息以指数级速度增长,使人们接收到远超其所能承受或需要的信息量,多领域交叉融合的现象日益凸显,如何精确高效的从浩如烟海的数据信息中获取对人类社会有价值、有意义的信息,成为大数据时代亟待寻求破解之道的重要问题。实体关系抽取任务作为知识图谱构建的基础,旨在判断非结构化文本中实体对之间存在的语义关系并将其划分入预先设置的类型中,使数据变为结构化形式,因此其具有重要的研究价值。目前大部分基于深度学习的实体关系抽取模型存在误差传播问题、语料深层特征提取不充分问题及多义词信息利用不足问题。本文针对以上问题,从下面两个角度进行研究:(1)针对远程监督标注数据时产生的噪声及深度学习特征提取中的误差传播问题,本文利用残差网络可以将浅层信息与深层信息联合表示的特性建立深层卷积神经网络,并通过修改identity mapping中传递函数,以达到在深层的传递过程中不断更新特征的权重,获取到输入文本中更深层更有效的信息,达到了更高分类精度。(2)针对现有实体关系抽取方法未考虑实体对之间共现关系和语言结构信息,本文将预训练语言模型与多种语义信息结合构建多语义融合的实体关系抽取模型。将预训练语言模型应用于实体关系抽取任务,采用语义向量及语言结构向量相结合的方式来突出语义特征信息,缓解对句子局部及全局信息表征不足的问题,提高对文本局部特征及全局特征利用率。进一步,本文考虑不同实体在句子中共同出现表达的语义含义差异,引入实体共现信息作为语义特征解决一词多义问题。最后将所构建模型,分别在中英文数据集进行实验验证。结果表明,本文提出的模型能更有效地提高实体关系抽取效果。
其他文献
随着社会对高亮度暖白光发光器件的需求日益增长,将蓝色激光二极管(Laser Diode,LD)与荧光透明陶瓷相结合的蓝光驱动固态照明技术应运而生。透明陶瓷封装的激光二极管具有低的热膨胀系数和高的导热系数,但目前的透明陶瓷由于缺乏红色成分而存在显色指数(CRI)低的问题。为了获得高质量的白光用于激光照明,合成出高性能的红光发射透明陶瓷成为必然。本论文在Y3Al5O12(YAG)陶瓷中掺杂了Mn、Sm
随着能源危机和环境污染问题的愈加突出,油耗和排放法规日趋严厉,新能源汽车发展前景广阔。受制于电池能量密度,纯电动汽车(Electric Vehicle,EV)“里程焦虑”问题短期内难以解决,插电式混合动力汽车(Plug-in Hybrid Electric Vehicle,PHEV)更具市场化优势,各大汽车厂家纷纷投入插电式混合动力车型开发,市面相继出现多种构型的插电式混合动力系统(Plug-in
自上世纪九十年代末,丰田量产了全世界第一款混合动力汽车第一代普锐斯车型以来,全球各国及各整车厂在混合动力车型的研发上投入了巨大的经费与精力,发展至今天已经成为各国与各整车厂极为重要的战略板块。而动力系统作为混合动力汽车区别于传统汽车最为显著的特征,亦是混合动力车辆研发的最重要环节。效率特性作为动力系统的重要评价指标,也是混合动力总成开发与优化的重要目标。同时,在车辆混合动力系统研发过程中,台架试验
能源与环境问题是影响人类社会进步发展的重要因素,能源短缺和环境污染对于工业发展与居民生产生活很不利。开发利用储量丰富的油页岩与大量闲置的废弃生物质糠醛渣资源具有深远意义。不同燃料的混烧有着不同的相互作用,本文对油页岩与生物质糠醛渣的混合燃烧,先采用热重分析混合比和升温速率对混和样的燃烧特性与动力学分析,研究其可能存在的相互作用,还进行响应面分析优化混合条件,其次,在目前混烧技术不完善的情况下,可通
近年来,随着汽车趋于电动化、高速化和高效率发展,传动系统效率成为了新能源汽车续航里程的关键影响因素之一。齿轮传动系统作为汽车传动的主要部件,其传动效率对于提升汽车经济性尤为重要。齿轮传动系统的损失主要由轮齿啮合损失、轴承损失和搅油损失组成,在高速轻载工况下,搅油损失占比最大。齿轮传动系统的搅油损失影响因素众多,如齿轮参数、工况参数以及润滑油参数等齿轮系统内部因素,倾斜角度、箱体尺寸以及内部型腔等外
随着工厂对轮毂识别与分拣的自动化需求越来越高,使用人工对轮毂型号进行识别分拣,存在着成本高、效率低等问题,且轮毂较重,对其进行分拣给工人带来的负荷大,难免会出现错误。因此,为提高生产线生产效率、增加识别的准确性、降低成本,需要一套准确率高、效率高、结构简单的轮毂自动识别分拣系统,以满足轮毂分拣的自动化需求。机器视觉在工业生产中的使用越来越广泛,具有识别精度高、效率高、非接触等特点。因此本文采用机器
激光雷达由于测量精度高、测量范围广等优点而被广泛应用到智能车上,而高精度三维地图的建立和障碍物的识别是激光雷达在实际应用中的主要方向。新型激光雷达有着区别于传统雷达的扫描方式和点云图像。本文将基于新型激光雷达所采集到的Ros数据包和新型激光雷达本身的特性,建立校园环境高精度三维地图和障碍物的识别方法。本文的主要工作内容有如下几个方面:将激光雷达正确安装到有人驾驶的车辆上并标定好安装位置;在建立校园
随着自媒体时代的到来,海量视频被用户上传到互联网上。如此海量的视频数据使得信息传递的效率得到了成倍的提升。然而,在视频数据量爆发式增长的同时也存在着大量部分拷贝视频所产生的虚假信息,从而对原视频作者的创作构成侵权行为。这种现象对原作者和普通用户都产生了不小的危害。因此,开发具有高精度、高鲁棒性的版权检测方法成为视频大数据时代的迫切需求。目前大多数视频版权检测算法致力于提高单帧特征的表达能力,这些方
社会经济高速发展不可避免地带来了环境污染与资源短缺的问题,各国大力推广太阳能、风能、潮汐能等可再生能源来应对全球能源危机,而储能技术是实现这些可再生能源综合运用的关键技术之一,锂电池具有能量密度高、循环寿命长、环保绿色等优点,广泛应用于电动汽车、不间断电源系统(Uninterrupted Power System,UPS)、分布式储能、通信基站以及智能电网系统等储能领域。单体锂电池工作时,其电压和
动力电池、电机、电控等作为电动汽车的核心零部件,其工作性能受温度因子的影响极大。若温度过高,整车核心零部件必然限制功率开始降额输出,若温度过低,动力电池将无法进行充电。因此,环境温度通过影响核心零部件的工作性能间接使电动汽车的充电性能、动力性能、续航性能等受到影响,从而影响电动汽车的使用,同时也在一定程度上限制了电动车型在市场的进一步普及。因此设计和研究一套电动汽车的智能温控系统将电动汽车核心零部