【摘 要】
:
相对非结构化的信息,规则的结构化信息更容易被机器使用。因而,化信息非结构化为结构化的信息抽取技术是一项值得深入研究的工作。关系抽取是一种提取结构化信息的任务,它面向已经被标记好的实体对,依据文本句子特征判定两个实体间的语义关系。近些年来,基于深度神经网络的方法在关系抽取任务中取得了不错的效果。但是,随着神经网络方法的精度不断提升,关系抽取任务消耗的成本也日益增加。为了缓解这一现象,本文将研究的重点
论文部分内容阅读
相对非结构化的信息,规则的结构化信息更容易被机器使用。因而,化信息非结构化为结构化的信息抽取技术是一项值得深入研究的工作。关系抽取是一种提取结构化信息的任务,它面向已经被标记好的实体对,依据文本句子特征判定两个实体间的语义关系。近些年来,基于深度神经网络的方法在关系抽取任务中取得了不错的效果。但是,随着神经网络方法的精度不断提升,关系抽取任务消耗的成本也日益增加。为了缓解这一现象,本文将研究的重点放在关系抽取模型轻量化上。轻量级关系抽取方法能为抽取模型瘦身,使关系抽取不再是一项对资源要求较高的任务。本文在设计过程中引入知识蒸馏技术架构,用于提升轻量级关系抽取模型的抽取精度,并尝试在该框架下设计带有余弦相似度的动态损失函数,用于缓解知识蒸馏中教师产生的错误软标签数据的影响。本文的工作分为以下三点:(1)利用余弦相似度设计了一种知识筛选机制,在蒸馏过程中不再直接使用教师产生的软标签数据,而是对该数据的正确程度进行判断。这种机制将能表达事实含义的软标签视为正向软标签,为其分配较高的权重;对于非正向软标签,则被分配较低的权重。噪声过滤后的软标签数据能提供更精准的指导,缓解错误软标签对轻量级关系抽取模型抽取结果产生的负面影响。(2)使用教师-学生知识蒸馏模式构建出一类轻量级关系抽取模型。该框架中共有两种角色:教师与学生。教师向学生输出知识,学生在知识指导下进行训练,同时不断吸收知识提升自己。教师-学生知识蒸馏的机制不但能够在只关注数据本身、不借助其他的外部信息的情况下提升学生模型的抽取能力,并且轻量化的操作不会消耗大量的时间资源。(3)借助教师-助手蒸馏模式设计出一类轻量化关系抽取模型。相较教师-学生知识蒸馏模式,该模型共需进行两次知识蒸馏:第一次的蒸馏以培养教师助手为目的;第二次是在教师助手主导下进行知识传递,由教师助手指导学生进行训练。通过引入助手,教师-助手蒸馏模式避免了教师和学生差距过大造成的学生模型难以模仿教师抽取机制的问题。学生通过匹配知识训练模型的性能,教师助手与教师相比,知识的软化程度更高,能够给学生更有效的指导。针对以上工作,本文选取关系抽取常用的数据集进行实验验证。在Sem Eval-2010 Task 8上验证基于教师-学生模式、基于教师-助手模式模型的效果。实验结果显示,与学生模型相比,轻量化模型没有增加待训练参数量,运行时间上只产生小范围波动。并且对于两种模式使用同一个学生模型构建出的轻量级关系抽取模型来说,轻量化操作后精度分别提高了0.56%和1.47%。结果证明,使用正向软标签的蒸馏机制能够更好地利用知识,本文提出的教师-学生蒸馏框架和教师-助手蒸馏框架是两种构造轻量级关系抽取模型十分有效的方法,能在不增加模型参数、几乎不增加模型消耗时间的前提下提升抽取的精度。通过两种轻量级抽取框架得到的轻量级模型在计算资源有限、时间要求较高的场景中具有强大的竞争优势。这两种框架能够在花费较少计算成本的情况下完成轻量化的转变,有效缓解了关系抽取模型规模日益庞大、抽取效率日趋下降的问题。
其他文献
聚类是数据挖掘领域的一项经典任务,通过预定义的相似性度量将未标记的输入数据划分成不同聚类。在过去的几年中,人们提出了各种聚类方法来解决现实世界中的问题,如文本聚类和图像聚类。随着图结构数据的出现,如生物网络和社会网络,如何将属性图节点划分为不同聚类引起了广泛关注。与文本和图像数据不同,属性图中的每个节点都有一组属性特征,属性信息表示节点本身的特征值,结构信息则表示节点结构之间的潜在相似性。因此,如
知识图谱以结构化的有向图形式来描述真实世界的知识,近年来已被广泛应用于问答、信息检索、推荐系统、机器阅读理解、对话生成等各个领域。然而,常用的大规模知识图谱中存在大量缺失的事实,知识图谱面临的不完整性问题严重阻碍了其在相关下游任务中的应用能力。为了补全知识图谱,基于强化学习的推理方法在知识图谱上进行多跳推理来预测缺失的事实,有着兼具推理的准确性和可解释性的独特优势。然而,当前的基于强化学习的多跳推
沿空留巷对于提高矿区煤炭采出率、延长矿井使用年限、减少巷道掘进量及防治瓦斯灾害具有重要的意义。针对坚硬顶板条件下,综采工作面沿空留巷出现的采空区顶板难垮落、动压扰动大、围岩应力集中的现象,导致留巷巷道围岩变形难以控制,以忻州窑矿8318工作面沿空留巷为工程背景,开展了现场调研、岩石力学测试、理论分析、数值模拟及现场工业性试验等工作,对坚硬顶板切顶留巷围岩支护控制技术进行了研究,主要研究成果如下:(
<正>心脏磁共振(CMR)灌注在缺血性疾病的诊断中具有重要作用,被广泛应用。随着各种灌注技术以及后处理方式的不断发展,心肌灌注成像从一个定性评估心肌微循环障碍的技术发展到一个精确量化的技术,并且实现了半定量到全定量的发展。在各种可能导致心肌微循环异常的疾病中均有应用,同时为临床了解疾病进程、指导治疗及评估预后提供更多可用的影像学信息。本文主要针对CMR灌注定量评估在心脏疾病中的研究应用及进展做一综
高铁列车振动作为一种可重复使用的绿色环保震源,对进行地质勘探、地下结构反演等工作有着重要的意义。高铁列车行驶时产生的振动波在地下介质中传播时,由于介质的吸收衰减作用,导致观测到的高铁列车振动信号的振幅、波形等都会发生复杂变化。本文通过在高铁线路附近的空旷场地布置传感器采集高铁列车产生的振动信号数据,对实测高铁列车振动信号采用三种不同的时频分析方法对信号进行处理,通过对比时频分析结果选定改进广义S变
表面缺陷分割是指对物体表面的气孔、划痕等各种缺陷进行提取的过程。表面缺陷分割能够指导工业生产和检修,有效防止残次品流入市场。磁瓦是各种工业电机中的重要部件,它的性能很大影响了电机的使用。由于原料、工艺等各种原因,生产出的磁瓦表面可能会出现如气孔、破碎、裂缝、磨损、不均匀等各种缺陷。目前,这些缺陷大多依靠人工目视检测。但是,由于工作量大,耗时长,工人很难快速正确的检查磁瓦质量。鉴于深度学习在计算机视
时序预测是一项重要的研究课题,在金融、医疗、气象、交通运输、电力调度等民生领域有着广泛的应用,因此,对于时序预测相关问题的研究一直是学者们关注的热点。从早期的基于统计理论的时序预测方法研究,到21世纪初,基于传统机器学习方法的时序预测方法逐渐发挥其性能和优势,再后来,随着计算机算力的大幅提升和深度学习理论的发展,利用基于深度神经网络的模型进行时序预测成为了新的研究热点。然而,在小样本时序预测场景下
针对利用DSC曲线研究煤氧复合反应的阶段划分、热量变化及产物生成路径等方面存在定义表述不够系统,TG和DSC耦合分析不够深入等问题,利用TG/DSC/MS联用技术,开展惰气和空气氛围下不同升温速率煤氧复合全过程的测试与分析。实验表明:基于DSC划分法可将煤氧复合全过程划分为水分蒸发及气体脱附吸热阶段、化学吸附和缓慢反应放热阶段、煤热解生成活性基团放热阶段和挥发分与固定碳燃烧放热阶段。通过特征温度的
Npm(Node Package Manager)作为JavaScript语言的软件包管理器,管理着超过250万的开源第三方库——npm包。由于缺少合适的分类方式,海量的软件资源面临着管理与检索的难题。在开发者分享和交流npm包的开源社区中,自定义的标签在描述包功能的同时也起到了一定程度的分类作用,然而当前的标签机制存在着内容混杂、同义词表述形式不同等问题,无法满足管理与检索的需求。不仅如此,np
爆破振动作为最主要的爆破危害之一,需要严格控制和准确预测。本文以武家塔露天煤矿爆破开采为背景,以西部边帮到界安全开采为目的,利用现场实测数据,采用不同的非线性预测方法对西部边帮的爆破质点振速峰值进行预测,为今后该区域的爆破参数设计提供参考和支持。通过对武家塔露天煤矿岩体爆破产生的振动进行长期监测,获得多组现场实测数据,利用最小二乘法对萨道夫斯基公式进行拟合分析,并采用高程修正公式对正高程台阶的爆破