基于预训练语言模型的实体识别及其优化方法研究

来源 :合肥工业大学 | 被引量 : 0次 | 上传用户：shc200800

【摘要】

：

【作者】

：

邵健轩

【机构】

：

合肥工业大学

【出处】

：

合肥工业大学

【发表日期】

：

2023年01期

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

知识图谱是一种用来描述现实世界实体之间相互关系的知识库,其已在搜索、推荐和问答领域得到广泛的应用。大规模的知识图谱难以完全依靠人工构建,因此自动化的构建知识图谱成为了研究的热点问题,其中命名实体识别是构建知识图谱的基础任务之一。目前,基于Transformer的预训练语言模型在解决命名实体识别任务上得到广泛的应用,但这类方法通常需要高质量的标记数据进行微调,难以在无监督或弱监督的情况下实现较好的命名实体识别效果;同时,针对命名实体识别任务,对哪些参数进行微调难以通过人工确定。本文针对上述问题开展了基于预训练语言模型的命名实体识别及其优化研究,主要工作如下:（1）针对弱监督下命名实体识别任务中不完全监督和不准确监督问题,本文提出了一种结合对抗训练的弱监督命名实体识别方法。本方法通过引入多种标记函数,并对其标记结果进行聚合,改善弱监督情况下的不完全监督问题;同时,在利用聚合的标记结果和预训练语言模型进行训练时,加入了对抗训练的策略,改善弱监督情况下的不准确监督问题。通过在两个真实世界的数据集上进行实验,验证了方法在弱监督情况下的命名实体识别任务的有效性。（2）在基于预训练语言模型的命名实体识别任务中,针对如何自动搜索较优微调方式的问题,本文提出了结合遗传算法的命名实体识别微调方式搜索方法。本方法通过引入遗传算法对预训练语言模型的微调方式进行搜索,使得模型能够搜索到更优的微调方式;同时引入先验知识与互斥机制,减少冗余的搜索与训练,加快遗传算法的搜索速度。通过在两个真实世界的数据集上进行实验,验证了本方法在命名实体识别任务上能够达到更好的微调效果。

其他文献

基于多阶段注意网络的短文本分类方法研究

随着社交媒体和电子邮件的普遍使用,短文本在互联网上大量涌现。短文本分类任务在情感分析、垃圾邮件分类和新闻分类等领域中有广泛的应用。一方面,这些短文本数据长度限制和一词多义带来了数据稀疏性与歧义性问题。另一方面,实际应用中的短文本含有大量的无标记数据,而人工标注这些无标记数据耗时且繁琐,使得短文本分类任务面临着巨大挑战。为此,本文分别针对标记数据与无标记数据开展了监督和半监督的短文本分类方法研究,其

学位

基于深度学习的中文商品评论情感分析

伴随着互联网技术的快速发展,网络购物已经逐渐成为了人们生活中不可或缺的一部分,国内网上购物平台的兴起也进一步导致中文商品评论文本数据的大量产生,这些评论文本数据中往往包含着大量的情感信息,因此如何分析应用这些信息无论对于企业、个人还是国家都有着重要的研究意义。本文在首先介绍了中文商品评论情感分析的研究背景和意义、国内外研究现状和相关的理论基础知识后,着重研究中文商品评论的情感分析。本文的主要研究工

学位

ZigBee和WiFi的双向跨协议通信技术研究

随着物联网技术的飞速发展,出现了大量的物联网异构设备的共存问题,也产生了不同协议的无线设备之间互相通信的需求。传统的方法是利用物联网网关,物联网网关配备了多个无线接口,为不同技术进行协议转换,实现异构物联网设备之间的间接连接。然而,物联网网关需要接收和发送不同的信号,引入了额外的硬件成本和信道资源占用。因此,研究者提出了跨协议通信技术（CrossTechnology Communication,C

学位

基于零样本学习的轴承复合故障诊断方法研究

旋转设备故障诊断是保证设备可靠运行的重要研究内容,轴承复合故障诊断由于其特征高度耦合,故障类型繁多,是故障诊断中的难点问题。现有的复合故障诊断方法多需要获取大量的复合故障样本进行信号分析或者模式识别,考虑到实际工况中,轴承的单一故障样本比较容易采集和标注,但复合故障的样本却难以获取且难以标注。本文从单一故障样本与标签的约束条件入手,研究复合故障样本识别的新方法,提出基于零样本嵌入模型的复合故障诊断

学位

基于深度学习的骨龄评估方法研究

骨龄评估（Bone Age Assessment,BAA）作为儿童健康成长的重要组成部分,可以直接反映出儿童的生长发育情况,得到了人们的广泛关注。儿童骨骼的生长发育过程是连续的、阶段的,并具有具有一定的规律性。因此,专家可以利用手部X光片判断出儿童骨骼的生长发育情况,并对遗传性和内分泌疾病进行相关诊断。此外,骨龄评估还可以用于特殊人才的选拔和作为罪行推定的依据,在体育、法律等领域也发挥着重要的作用

学位

基于注意力机制的上下文主题对话生成

在人工智能广泛应用的今天,对话系统作为自然语言处理的一大分支,或已成为衡量人工智能发展程度的一大标准。在对话系统的发展过程中面临着多种困难,如在多轮对话生成工作中如何将对话的历史信息更好的在生成中体现以及在对话生成过程中如何避免主题缺失等现象。在本文的研究中,旨在解决在开放域多轮对话生成过程中缺乏上下文信息和主题缺失的问题,论文研究了一种基于层次注意力机制的上下文主题对话模型。本文的主要工作如下:

学位

基于视觉伺服的光束定向系统设计与实现

在EAST托卡马克装置上,采用了多种可见光光学诊断设备监控等离子体的状态。为了保证这些光学诊断设备的准确性,需要对其光束空间方向进行校准,而在狭窄的真空室内进行人工校准是不可接受的。为了解决这个问题,本文设计一种基于视觉伺服的光束定向系统。将一个专用的相机采集模块安装在新松GCR5-910机器人的末端,用于获取光斑中心点的像素坐标,经过坐标变换和空间直线拟合算法拟合出光束的空间方向。同时使用视觉伺

学位

区块链中分片交易分配和多副本区块放置问题的研究

近年来,区块链技术越来越受关注,区块链技术也得到了多方面的发展。但是,区块链面临低吞吐量和低存储扩展性的瓶颈。分片技术可以提高区块链的并发吞吐能力,但现有的交易分配方法不能有效提高区块链的收益。多副本区块方法为一个数据块设置多个副本,并将每个副本存储在不同的节点中,相比区块的全复制方法,多副本方法有效降低了节点的存储开销。但现有的区块链多副本方法忽略了区块的查询代价。针对这些问题,本文分别研究面向

学位

基于点云位姿估计的运行管理系统设计与实现

托卡马克核聚变堆在运行的时候会产生大量热能、辐射能、电磁场以及中子流,多数情况下都无法进行人工维护。因此需要使用遥操作控制系统对托卡马克装置内部进行维护和操作。在遥操作上层控制系统中需要采集多种数据来对任务进行创建。采集机械臂数据可通过示教来进行,将数据存储到遥操作上层控制系统的运行管理子系统数据库中。但示教采集信息的方式效率低,在目标位置发生变化后就要重新示教,而且在聚变堆运行后装置内部情况不允

学位

局部因果学习驱动的多标签特征选择研究

多标签特征选择在高维多标签学习任务中起着至关重要的作用,并被广泛用于文本分类,Web数据挖掘等领域。现有的多标签特征选择方法主要是探索特征-标签、特征-特征和标签-标签的相关关系中的两种,少数方法能够同时处理三种类型的相关关系。如果能够同时考虑三种相关关系,可以获得带有更多辨识信息的特征子集,用于构建性能更加优越的预测模型。为了解决这个问题,本文将多标签特征选择问题转化为局部因果结构学习问题,围绕

学位

基于预训练语言模型的实体识别及其优化方法研究

与本文相关的学术论文