基于Bi-LSTM与注意力机制的实体关系抽取

来源 :华中科技大学 | 被引量 : 0次 | 上传用户:sxtld
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着全民互联网时代的到来,如何从大规模、非结构化信息中快速准确获取所需知识成为了被广泛关注的课题。在对海量信息进行挖掘分析的过程中,信息抽取是一项基本任务。信息抽取是指从一段文本中抽取特定信息并形成结构化数据的过程。而实体关系抽取是信息抽取的重要组成部分,主要用于识别出文本中实体之间的语义关系,也是智能问答和知识图谱等诸多应用系统的基础。传统的关系抽取方法多基于规则或基于统计,成本较高且不适用于大规模数据处理,而基于深度学习的抽取方法可自动学习句子特征,无需复杂的特征工程,抽取效果也更好。但目前大部分基于深度学习的方法忽略了对文本语义的挖掘。因此,基于已有研究基础,考虑到Bi-LSTM可捕捉双向语义依赖的优势以及注意力机制可为不同作用的语义特征分配不同权重的特点,本文结合这两者进行实体关系抽取。并在特征抽取层引入了词性、实体识别类型、相对位置以及实体对上下文这四种特征,为获取实体间的主要联系,还引入了最短依存路径。为使得模型具备判断语义关系方向的能力,引入了实体关系方向表示层。最后将不同的实体特征计算结果通过softmax归一化映射为所有语义关系的概率,输出实体关系所属类别,从而实现一个完整的关系抽取模型。实验采用SemEval2010 Task8数据集,并为输入特征、模型结构、对抗过拟合策略以及模型本身设置了对比实验,结果表明本文所提出方法的F1值与仅结合注意力机制的Bi-LSTM模型和引入实体关系方向表示层后的该模型相比均有一定提升。
其他文献
五株降解半纤维素细菌的分离鉴定与酶活测定王宜磊孙迅邓振旭(菏泽师专生物学系,274015,山东菏泽,第一作者33岁,男,讲师)半纤维素是植物性材料的重要组成成份之一,约占15%~30%,是陆生植物细胞壁的一种主要组分,较集中于初级和次级细胞壁中.半纤...
期刊
猪肺泡巨噬细胞(porcine alveolar macrophages,PAMs)处于机体先天免疫第一防线,其强可塑性为猪(Sus scrofa)的免疫调控机制解析提供重要细胞模型。lncRNA参与免疫相关过程且是巨噬细胞极化的潜在调控分子。为了建立猪肺泡巨噬细胞不同极化亚型,本研究以3头30日龄健康大白仔猪分离的原代PAMs为实验材料,利用脂多糖(lipopolysaccharide,LPS)
胰岛素样生长因子(IGF)和表皮生长因子(EGF)广泛分布于机体各个部位,是生长因子家族中的重要成员,在生物体内发挥着重要功能。IGF通过结合胰岛素样生长因子绑定蛋白(IGFBP)发挥生理功能,体内大多数IGF呈IGF/IGFBP复合物的形式,只有少数以游离形式存在。目前,关于IGF和EGF在鱼类中的功能主要聚焦在肝脏和性腺组织中,而其在垂体中的具体功能尚不清楚。基于此,本论文以草鱼为研究对象,系
目的:应用GUM法评定膨化食品中过氧化值含量的测量不确定度。方法:通过建立滴定法测定膨化食品中油脂过氧化值含量的测量模型,计算测定过程中各分量的标准不确定度和相对不确定度,对测定结果的不确定度来源及相对贡献进行比较与评定。结果:本次评定不确定度主要来源于称样量引入的不确定度、硫代硫酸钠滴定溶液引入的不确定度、滴定体积引入的不确定度和样品重复性引入的不确定度。当膨化食品中过氧化值的含量0.318 4
动物细菌性传染病限制着畜牧业的发展,同时给人类健康带来了潜在的威胁。抗生素的出现,在一定程度上拯救了受病原菌危害的动物,给人类也带来了益处。然而,由于不合理的使用抗生素,病原菌逐渐产生了抗生素耐药性(AMR),其中细菌多重耐药性(MDR)使一些细菌性疾病的治疗陷入无药可用的困境。多重耐药的病原菌主要依赖于I类整合子介导的抗性基因水平转移而获得抗性,而I类整合子的功能主要依靠整合酶IntI-1蛋白介
猪链球菌病是一种重要的人畜共患传染病,感染猪主要引起败血症、脑膜炎、关节炎等疾病。以前,我国猪链球菌以血清型2型最为多发,近些年研究发现猪链球菌9型的感染趋势正在逐渐上升。肠外致病性大肠杆菌(Ex PEC)血清型复杂,能够定殖和感染肠外各组织器官,导致败血症、脑膜炎、肺炎、心内膜炎等。在养猪业猪链球菌病和大肠杆菌病混合感染的情况严重,目前没有商品化的疫苗可以同时用于这两种细菌性疾病的预防。亚单位疫
目的 免疫检查点抑制剂明显改变了非小细胞肺癌的治疗前景。PD-L1作为免疫治疗的生物标志物已广泛应用于临床,但仍存在部分缺陷,所以进一步研究血清相关标记物在临床中的预测效果是有必要的。方法 回顾性收集河南省人民医院2019年1月—2021年6月收治的接受免疫治疗的晚期非小细胞肺癌患者48例,并于治疗前及治疗4周期后抽取空腹外周血,检测其细胞因子及淋巴细胞亚群水平。4周期后依据疗效[完全缓解(CR)
本实验室前期构建了新型非抗性筛选皮质抑素和生长抑素双表达DNA疫苗C500(p VGS/2SS-2A-S/CST14-asd,以下简称工程菌),生产成本低,可避免抗生素污染;免疫小鼠后取得了良好的增重效果,且未对小鼠造成不良反应,表明该疫苗安全高效,可用在畜牧生产中。为了评价该疫苗应用于大动物的免疫效果和安全性,本试验在对工程菌发酵培养基进行优化以提高疫苗产量的基础上,分别在不同季节以不同剂量免疫
目的 比较冷、热圈套器切除术治疗5~9 mm结直肠息肉的疗效和安全性。方法 选取2018年6月至2021年1月第九〇〇医院莆田医疗区收治的200例结直肠息肉(大小5~9 mm)患者,采用随机数字表法分为冷切组和热切组,每组各100例。冷切组共188枚息肉,热切组共175枚息肉。比较两种切除方式在完整切除率、并发症(术中出血率、迟发性出血率、术后腹痛、穿孔)、手术时间、钛夹使用量等方面的差异。结果两
目的:探讨结直肠息肉患者不同舌诊特征,以研究结直肠息肉与舌诊之间的相应关系及临床意义。方法:收集符合纳入标准的83例门诊及住院的结直肠息肉患者(息肉组)和16例健康者(对照组)的舌象,并进行临床辨证分析。结果:息肉组粪便隐血占比明显高于对照组,差异有统计学意义(P0.05)。结论:息肉患者舌象存在特异性表现,舌色和粪便隐血与息肉患病存在密切相关性。不同舌苔与结直肠息肉数量和大小有关,但不影响腺瘤类