基于注意力机制的开放域实体关系抽取

来源 :哈尔滨工业大学 | 被引量 : 0次 | 上传用户:DragonDoor
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
大词林是一个有自动构建能力的网状知识图谱,所谓的网状结构,是指知识的横向性与纵向性。实体之间的关系、一个上位词的同义词都属于横向上的关系,而实体与上位词的关系、上位词之间的层次关系,都属于纵向上的关系。本课题主要为大词林提供辅助,旨在为大词林提供稳定的横向关系补充,即实体间关系的补充。1.针对大词林中纵向关系中实体与横向关系中实体不统一的问题,即实体路径消歧,本文首先提出基于词向量相似度计算的方法,将实体路径信息与实体义项对应,将实体路径信息与实体义项当做两个字符串,利用腾讯提供的词向量计算余弦相似度。该方法对于语义特征较为明显的情况处理效果较好。但在中文中,有很多词是具有对立含义的,为了挖掘文本背后的“对立”关联,本文引进了基于深度学习的实体路径消歧,包括ELMO模型与Bert模型,并对两类模型结果进行了分析。2.在开放域关系抽取任务中,针对中文领域关系抽取任务缺少语料的问题,本文提出了一种基于启发式规则的关系抽取方法,采用4类启发式规则模板并辅以搜索引擎结果计算置信度,得到初步实验效果,并为有监督方法提供语料。随后,针对开放域关系抽取难度大的特点,本文引入了端到端的关系抽取方法,以改善主流方法依赖命名实体识别且关系类型限定的不足,模型在获得关系的同时,将头实体与尾实体一并得出,将命名实体识别与关系抽取任务的联系在一起,最后辅以搜索引擎进一步增强实验结果,使得模型更加适应于中文数据集。3.在从文本中获取完关系三元组后,需要将关系三元组中的头实体,尾实体对应到具体的实体义项,即实体映射。本文提出了一种结合本文信息的实体映射方法,通过transformer网络结构来学习文本信息与实体义项的特征表示,通过带有实体义项信息的特征表示来预测文本中抽取的头尾实体是否属于该实体义项的概率。实验显示该方法达到了预期效果。
其他文献
为了进一步认识跨文化体育深层次的内涵,使跨文化体育研究达到不断深化、不断发掘、不断总结、不断走向澄明之境的终极目的。运用文献资料法,论述了跨文化体育的超越性追求、
近年来,在上级机构编制部门的指导和市委、市政府的领导下,烟台市机构编制部门牢固树立一个理念,深入推进两项改革,努力健全三个机制,逐步转调工作的重心和方向,为保障和改善
目的评价肝动脉、门静脉双期多层螺旋CT扫描及三维CT血管造影(3D CTA)在肝移植肝门血管重建术式选择中的应用价值。方法25例拟行肝移植的受者进行肝动脉及门静脉双期3D CTA,
根据出版传媒类A股上市公司2006-2014年间公开披露的财务信息,采用多元线性回归法对出版传媒类上市公司融资结构与经营绩效的关系进行实证研究,结果表明:出版传媒类上市公司融
立体逻辑方阵不仅可表示八个复合命题之间的真假制约关系,还可表示八个复合命题推理之间的真假制约关系。即简单复合命题推理无效式和复杂复合命题推理无效式的异变形式及其
近年来,随着社会对节能减排以及新能源的重视,新能源汽车行业的发展备受重视。纯电动汽车因为其更低的排放、更低的电能成本以及对能量更高的转换能力而成为热点。但是,受限
<正>众所周知,脑水肿和脑疝形成是脑出血死亡的主要原因。及时、有效地控制脑水肿可有效地改善病情及预后。2004年1月起我科使用无创脑水肿动态监护仪对于脑出血患者的综合扰
会议
在清代众多对小说《红楼梦》进行改编的戏曲中,仲振奎和陈锺麟同名为《红楼梦传奇》的作品是比较重要的两种。两位作者以较大的篇幅,基于对各自创作目标的追求,对小说情节及
由定性向定量是化学学科一个合理的发展方向。在我们的教学实践中,学生学习化学中,运用定性的手段去解决问题则更为普遍,以定量思想贯穿的实验探究相对来说显得比较单薄。如何在