基于神经网络的生物医学实体识别及关系抽取

来源 :大连理工大学 | 被引量 : 0次 | 上传用户:lxs000
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
生物医学命名实体识别和实体关系抽取是生物医学信息抽取领域中基础而关键的任务,为生物医学知识图谱,疾病治疗,药物研发提供关键的信息。近年来,基于深度神经网络的方法已成为生物医学信息抽取的主流方法。相较于传统的统计学习方法,深度神经网络有着自动抽取特征和模型泛化性好的优势。本文基于深度神经网络方法研究了生物医学命名实体识别和药物-药物间关系抽取两个任务。在生物医学命名实体识别任务中存在着实体稀疏性高、边界模糊、含有特殊字符等情况。针对上述问题,本文提出了一种基于CNN-BLSTM-CRF的神经网络模型。该模型通过卷积神经网络(Convolutional Neural Networks,CNN)自动抽取单词的字符级特征,并将单词的字符级特征与词向量结合送入长短时记忆网络(Long Short Term Memory Network,LSTM)学习上下文信息。最后通过条件随机场(Conditional Random Field,CRF)得到一个全局最优的标记序列。本文在两个数据集上的实验证明了该模型的有效性,在BioCreative II GM和JNLPBA语料上分别达到了89.09%和74.40%的F1值。在生物医学药物-药物间关系抽取任务中,本文针对实例间有着相似的上下文、实体信息缺失等问题,提出了一种融合知识的注意力机制的药物-药物关系抽取模型。该模型预先获取维基百科和DrugBank数据库的药物摘要信息作为外部知识,并通过Doc2vec将外部知识编码成为外部知识向量。首先模型通过双向门控循环单元网络(Bidirectional Gated Recurrent Unit,BGRU)对于输入序列进行编码并学习其语义信息。然后利用注意力机制融合BGRU编码后的序列和实体外部知识向量,获得结合外部知识和上下文语义信息的序列表示并进行分类预测。在DDIExtraction 2013语料上的实验结果表明,该模型达到了71.86%的F1值。综上所述,本文针对生物医学命名实体识别中存在的问题提出了基于CNN-BLSTM-CRF的生物医学命名实体识别模型。在BioCreative II GM和JNLPBA语料上的实验表明,所提出的CNN-BLSTM-CRF模型是有效的。本文针对生物医学药物-药物间关系抽取任务的现存问题提出了融合知识注意力机制的药物-药物关系抽取模型。在DDIExtraction 2013数据集上的实验证明了本文提出的融合知识注意力机制的药物-药物关系抽取模型的有效性。
其他文献
目的主动脉缩窄伴弓发育不良病变谱广,解剖结构个体差异大,目前其外科治疗存在争议,术后远期并发症率、生存率仍欠理想。本研究第一部分探索了主动脉缩窄伴弓发育不良病理谱
2008年经济危机爆发后,发达国家开始意识到制造业对国家发展的重要性,“工业2.0”、“工业4.0”和“再工业化”等政策纷纷出台,推进制造业转型。在这样的背景下,中国开始审视
在地下水数值模拟中,经常需要对重点区域进行加密,来精确地刻画该区的水头变化,溶质运移等情况。基于MODFLOW的局部网格加密技术(Shared Node Local Grid Refinement)LGR仅需
焊接机器人是一种工业中常用的工具机器人,该焊接机器人的机械本体采用以SCARA为基础的5自由度结构,该机器人采用圆柱坐标且其在效率高,结构好的基础上,加入了具有多自由度的
目的:通过收集近10年来有关中医药治疗单纯性肥胖和超重的文献,对其中的中医证型、用药进行统计分析,探讨其中医辨证、用药及治疗规律,为单纯性肥胖和超重的中医治疗提供依据
社交媒体作为一种新兴的信息技术,对于深入推进数字乡村战略,加快发展“互联网+农业”模式,进而更好的解决三农问题具有重要作用。然而,我国仍有相当数量的农民,受限于自身和
·津田’芜菁色素合成受UV-A光诱导,受UV-B/蓝光复合光的协同效应。因此我们认为UV-A信号转导的光受体不同于拟南芥中发现的蓝光/UV-A光受体(隐花色素),是一种新的受UV-A特异
2006年Hinton提出的深度学习方法开启了深度学习在学术界和工业界研究和应用的浪潮。深度学习主要是通过模拟生物神经系统对真实世界物体所做出的交互反应,具有强大的自学习
注水开发是油田开发的最主要手段之一,水驱开发进入后期以后,大多数油田都将进入到高含水期,此时水驱油田将存在着采收率偏低的问题,为研究高含水油藏开发后期渗流特征、剩余油分布机理及提高剩余油开采效率的方法,本文采用玻璃刻蚀模型、以微观水驱和微观聚合物驱实验为基础,运用微观可视装置对微观驱替过程进行了全程观察,同时对微观水驱渗流特征、剩余油的形成和分类方法及提高剩余油的采收率进行了大量实验研究。本文所取
《经济学人》作为维护贸易自由主义的传统精英媒体,对“中美贸易战”事件高度关注。本研究以甘姆森“诠释包裹”理论为研究路径,以“中美贸易战”事件为研究对象,以《经济学