论文部分内容阅读
生物医学命名实体识别(BNER)对促进医学信息学研究具有重要意义。针对现有方法识别精度和效率低,特别是不能很好识别组成复杂和罕见的生物医学名称问题,提出一种基于词典注意力双向门控循环单元神经网络和CRF(DABGC)BNER的方法。通过一种高效多模态匹配方法对生物医学词典进行高效匹配,使用双向GRU网络输出包含上下文信息的隐状态。引入多头注意力机制解析词之间的联系,通过权重的方式将词典匹配结果和注意力机制进行结合,融合CRF计算出最优标签序列。在NCBI疾病和BC5CDR化学数据集上,DABGC获得