【摘 要】
:
生物医学事件抽取以结构化的形式展示了海量生物医学文献中生物分子之间细粒度的复杂交互关系,为科研人员了解生物机理和攻克医学难题提供了重要依据。一个完整的生物医学事件由触发词和事件元素组成。触发词引起了整个生物医学事件的发生,并且决定了生物医学事件的类别。事件元素是生物医学事件的重要组成部分,在生物医学事件中扮演着重要的角色。因此,本文紧紧围绕生物医学事件抽取中的两个关键问题——触发词识别和事件元素检
论文部分内容阅读
生物医学事件抽取以结构化的形式展示了海量生物医学文献中生物分子之间细粒度的复杂交互关系,为科研人员了解生物机理和攻克医学难题提供了重要依据。一个完整的生物医学事件由触发词和事件元素组成。触发词引起了整个生物医学事件的发生,并且决定了生物医学事件的类别。事件元素是生物医学事件的重要组成部分,在生物医学事件中扮演着重要的角色。因此,本文紧紧围绕生物医学事件抽取中的两个关键问题——触发词识别和事件元素检测展开研究,主要的研究工作分为以下三个方面:一、本文在生物医学触发词识别的任务中提出了Transformer-Capsule的联合模型。生物医学文本中存在大量的领域性词汇,本文使用多维特征嵌入的方式,生成信息丰富的输入特征。生物医学文本中的单词存在噪声字符的问题,本文提出基于注意力机制的动态路由算法,增大Capsule网络中有效胶囊的权重,降低噪声胶囊的干扰。最后为了使每个单词包含充足的生物医学特征和语义特征,本文构建了Transformer和Capsule的联合模型,联合模型分别从单词级和句子级两个方面级提取信息。二、本文在生物医学事件元素检测任务中提出基于元素感知注意力的IDCNNBi GRU模型。由于生物医学文本包含很强的领域特征,本文首次将生物医学领域的预训练模型Bio ELMo引入到生物医学事件元素检测任务中。生物医学文本存在句式冗长复杂和实体分布密集的问题,本文构建了IDCNN和Bi GRU的联合模型,该模型既可以捕获局部的生物医学实体信息又可以捕获生物医学文本全局的句式特征。目前的生物医学事件元素检测方法忽略了候选实例本身的影响,本文提出了一种新颖的元素感知注意力机制,使特征表示更贴近于当前候选实例的分类目标。最后针对生物医学样本类别不平衡的问题,本文改进了传统的损失函数,使用Focal Loss损失函数进行训练。三、本文在生物医学事件的后处理模块中,采用机器学习算法SVM自动进行后处理。先前的方法通常采用人工制定规则的方式,这种方式要求工作人员具备专业的生物医学领域知识,并且无法识别规则外的生物医学事件,在海量的数字化资源中效果不佳。因此,本文采用SVM的方式,可以解决移植性和扩展性差的问题。经过严谨的实验过程,本文提取出完整的生物医学事件。本文方法在CG、PC和MLEE数据集上,触发词识别任务的F1值分别达到了79.29%、73.96%和80.74%,事件抽取任务的F1值分别达到了57.13%、57.41%和61.69%,展现出有竞争力的性能。
其他文献
税收是国家组织财政收入的主要形式与工具,税务持续受到社会公民的广泛关注。伴随我国税务信息化建设的全面开展,税务办理效率显著提升,但目前税务存在业务内容复杂、征管关系繁多、时效性较差等问题。纳税人无法全面了解税务政策,税务办理存在的问题主要通过咨询客服专员得以解决,方式单一且人力资源投入较大,无法在较短时间解决大量用户的税务咨询需求。针对当前税务办理存在的问题,论文基于自然语言处理技术与系统开发相关
无监督学习因为有着能够利用未标记的数据进行训练的特性,成为人工智能领域讨论的热点之一。基于能量模型的生成对抗网络就是一种学习数据的非规范对数密度的无监督学习方法。针对现有的能量模型框架,本文提出一种非参数估计邻域熵算法的能量模型(NEEM),主要工作如下:(1)提出非参数估计邻域熵算法的能量模型(NEEM),算法在考虑每个样本点附近k近邻区域的非均匀概率密度的情况下,通过给经典熵估计方法增加局部高
在计算机视觉领域中,对处于复杂光线场景或者极端运动状态下的目标物体进行跟踪是一项重要且充满挑战的任务。相比于传统相机,基于事件相机的视觉感知系统更关注每个像素的光强变化,表现出了更加出色的感光能力,更低的延迟和更小的功耗。本文针对基于事件相机的运动目标跟踪问题展开研究,主要工作是基于相关滤波跟踪框架设计了一种针对于异步事件流的跟踪方案,具体包括外观模型建立和跟踪算法设计两部分。在外观模型建立部分,
航空运输是现代化运输体系的重要组成部分,民用航空运输是国民出行的重要交通方式。伴随民用航空运输的全面普及,航班数量激增致使航班延误与波及延误事件频发,严重影响乘客出行计划、降低航司经济效益。此外,因航班延误带来的纠纷与冲突常引发群体性事件,影响社会和谐与稳定。基于此,制定鲁棒性的飞机排班调度方案具有重要的应用价值。本文针对鲁棒性飞机排班调度计划问题展开研究,具体地,本文主要研究内容如下:(1)针对
近年来,为了解决图像相关性强和冗余度高等问题,基于混沌理论的图像加密成为了一个热门的研究课题。另一方面,随着3D打印的兴起,基于混沌理论的三维模型加密的研究也迫在眉睫。且现有的三维模型加密存在着加密过程复杂,加密速度慢等问题,故本文提出了一种基于混沌理论的三维模型加密算法。另一方面,基于现存的混沌图像加密算法所存在加密效率过低和密钥敏感性较弱的等问题,本文分别提出了两种基于混沌理论的图像加密算法。
当前,陆上环境目标检测技术的发展已经趋于成熟,在检测速度和精度上都有了较大的提升,而水下目标检测的相关研究则进展缓慢,其主要原因有以下两点:首先,不同海域、不同深度、不同时间以及不同浑浊度状态下采集到的图像风格差异较大;其次,用于目标检测训练任务的图像需要预先进行人工标注,而人工标注不仅费时费力,长时间持续标注也可能会由于主观因素导致出现错标和漏标等问题,这些“问题数据”将会直接影响训练出的目标检
随着我国对外贸易总量的飞速增长,港口的集装箱吞吐量呈现井喷趋势,如何在满足一定填充率的前提下,实现快速装箱,成为亟待解决的问题。集装箱三维布局优化问题本质上属于NP-Hard问题,其解空间过于庞大,难以找到最优解,且当待装载货物种类较多(即异构性较强)时,求解速度较慢。针对此问题,本文提出一种多策略动态融合启发式算法(DHHA),在保证填充率的前提下实现快速求解。首先,考虑现实约束条件,建立装载模
近些年,城市道路网络中基于车辆等移动对象所产生的轨迹数据的相关研究在智能交通领域掀起了一片研究热潮。轨迹异常检测作为路网轨迹模式挖掘的一个热门研究课题之一,其主要目的是识别出轨迹数据中异常但有价值的数据信息,对路网中欺诈和不良事件的监测具有重大意义。现如今,大多数针对路网的轨迹异常检测算法都倾向于采用基于密度或基于距离的检测方法,并未考虑时间信息对异常轨迹检测结果的影响;并且在检测过程中,通常选择
船舶交通管理(Vessel Traffic Service,VTS)系统是集雷达、通信、计算机网络、信息处理技术于一体的多技术融合与集成的系统,近20年来我国在沿海和长江各港口引进国外的技术建设了大量的VTS,随着水上交通的不断发展、国家信息安全的加强和用户对系统运行效率的提高以及智能化的需求,对VTS系统进行国产化已经势在必行。目前的VTS系统对于船舶的识别、交通安全指挥、风险提示和告警、船舶进
多媒体数据是网络大数据的一种主流表示形式,并呈现出海量、高维、异构等特性。如何在大规模多媒体数据中,快速、准确地检索出目标数据是计算机研究领域的一个基本问题,其解决方案被广泛地应用于诸如物体检索、身份识别、三维重建等场景中。不过,高效的近邻查询一般需要借助数据的提前索引,而多媒体数据的高维特性使得多数传统索引技术失效,并导致精确近邻的查询效率急剧下降。近似最近邻检索技术脱颖而出,逐渐成为解决上述问