基于双分解的生物事件抽取

来源 :大连理工大学 | 被引量 : 0次 | 上传用户:haoaini0413
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
生物分子事件就是生物分子的具体行为。在生物事件抽取过程中,需要识别每一个生物事件的文本触发词、事件类型和事件要素。在生物医学领域,一个事件可以是另一事件的要素,从而形成嵌套事件,如regulation事件。本文描述了一个使用双分解算法从生物医学文献中抽取复杂生物事件的系统,这一系统将生物事件进行联合抽取。定义了一组丰富的基于依存分析图的特征,且利用词向量加入词的语义和语法信息。这一系统包含四个主要处理步骤:触发词识别,要素识别,双分解阶段和语义后处理。通过分离触发词识别和要素识别,可以用熟悉的命名实体识别的方法来给出事件触发词的可信度;事件要素识别是预测每一个触发词-触发词对和触发词-实体对作为事件要素的可信度。这两步都用在线算法实现。再利用双分解方法进行推理,解决事件中的约束问题,最后基于规则的后处理用于调整最终的输出,使之与事件要素的限制一致。本系统通过在触发词识别和要素识别中加入语义和语法信息,改善事件触发词识别和要素识别的性能,从而提高事件抽取系统的整体性能。在BioNLP’09的开发集上,本系统在任务1上的F值达到59.77%,比BioNLP’09上最好的结果提高了0.96个百分点。在BioNLP’11的开发集上,F值达到57.08%,比当前最好结果高0.35个百分点。在BioNLP’13测试集上达到53.19%,比当前最好的结果高了2.22个百分点。
其他文献
随着各种先进技术在智能电网中的广泛应用,以及IEC61970标准为智能电网信息一体化建设提供了一系列的标准和规范。其化解了供电企业异构系统间信息共享的矛盾,解决了供电企业智能电网信息交互过程中的诸多实际困难,也方便了第三方应用程序并入电网平台。传统基于C/S(客户端/服务器)架构方式GIS(Geographic Information System)应用,在随着电网规模的不断扩大,它所固有的一些不
目前光网络正向全光、业务多样化的方向发展。同时,业务量的攀升、全球能源危机的出现,为通信网中能源的有效利用提出了挑战。全光网络中没有电再生设备,不能规避非理想设备和器
多核/众核网络化计算、低能耗绿色计算、高可信计算等计算模式的出现,对嵌入式实时系统带来了新的研究需求与挑战。随着嵌入式系统应用领域的不断深化和芯片集成度的日益提高
近年来,国内移动互联网强势发展,智能手机迅速普及,人类已经进入了移动互联网时代,利用移动终端接入互联网进行信息交互,演变成为信息时代的一种新的生活方式。2014年中国互联网络
近年来,嵌入式计算、无线通信网络和分布式信息处理等技术快速发展,各种新技术得到广泛应用;而现实的应用需求也为人们不断设计出新的技术规范提供了动力。ZigBee作为无线通信
几何造型是CAD系统的核心.参数曲线曲面一直以来都是描述几何形状的主要工具,其中,参数化和曲面拼接是CAD中曲线曲面造型的基础问题.作为本文的部分内容,我们研究了Bezier曲
现代通信技术的高速发展以及移动智能终端的普及,使得人们对电信业务质量的要求越来越高,电信运营商可以通过提升业务质量来赢得用户资源,业务的用户体验是制定高效提升业务
视频图像序列中的目标跟踪是计算机视觉领域中的核心研究课题之一,最近几十年来受到了学者们的广泛关注。目标跟踪技术为更高层的视频理解和场景解释提供底层对象和分析依据,
随着语义网技术的不断成熟,网络资源环境向智能化、语义化和结构化方向发展。当前的网络资源环境中的信息多数是以人能够理解的形式呈现的,缺乏被计算机理解和处理的基本形式,阻
随着网络信息技术的飞速发展,今天,信息在社会生活中扮演着越来越重要的角色。各行各业都需要从海量的数据中搜索对自身有用的信息来以满足发展。但这样有很大的可能导致个体