生物医学事件抽取中触发词识别研究

被引量 : 0次 | 上传用户:juanzi0666
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,关系抽取已由简单二元关系抽取发展为复杂关系抽取,生物医学事件抽取成为研究焦点。抽取一个事件,需要识别出事件的触发词、参与者与事件类型。生物医学事件抽取系统至少由触发词识别和要素识别组成,且需要先对触发词进行预测或识别,这使得研究触发词识别有重要意义。本文描述生物医学事件抽取中触发词识别的两种方法:基于组合分类器的触发词识别和基于深度学习叠加去噪自动编码器(SdA)的触发词识别。在基于组合分类器的方法中,利用丰富的基于依存和句法解析的人工特征构建多个单一分类器,对多个单一分类器的结果进行三种操作:集合操作、投票和叠加进行组合。在基于深度学习叠加去噪自动编码器的方法中,只利用候选触发词的线性上下文对当前候选触发词进行预测,不需要大量人工特征,减少了对生物方面专业知识的依赖,初步证明了特征表示的有效性。本文在生物医学事件抽取公共评测语料BioNLP’09和BioNLP’11上进行实验,其中基于组合的方法在两个语料上评价;基于深度学习叠加去噪自动编码器的方法,在‘BioNLP’09上进行性能评价。实验结果说明:组合方法能够在单一分类器的基础上提高性能,且两层叠加方法优于集合操作与投票,在BioNLP’09和BioNLP’11上F值分别取得73.79%和74.25%;基于SdA的方法在不利用大量人工特征的前提下,F值达到57.04%,在词特征基上加上SdA的特征表示,PA上F值达到74.41%,减少了人工特征,同时证明了深度特征表示的有效性。
其他文献
回顾了高职院校法律专业实践教学的现行模式,提出了完善高职院校法律专业实践教学模式的建议。高职院校法律专业已探索出专业实习、模拟法庭和社会实践等多种实践教学模式,初
目的 :对社会技能量表进行修订 ,并初步考察大学新生的社会技能与心理健康的关系。方法 :对 3 94名大学新生进行社会技能量表、症状自评量表 (SCL -90 )和自我和谐量表评定 ,
<正>伴随着发了高烧的房价,投资购房一阵热似一阵,在抢房大战中,众多购房者颇有"抢到篮里就是菜"的味道,只管交钱买房,坐等升值;至于房屋质量如何,是否符合合同规定和设计要
介绍了废弃物物流的基本概念,分析了发展废弃物物流的必要性和紧迫性,提出发展废弃物物流的基本框架和具体措施,包括废弃物的分类收集、运输、包装与存储、回收加工及最终处
<正> 会计电算化是会计学、电脑与信息技术、企业管理及经济计量学等学科相互交叉结合后产生的综合性学科。20世纪90年代初期以来,我国会计改革已迈出了稳健、有序的步伐,并
翻译研究成为一门独立的学科始自挣脱语言学的束缚 ,但要前进与发展却必须向其他学科 ,首先是语言学汲取营养 ,因此 ,它所扬弃的只是狭隘的结构主义语言学的翻译研究模式 ,所
<正>我还是第一次听我们历史系三位70后的代表集中讲授,他们都从各自角度来阐述了自己对国家的理解,非常精彩。我们这代学者如今已经成为"老同志"了,前几天另外一个会上一个
交通运输是现代物流的重要环节和核心要素。文章分析了铁路运输在发展现代物流中的优势和作用,介绍了铁路货运发展现代物流的有关情况,探讨了铁路货运融入现代物流的具体途径
在改性酸酐固化的环氧树脂体系中,加入非环氧类低粘度活性交联剂,得到了室温下粘度仅为80mPa·s的酸酐 环氧树脂体系。利用正交试验优选了树脂配方,该树脂体系在有效降低粘度
高校女教师是高等教育发展的重要力量,从性别平等与两性和谐发展的角度看,她们的发展状况反映并且制约高等教育发展的水平。本文以广西十所高校女教师的基本情况以及对869名