论文部分内容阅读
事件抽取是信息抽取领域的重要研究方向,针对目前网页文档中文事件抽取的关键问题,提出利用开源的通用文本处理框架(GATE)进行中文事件抽取的方法,设计GATE中文事件处理流程,开发GATE插件,解决中文分词与词性标注、领域词典、中文抽取规则设计等关键技术,实现了中文事件的类型识别和元素抽取。并以四类政治事件为例,进行中文事件抽取实验。实验结果表明,基于GATE的中文事件抽取具有良好的通用性.能够取得了较好的抽取效果。