基于语义对等映射的事件短语学习

来源 :苏州大学 | 被引量 : 2次 | 上传用户:bonbonty
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
事件抽取是信息抽取领域中最重要的研究内容之一。事件表示的多样性导致事件抽取一直是一项很具挑战性的任务。事件是指在特定时间、地域范围内,由一到多个参与者参与,发生的一个或一组动作变化的集合,事件短语则是表示事件的载体。主流的事件抽取方法主要分两类,一是基于监督机器学习的方法,依赖大量人工标注数据,人力成本高且可移植性差;二是基于半监督学习的自举方法,抽取效果高度依赖于初始种子的质量和对迭代过程的条件约束。本文研究致力于缓解第二类方法中的条件约束,利用Huang和Riloff[1]自举方法获得的事件短语作为初始种子,结合单语和双语跨语言的线索,针对如何利用语义对等映射的思想学习事件短语展开了深入研究,主要包含以下三个方面:(1)基于词嵌入相似语义映射的事件短语学习首先,利用分布语义表示将语义相似的单词进行聚类。其次,采用相似语义的单词映射原事件短语中的部分单词重组成新短语。最后,利用大规模英文语料对新短语进行语言学检验,过滤掉不符合语言学习惯的短语。实验结果证明,该方法有效地学习出全新的事件短语,提升了事件识别任务的效果。(2)基于paraphrase双语语义映射的事件短语学习首先,通过机器翻译技术实现单词和短语在双语之间的翻译映射,获得候选paraphrase。其次,结合n-gram模型和语言学特征标注语料对候选paraphrase进行评分。最后利用paraphrase进行语义对等映射扩展事件短语。实验结果证明,该方法实现了事件短语的语义扩展和一定程度上的短语结构扩展,具有较好的性能。(3)基于双语语义结构映射的事件短语学习受到前面工作的启发,我们采用双语之间的结构差异作为线索,探索利用跨语言信息实现事件短语的学习和短语结构的泛化。首先,利用机器翻译技术获取中英平行语料的词对齐信息。其次,结合依存句法分析抽取出事件短语的结构信息。然后,利用短语的结构信息和词对齐实现事件短语在双语上的语义结构映射。最后,将双语语义结构映射方法拓展成自动迭代的学习系统,不断地抽取新的事件短语。实验结果证明,双语语义结构映射方法不仅抽取了新的事件,还泛化了事件短语结构,克服了必须依赖严格句法约束才能抽取事件的局限性。
其他文献
<正>创新是引领发展的第一动力,是商业发展永恒的主题。2017年,在政策利好、科技进步、需求升级等多种因素的驱动下,零售领域内涉及业态业种、服务方式、渠道组织乃至商业模
目的 :探讨对进行放疗的鼻咽癌患者实施系统护理对其口腔黏膜的影响。方法 :对2015年1月-2015年12月期间在我院接受放疗的80例鼻咽癌患者的临床资料进行回顾性研究。我院根据护
民国时期(1912-1948年)是我国大学通识教育发展的重要阶段。这一时期,我国大学通识教育通过继承、借鉴及创新等途径,形成了特色鲜明的发展模式,包括预科模式、主辅系模式、共
介绍了平整机亮印的主要特征,对其产生原因进行分析。通过对各轧辊间接触压力的分析、所使用轧辊的工况确认、平整机控制参数的优化以及平整机喷梁的改造,基本分析出其原因,
运用协整理论对沈阳市工业发展与经济增长之间关系进行了实证检验,建立了误差修正模型,分析了沈阳市工业发展与经济增长之间的短期关系,并对两者之间的因果关系进行检验。结
<正>11月20日,特朗普宣布将朝鲜重新列入美国的"支持恐怖主义国家"名单,进一步加大对朝施压力度。分析人士认为,此举恐造成美朝之间紧张对抗加剧。特朗普当天在白宫举行的内
国内老龄化以及心脑血管等疾病导致的肢体偏瘫逐年增加,而传统康复师一对一的治疗方案不仅需要大量的康复医师,而且康复效率低、精确性差;针对目前市面上康复机器人训练位姿
该文简述了航天电子产品数字系统中时钟信号的重要性和敏感性。从原理上分析了对时钟信号形成干扰的噪声的主要形式和产生机理。介绍了针对航天电子产品数字系统的时钟信号的
有机马克思主义是一个比较新的国外马克思主义流派。其基本价值取向是,在对当代资本主义的批判中实现马克思主义和西方过程哲学思想等的有机融合。有机马克思主义的一些合理思
报纸
在Brock and Hommes(1997,1998)工作的基础上,本文利用异质信念模型对资产市场动态进行了数值模拟。研究发现异质信念之间的竞争演化决定了资产价格的动态波动,并导致系统呈现混沌