Improved Graph-based Dependency Parsing via Hierarchical LSTM Networks

来源 :第十五届全国计算语言学学术会议(CCL2016)暨第四届基于自然标注大数据的自然语言处理国际学术研讨会(NLP-NABD | 被引量 : 0次 | 上传用户:jyy3196294
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
  In this paper,we propose a neural graph-based dependency parsing model which utilizes hierarchical LSTM networks on character level and word level to learn word representations,allowing our model to avoid the problem of limited-vocabulary and capture both distributional and compositional semantic information.Our model achieves state-of-the-art accuracy on Chinese Penn Treebank and competitive accuracy on English Penn Treebank with only first-order features.Moreover,our model shows effectiveness in recovering dependencies involving out-of-vocabulary words.
其他文献
吡虫啉在农作物上的长期广泛使用,使残留问题日趋严重,为保障消费者健康,必须加强吡虫啉残留的检测.传统仪器分析方法耗时长、成本高,因此亟需一种快速现场检测分析方法.本文阐述了基于两种标记材料(纳米金和氧化铕乳胶微球)的免疫层析试纸条快速检测吡虫啉的技术研究.通过比较两者的线性范围、灵敏度和操作可行性、便捷性,为不同需求的使用提供参考依据.研究结果表明:两种试纸条在检测吡虫啉时肉眼判断阴阳性的检出限都
噻嗪酮作为一类昆虫生长调节剂,长期被用于稻田稻飞虱防治工作中.由于使用时间较长,稻飞虱对噻嗪酮的抗性已经较为严重.但是,在相当长一个阶段内,噻嗪酮仍旧是我国南方一些稻区防治稻飞虱的重要手段.为保证防效,噻嗪酮在水稻田的使用浓度和次数有可能上升.这可能导致噻嗪酮在土壤和水环境中暴露水平上升.因此,研究噻嗪酮对淡水浮游生物的效应对于增进对其的环境分先评价和合理使用非常有意义.而国内外针对噻嗪酮的浮游生
含二氟甲基基团表现出优异的生物活性,使其越来越受到人们的关注.根据二氟甲基化试剂的性质,可以分为亲核二氟甲基化试剂、亲电二氟甲基化试剂、自由基二氟甲基化试剂、偶联反应二氟甲基化试剂等四种类型,本文对每一类中常用的试剂进行了介绍.另外,还综述了二氟甲基化试剂在农药合成中的应用.
为了同时挖掘商品口碑数据中所谈论的对象、对象的某个方面以及评论者对这个方面的观点,用于指导消费者的消费和生产厂家对商品的改进,本文面向口碑数据提出一个无监督对象方面情感联合模型.该模型假设方面分布依赖于对象分布,情感分布依赖于方面分布和对象分布,词是采样的最小单位.在汽车口碑数据上进行了多组实验,实验表明,无监督对象方面情感联合模型不仅可以判别文本方面和文本情感的类别,而且还可以获取文本对象信息.
本文尝试从文本语义离散度的角度去提升自动作文评分的效果,提出了两种文本语义离散度的表示方法,并给出了数学化的计算公式.基于现有的LDA模型、段落向量、词向量等具体方法,提取出四种表征文本语义离散度的实例,应用于自动作文评分.本文从统计学角度将文本语义离散度向量化,从去中心化的角度将文本语义离散度矩阵化,并使用多元线性回归、卷积神经网络和循环神经网络三种方法进行对比实验.实验结果表明:在50篇作文的
AMR是国际上一种新的句子抽象语义表示方法,有着接近于中间语言的表示能力,其研发者已经建立了英文《小王子》等AMR语料库.AMR与以往的句法语义表示方法的最大不同在于两个方面,首先突破了树结构,转而采用图结构;其次允许添加原句之外的概念节点来表示隐含的语义.本文针对汉语特点,在制定中文AMR标注规范的基础上,标注完成了中文版《小王子》的AMR语料库,标注一致性的Smatch值为0.83.统计结果显
高考阅读理解选择题是基于背景材料,通过对材料的“理解”从多个选项中选出最佳选项.由于提供的背景材料相对较短且关键信息极具隐藏性,答案可能无法在背景材料中直接找到.因此,如何从背景材料中挖掘信息并与选项进行相关性分析是解答该类问题的关键,而句子级的语义相关性分析是背景材料与选项相关性分析的基础.本文通过对大量高考科技文文意理解类选择题进行分析,提出基于多维度投票算法(Multi-Dimension
研究基于矩阵分解的词嵌入方法,提出统一的描述模型,并应用于中英跨语言词嵌入问题.以双语对齐语料为知识源,提出跨语言关联词计算方法和两种点关联测度的计算方法:跨语言共现计数和跨语言点互信息.分别设计目标函数学习中英跨语言词嵌入.从目标函数、语料数据、向量维数等角度进行实验,结果表明:在中英跨语言文档分类中以前者作为点关联测度最高得到87.04%的准确率;在中英跨语言词义相似度计算中,后者作为点关联测
统计机器翻译模型,特别是基于句法的翻译模型,其翻译单元在保留足够的翻译信息以及翻译单元在翻译新句子时的泛化能力上始终存在着一个平衡.神经网络被成功用于统计机器翻译模型中的调序和语言生成中.本文提出了一个新颖的基于神经网络的句法翻译规则生成器——依存边转换翻译规则生成器(DETG),它利用一条转换翻译规则的源端以及源端的上下文作为输入,以依存边转换翻译规则的目标端作为输出.它不仅保留了依存边——这种
Most researches to SRL focus on English.It is still a challenge to improve the SRL performance of other language.In this paper,we introduce a two-pass approach to do Chinese SRL with a Recurrent Neura