【摘 要】
:
隐式篇章关系识别任务旨在根据句法信息、语义信息和上下文信息等线索推理论元对之间的篇章关系。该任务因缺乏显式连接词等直接推理线索,需依赖论元充分的语义表示帮助推理,是自然语言处理领域中一项基础且颇具挑战的任务。本文为挖掘论元更丰富的语义表示,基于宾州篇章树库v2.0,提出了基于多粒度和交互敏感的隐式篇章关系识别研究,主要包括三个部分:第一部分是短语级表示学习方法。短语信息因为天然的语义内聚性,是识别
论文部分内容阅读
隐式篇章关系识别任务旨在根据句法信息、语义信息和上下文信息等线索推理论元对之间的篇章关系。该任务因缺乏显式连接词等直接推理线索,需依赖论元充分的语义表示帮助推理,是自然语言处理领域中一项基础且颇具挑战的任务。本文为挖掘论元更丰富的语义表示,基于宾州篇章树库v2.0,提出了基于多粒度和交互敏感的隐式篇章关系识别研究,主要包括三个部分:第一部分是短语级表示学习方法。短语信息因为天然的语义内聚性,是识别篇章关系的有效特征。基于此,本文提出一种基于短语级表示学习的方法。该方法先利用图注意力卷积网络调整论元中每个词的权重,并通过图卷积网络得到短语信息,最后通过交互式注意力机制融合短语信息和论元对的交互信息。第二部分是多粒度表示学习方法。第一部分丰富了论元的语义表示,但是增加了数据预处理的工作量。针对该问题,本文提出多粒度表示学习方法,该方法利用不同大小的卷积核和基于双向长短时记忆的注意力机制学习较大粒度表示,将其与词级表示拼接得到多粒度表示,从而自动抽取多粒度表示并提升性能。第三部分是交互敏感表示学习方法。第二部分中双向长短时记忆网络编码论元时,其门控机制使编码仅依赖自身信息来决定在当前时刻遗忘和输入的信息,导致部分重要的交互信息被门控机制过滤。因此,本文提出一种基于交互敏感表示学习的方法,该方法通过修改输入门和遗忘门将外部信息输入到记忆单元,从而增强论元语义表示。此外,采用图卷积网络根据依存关系结构生成论元的综合语义表示。本文通过上述方法,从语义表示学习的角度出发,层层递进。以二元分类构建模型,其中比较、偶然和扩展关系超过目前前沿方法,F1值分别为50.66%、60.40%和75.40%,在时序关系上的性能与前人工作可比。
其他文献
自全面“营改增”之后,我国的增值税税率进行了多次下调。制造业是我国的支柱产业,对推动经济高速发展起到至关重要的作用。增值税税率下调对制造业企业的影响效果引起了社会的广泛关注。对增值税税率调整政策的研究,一方面可以让政策制定者检验政策的有效性,另一方面能够使企业了解自身在政策中的获益程度以及如何应对新的增值税改革措施。本文在理论层面从税负效应和价格效应两个方面探讨增值税税率下调对制造业企业成长性的影
网络技术的发展赋予了信息处理技术新的发挥空间,能够实现全收集全分析的云计算技术使得互联网企业对个人信息的采集与利用效率产生了划时代的蜕变。大数据化的个人信息成为了企业产品迭代与竞争的关键因素。信息处理方式的进化让建立在前互联网时代的个人信息保护方式已经不再能够适应当前与未来的信息处理流程,需要对个人信息的基本要素进行重建,其中最重要的是识别性要素的再认识。同时,对《民法典》中对个人信息保护的条款进
随着移动互联网技术的飞速发展,各种网络应用层出不穷,在为人们带来便利的同时,也产生了海量的数据资源,使得人们面临选择困难的窘境。推荐系统从海量信息中筛选有价值部分,生成合适的策略进行推荐,很好地缓解了信息过载的问题。其中,序列推荐通过挖掘用户历史交互记录中有价值的顺序模式,为用户提供更加可靠的推荐,已成为当下研究的热点。然而,现有的模型大都关注用户序列单个层面的问题,对完整的多层面建模不足。基于此
高分辨率图像对于日常生活和科学研究都具有重要意义。但是,由于硬件设备和外部条件的限制,很多时候难以获取满足需求的高分辨率图像。自从深度学习技术应用到图像处理领域以来,在各种图像处理任务中都取得不错的效果,随着深度学习技术的不断进步,基于深度学习的图像超分辨率重建技术在业界内受到广泛的关注。超分辨率技术可以从给定的低分辨率图像或者具有相关性的图像序列中重建出高分辨率图像。超分辨率技术是图像处理中的一
自我国实施社会主义市场经济以来,我国市场与国际市场融合程度与日俱增,企业经营管理体系也愈发现代化。与此同时,许多“舶来”的企业管理制度在此过程中被引进,薪酬保密制度就是其中之一。所谓薪酬保密,就是一种禁止员工和其同事讨论各自劳动报酬的工作场所规则或薪酬管理制度。企业实施这一制度的根本目的在于,通过限制或阻断薪酬信息的传播以维护企业内部稳定和提高经济效益。然而,这项制度在为企业管理带来利好的同时,也
机器阅读理解(Machine Reading Comprehension,简称MRC)是一项针对给定文本和特定问题自动生成或抽取相应答案的问答任务,该任务是评估计算机系统对自然语言理解程度的重要任务之一。目前已有大量开源机器阅读理解数据集发布,且现有的阅读理解模型已在非推理类数据集(如:SQuAD,TriviaQA等)上取得了与人类可比甚至超越人类的性能表现。但在考验模型推理能力的数据集(如:Ho
随着互联网和多媒体设备的普及,图像已经成为信息承载和传播的主要媒介。通常,图像分辨率越高,图像质量就越好,也越能表现出更多的细节。目前的硬件设备和图像采集过程制约了部分场景下高分辨率(High Resolution,HR)图像的生成,从而影响了对这类图像处理的处理效果。因此,使用算法重建HR图像已经成为图像处理和计算机视觉领域的研究热点之一,最为基本的算法是单图像超分辨率(Single Image
随着生物医学领域的发展,相关文献资料呈现出指数级增长的趋势,如何快速高效地从大量生物医学文献中提取出有价值的信息和知识已成为一个亟待解决的问题。生物医学事件抽取任务是从生物医学文献中自动抽取出生物事件,并以结构化的形式表示出来。本文对生物医学事件抽取任务进行研究,主要内容包括:(1)基于流水线方式的生物医学事件抽取。本文使用先进的预训练语言模型实现了一个基于流水线的生物医学事件抽取框架。该框架将生
场景图生成任务是一项新兴的计算机视觉任务,生成图像内容的结构化表示,缩短图像处理和理解间的语义差距,具有广泛的应用前景。针对VG(Visual Genome)数据集失衡问题,论文从知识图谱(ConceptNet)中分别引入类别相关、局部结构和全局结构的外部信息提高生成场景图的质量。主要工作内容如下:(1)针对类别相关语义信息不足的场景图偏置问题,提出了外部信息引导和残差置乱的生成方法。该方法引入与
图像超分辨率重建目的是提高图像空间分辨率、改善视觉效果,具体包括一般重建技术和插值技术。现有算法可分为基于图像自身信息的算法和基于外部数据的学习算法,后者能够从外界获得先验信息,从而生成高质量的图像。本文围绕“混合模型”和“随机森林”两种学习类算法开展研究,并提出重建效果更佳的算法。图像中一般都会存在大量相似的局部结构。基于这一事实,学习类的重建算法将配对的高、低分辨率图像块作为输入,按照“先聚类