【摘 要】
:
在日常口语对话中,人们常会使用代词来替代先前说过、但表述较为复杂的句子或短语,以使得语言表达简洁连贯,从而提高沟通的效率。然而,代词给日常交流带来便利的同时,也会引起语言理解的歧义,特别是一句话中存在多个指代关系时,对代词理解的细微偏差便会使句子的意思完全不同。基于神经网络的对话生成模型也受上述问题影响,口语中的代词给模型的语言理解造成了困扰,影响了模型回复生成的质量,这是对话技术性能提升的一大瓶
论文部分内容阅读
在日常口语对话中,人们常会使用代词来替代先前说过、但表述较为复杂的句子或短语,以使得语言表达简洁连贯,从而提高沟通的效率。然而,代词给日常交流带来便利的同时,也会引起语言理解的歧义,特别是一句话中存在多个指代关系时,对代词理解的细微偏差便会使句子的意思完全不同。基于神经网络的对话生成模型也受上述问题影响,口语中的代词给模型的语言理解造成了困扰,影响了模型回复生成的质量,这是对话技术性能提升的一大瓶颈。针对上述的问题,本文开展了利用共指消解技术辅助多轮对话生成的相关研究,即先利用共指消解技术抽取出对话中存在的共指簇,再利用共指簇消除对话中代词引起的歧义,提高模型对语言理解的准确度,进而提升模型生成回复的质量。本文开展的主要研究内容如下:(1)构建标注有指代信息的对话数据集,以改善训练数据稀缺问题。现有共指消解模型的训练通常使用篇章级文本,其特点是段落少、长度长、共指簇多,而对话数据轮数多、长度短、共指簇较少且多跨轮,所以使用现有的共指消解数据集训练适用于对话的模型适应性较差。我们在构建大规模多领域任务型对话数据集RiSAWOZ的同时,补充标注了对话文本中的共指簇信息,用于训练共指消解模型。同时为了便于标注,我们还开发了一套对话构造及标注平台。(2)使用共指簇恢复对话完整语义,以增强多轮对话生成。我们利用标注了指代信息的对话数据训练了一个共指消解模型,在每一轮对话生成前,都先利用共指消解模型识别出对话上下文中存在的共指簇,若本轮对话的问句中含有代词,则根据共指簇将问句中的代词替换为代词所指代的实体,恢复问句的完整语义,最后将其放入对话模型生成对话。此方法显式的利用共指簇消解代词,恢复语义,降低了对话生成模型的语言理解难度,同时,以预处理的形式增强对话模型,可操作性强。此方法在RiSAWOZ数据集上进行验证,在多个领域的数据上,较基线模型都能取得有效的性能提升。(3)将共指簇信息融入对话模型,以辅助多轮对话生成。尽管以预处理的形式恢复语句完整语义能有效提升对话生成的质量,但管道式结构易引入额外的错误,造成反效果。我们在利用共指消解模型抽取得到共指簇的基础上,提出一种隐式的方式消解代词。共指簇中的元素相互间存在指代关系,同时文本中的词也存在对应顺序关系,据此我们构建了词之间的关系图,再使用图卷积神经网络将图结构化编码,得到消解完代词的句向量表示,与对话生成模型中上下文编码得到的句向量融合,最后生成回复。此方法在多个领域数据上进行了验证,其效果较基线模型和语义恢复方法都取得了显著的提升。
其他文献
以铜基氧化物超导体为代表的高温超导材料,在液氮温度下将呈现特殊的超导性。使用铜基氧化物超导带材制作的高温超导超导线圈,具备无电阻、高载流、低重量等优势,因此在强磁体、限流器、储能、电机等领域得到广泛应用。由于超导线圈处于“力-电-磁”的复杂工作环境,需要对其机械性能、交流损耗、失超等进行研究。为此,本文综述和分析了高温超导线圈的研究和应用进展。
在当前信息爆炸的时代,网络上产生了大量的新闻、商品、音乐和视频等内容。推荐系统能够从海量数据中挖掘有用的信息,在我们的日常生活中起着越来越重要的作用。序列推荐作为推荐系统的一个重要分支,试图捕捉用户的动态偏好,已经吸引了学术界和工业界众多人的目光,具有举足轻重的地位。近年来,变分推断思想在各个研究领域取得了巨大的进展,在推荐领域同样显示了良好的作用。由于其贝叶斯性质,我们可以学习到用户和项目的复杂
现行法规范明确了律师协会依据法律、法规、规章授权实施的行政行为具有可诉性,律师协会在特定情形下具备行政诉讼被告资格是毫无疑义的,实际上真正需要解决的问题是具体哪些管理行为具有行政诉讼可诉性。律师协会同时拥有行业自治管理权和授权性行政管理权,在当前二者之间并无明确界分标准的情况下,律师协会管理权可能会被滥用或因使用不当而侵犯管理相对人的权益。由于欠缺界分律协管理行为可诉与否的科学标准,司法实践中对律
目的:收集就诊于苏州大学附属儿童医院的脑性瘫痪(cerebral palsy,CP)患儿的临床资料,探讨CP发病的危险因素,分析痉挛型CP患儿的独走能力。采集就诊于苏州大学附属儿童医院的痉挛型偏瘫患儿的步态参数,粗大运动功能分级系统(gross motor function classification system,GMFCS)分级 Ⅰ 级-Ⅲ 级,针对这一群体进行康复训练,并在训练前后进行康复
无人机作为空中战场的新兴力量,具有低成本、高效、无人员伤亡风险等优点,在侦察、监视、电子战等任务中表现出良好的性能和适用性。在未来的空中作战场景中,通过已经获取到的战场信息和敌方的历史航迹信息等进行分析处理,基于上述信息对敌方的意图以及未来航迹等信息进行合理预测,丰富辅助决策要素,进而获取战场的主动权。本文展开的主要研究内容如下:(1)对空战场景下的矩阵博弈问题进行描述与建模,通过列举空战对抗双方
随着互联网和智能移动设备的应用和普及,基于位置的社交网络为人们搭建了现实世界与虚拟世界的桥梁,极大地便利了人们的生活。然而,数据量的爆炸式增长也为用户带来了信息过载的问题。因此,下一个兴趣点推荐已经在基于位置的社交网络中成为必不可少的一部分,其旨在为用户推荐在不久的将来可能会访问的下一个兴趣点。近年来,自注意力网络在各种序列任务中取得了优秀的性能和效率。然而,现有的一些基于自注意力网络的工作都没有
目的:回顾性收集胎龄<32周的早产儿临床资料,探讨早产儿支气管肺发育不良(bronchopulmonary dysplasia,BPD)的临床特点。并分析患儿出生24小时内、生后72小时、7天、14天、21天、28天的血常规衍生炎症指标,了解上述指标对BPD的预测作用,以期指导临床防治BPD,改善疾病预后。方法:将2015年01月至2020年12月出生并于生后24小时内转入我院新生儿重症监护病房(
事件时序关系识别任务是关系抽取任务的一个重要分支,旨在识别两个事件之间发生时间的先后顺序。由于其对多个自然语言处理任务具有良好的辅助作用,近年来得到了越来越多的关注。本文主要针对英文事件时序关系识别展开研究,研究内容包括以下三个方面:(1)基于信息交互增强的事件时序关系识别方法目前,已有的神经网络方法对于事件间信息交互的考虑相对缺乏。针对上述问题,本文提出一种通过参数共享增强事件间信息交互的方法。
抽象语义表示(Abstract Meaning Representation,AMR)是一种新型的基于句子级的语义表示方法,形式上是一种单根有向无环图。AMR文本生成(AMR-to-Text Generation)技术则是自然语言生成领域的前沿研究任务之一,旨在给定AMR图,生成相同语义表示的自然语言文本。目前相关研究通常使用序列到序列的方法,如将AMR图进行序列化。然而,对结构化数据进行序列化势
贵州酱酒热受到了社会大众和学界高度关注。如何助力贵州酱酒从“酱酒热”转变为“品牌热”是一个重要的研究课题。为此,文章基于赋能理论,从短视频平台赋能中的结构赋能和平台资源赋能两个维度进行探究,创新提出短视频平台赋能贵州中低端酱酒品牌价值提升的6种路径。