基于级联神经网络的对话状态追踪技术研究与实现

来源 :北京邮电大学 | 被引量 : 3次 | 上传用户:c543217896chenjia
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
人机对话旨在使人们可以使用自然语言与机器进行交互,以方便、快捷的方式获得自动信息服务。作为人机对话系统的重要组成部分,对话状态追踪(Dialog State Tracking,DST)表示和更新对话过程中的系统状态,是产生对话策略的基础,其更新正确与否直接关系到动作生成的性能,进而影响整个对话系统的性能。因此,为实现高质量的人机对话系统,对话状态追踪的研究具有重要意义。传统的DST在自然语言理解(Natural Language Understanding,NLU)结果的基础上进行,NLU的错误会在DST中扩散,因此近年来的DST研究直接基于词汇输入联合建模NLU和DST任务,并取得了不少进展,但也存在一些重要问题,其中数据稀疏和未知槽值是两个具有重要影响的问题。本文主要针对这两个问题,在综合分析已有相关研究现状的基础上,开展了一系列的工作,主要内容包括:针对数据稀疏问题,提出了一种级联神经网络(Cascaded Neural Network,CaNN)模型进行对话状态的更新,模型具有两层结构,底层采用长短期记忆(Long Short Term Memory,LSTM)网络或者卷积神经网络(Convolutional Neural Network,CNN)获得低维句子表示,上层采用LSTM在低维句子表示的基础上融合对话历史信息进行对话状态追踪。在公开数据集上的实验结果表明,多种组合方式的模型均取得了比现有模型更好的性能,在“joint”准确率上分别比现有最佳模型提升了2.3%、1.75%、4.5%、5.2%。模型获得的对话状态表示比其他的以词的n-gram为输入的模型所获得的对话状态表示具有更好的聚集紧密度,有效缓解了数据稀疏的问题。针对未知槽值问题,在CaNN模型基础上提出了两个模型:其一是带未知槽值检测器的级联神经网络(Cascaded Neural Network with Unknown Slot Value Detector,USVD-CaNN)模型,在CaNN模型的基础上结合了一个未知槽值分类器,模型采用拟样本进行分类器的训练,使模型能处理未知槽值问题。实验结果表明,所提出的USVD-CaNN 模型在 DSTC3(Dialog State Tracking Challenge)、DSTC2-food、WOZ-food(Wizard of Oz)数据集上分别提升了 6.1 1%、6.56%、13.27%,模型在保障已知槽值性能的基础上,能够有效地缓解对话状态追踪中的未知槽值问题,进而很大程度上提高了具有未知槽值问题的对话状态追踪的准确率,这说明提出的USVD-CaNN模型在处理具有未知槽值的对话状态追踪问题上的有效性。但是,为处理未知槽值问题,USVD-CaNN模型额外增加了未知槽值分类器,不够直接,拟样本减小了训练数据集的规模,对已知槽值的性能会产生影响,而且拟样本会受限于训练集的规模,不够灵活。其二是带未知类别的级联神经网络(Cascaded Neural Network with Unknown Class,UC-CaNN)模型,模型直接设计了未知槽值类,将发现未知槽值的功能集成在CaNN模型中,无需设计单独的未知槽值检测器。同时,利用共享上下文通过负采样的方法为已知槽值构造负样本,负样本与原训练集一起训练模型参数,使UC-CaNN模型具有的潜在发现未知槽值的能力被激发,进而能处理未知槽值问题。实验结果表明,UC-CaNN模型取得了很好的性能,在DSTC3、DSTC2-food、WOZ-food数据集上分别提升了 5.36%、5.29%、3.95%,特别是,模型所具有的处理未知槽值的能力很大程度上提高了对话状态追踪的准确率。与USVD-CaNN模型相比,该方法可以更为直接地缓解对话状态追踪中的未知槽值问题,模型计算上也更为简单。而且,通过对实验结果的分析,可以发现,负采样的方法对已知槽值的性能造成的影响更小,也更具灵活性。最后,将本文提出的对话状态追踪模型应用到了餐馆查询人机对话系统中,实现了面向餐馆查询的人机对话演示系统的对话状态追踪部分。通过对餐馆查询人机对话系统的功能演示,在实际应用中检验了本文提出的级联神经网络模型、带未知槽值检测器的级联神经网络模型、带未知类别的级联神经网络模型在任务型人机对话系统中应用的可行性。
其他文献
在高等教育快速发展的今天,特别是随着中国加入WTO和教育产业的国际化,高校要办好学,就必须在办学思想、队伍建设等方面采取有效措施。而人是创造价值的根本力量,留住人才,发挥出
【正】小儿癫痫病在临床上的表现多种多样,可为运动、感觉、意识、行为、自主神经等不同的功能障碍,或几种同时存在,是一组引大脑的神经元异常放电所引起的,以短暂性中枢神经
目的探讨个性化疼痛护理对缓解肛门术后的应用价值。方法抽取72例肛门手术患者分为两组,分别给予常规护理和个性化疼痛护理,比较两组护理效果。结果对照组护理满意度为75.0%
高等教育管理是公共管理的重要领域。质量是高等教育的生命线,而科学规范的管理制度是质量的重要保证。博士研究生教育是我国高等教育中的最高层次,博士学位论文水平的高低直
家庭溺爱、唯分数、唯成绩等论调以及学校教育力量的不足、社会不良风气的影响弱化了大学生的责任感,缺乏正确的自我定位使得学生丧失了增强责任心的动力,造成了大学生缺乏社
为探讨不同耕作方式对旱作玉米田土壤CO2排放量的影响,设置深松耕(DT)、翻耕(PT)和免耕(NT)3个处理,分析3种耕作方式下土壤CO2排放量的动态变化及其与土壤温度和土壤水分间的关系。
安徽省南陵县医院陈万起用针刺合谷穴配合自拟清宫场治疗急性盆腔炎18例,治愈率83.3%,总有效率94.4%。安徽省蚌埠市第三人民医院张丽君通过内服当归芍药散加味,配合中药敷脐治疗慢性
速调管具有高功率、高效率等优点,被广泛应用于雷达、卫星导航、通讯、线性或环形加速器等领域,并借助新型腔体结构和相关技术不断向更高功率、更高频段、宽带宽和小型化等方
职业教育为我国供应了海量的技能型人才,在社会热烈的竞争中,技工院校也逐渐增加与企业的合作。本文通过阐述技工院校实施校企合作的必要性以及合作中面临的困境,提出相应解
本文基于日本农业保险制度的发展历程,着重分析日本政府在政策性农业保险中发挥的作用,通过对日本农业保险制度立法、组织管理、产品创新与宣传推广等方面的做法进行分析,为