论文部分内容阅读
对话系统目前已经成为人机交互最常见的方式之一,相较于其他的交互方式对话具有更加自然和便捷的优势。对话系统能够和人用最简单的语言进行沟通,不需要用户具备任何专业知识。并且对话的形式能够让用户解放双手,因此几乎适用于任何场景,同时由于语言是人类进行交流的最基本方式,也使得具备对话功能的系统在使用中显得更加友好。目前对话系统已经应用于例如智能音箱、语音助手、智能客服、虚拟人物等领域。因此,一个具备优秀语义理解能力和大量知识的对话系统有着广阔的发展前景。经过学术界数十年的研究,对话技术已经有了巨大的发展,在商业领域也已经取得了广泛地应用。现有的对话系统在语义理解、人格一致性、融合知识甚至模型本身都还存在大量不足,这些不足也是我们探索此领域的动力。目前,对话系统在商业应用时会采用大量工程化的手段解决上述问题,而学术界期望采用更低成本更加智能的方法使现有对话系统更加智能和易用。所以利用强化学习和深度学习技术让对话系统智能化是一个非常有挑战性又亟待解决的方向。本文不仅利用深度学习技术改进对话系统,也尝试研究如何利用强化学习提升对话效果。本工作针对对话系统的一致性、模型结构、语义理解和知识融合四个方面开展研究,主要工作和创新点如下:(1)为了解决开放域对话中神经网络生成的回复缺乏人格一致性的问题,本文提出了一个融合注意力检索机制的对话模型。模型利用注意力检索机制从外部设定的人物背景信息表中获取合适的信息;为了进一步提高模型检索正确信息的效果,本工作采用一种两阶段的训练方法,利用普通对话数据进行模型预训练,再利用包含人物信息的对话数据对模型进行微调。在微博语料上的实验结果表明,提出的模型相较于其他生成模型,生成的回复中包含人物信息的准确率有较大的提高。(2)针对生成模型的暴露误差(exposure bias)问题以及生成词语时存在“短视”的问题,本文提出了一种融合继承特征的神经网络生成模型。模型包含两个部分,一个是可以输出词语概率分布的序列生成网络,另一个是可以预测未来整句回报的评价网络。其中,评价网络利用深度继承特征能够评估当前生成的词语对整句话的影响,因此该模型不仅能够像其他生成模型一样考虑当前词语的最优解,还能考虑未来生成整句的最优解。通过在德语到英语和英语到越南语的翻译任务上进行实验,证明了所提出模型相比基线模型在BLEU得分以及鲁棒性上都有较大提高。(3)针对意图识别(Intent Detection,ID)和槽值提取(Slot Filling,SF)联合模型共享语义信息不够充分以及需要手工设置权重参数的问题,本文提出了一个具有长度可变注意力机制的语义理解模型。首先设计了一种新的标签方案将两个任务统一为一个序列标注任务。然后,提出了一个长度可变的注意力机制,它可以选择性地提取序列标注模型中源句子的子集参与注意力向量的计算,从而能够节约计算资源并提高模型的准确率。在ATIS和DSCT5数据集上的实验结果表明,所提出的模型在识别和提取的准确率方面优于其他对比模型。说明此方法能够自动找到两个任务之间的平衡,获得更好的整体性能。(4)为了将知识图谱融合进对话过程当中,让背景知识参与回复生成的过程,本文提出了一种结合强化学习方法和Transformer网络的对话模型。该模型分为两个部分,知识决策和回复生成。其中知识决策部分的作用是利用强化学习的决策能力从图谱中选择知识;回复生成部分的作用是利用决策出来的背景知识结合上下文和输入语句生成流畅且信息丰富的回复。本工作将模型应用于需要进行话题引导的聊天对话任务中,实验结果表明提出的模型在选择合适背景知识的准确率以及BELU指标上都有较大提高。