论文部分内容阅读
随着科学技术的进步,人们的生活变得更加便利,以前必须通过人人交互才能获得的信息与服务,逐渐地发展为通过各种智能终端进行人机自然交互就能获得,比如客户服务系统、酒店预订系统、问答系统等等。这些服务得以实现的核心是人机对话系统,自然语言理解模块作为人机对话系统中的重要一部分,近年取得了大量重要的研究成果。随着人们对信息查询需求的复杂化,传统的面向单一任务或者面向单一领域的人机对话系统已经不能很好地满足实际需求。因此,跨领域人机对话系统的研究具有较强的理论意义及应用价值。本文研究一种跨领域对话理解技术,以支持和实现跨领域人机对话系统。具体地,以基于双向长短期记忆网络(Bi-LSTM,Bidirectional Long Short-Term Memory)的对话理解技术为基础,重点研究了基于最大均值差异(MMD,Maximum Mean Discrepancy)的跨领域对话理解模型,及基于对抗神经网络(ANN,Adversarial Neural Network)的跨领域对话理解模型,最终实现对多领域人机对话理解中的槽填充任务。本文提出的方法比基线模型在半监督任务上,F1值提升了从0.0015到0.0304;在无监督任务上,F1值提升了 0.003。论文工作具体包含以下四方面:1.提出一种基于Bi-LSTM的对话理解技术,将槽填充任务转换为一种序列标注任务,构成后续研究的基础;2.提出一种基于最大均值差异的跨领域对话理解模型,模型通过融合最小化最大均值差异损失,提取领域不变性特征,实现源领域到目标领域的迁移学习;3.提出一种基于对抗神经网络的跨领域对话理解模型,模型通过一个领域判别器来提取领域不变性特征,实现源领域到目标领域的迁移学习;4.基于上述技术,设计并实现了一个跨领域人机对话理解模块,支撑跨领域人机对话系统的研究与开发。