论文部分内容阅读
近年来,随着人工智能技术的飞速发展,基于自然语言的任务型对话研究得到了学术界乃至工业界的诸多关注。当前的客服对话主要以人工参与为主,因此如何提高智能客服的服务体验与落地可实施性是本文研究的重点。将自然语言对话研究加入到客服对话领域可以有效降低人力消耗,提高客服对话的效率。任务型对话主要的研究方向可分为检索式和生成式两种,检索式方法在限定领域内表现顺畅,生成式方法回复的内容更具创新性。由于深度学习方法可以有效提取语义特征和上下文的互信息,因此为本文提供了新的研究思路。本文主要是面向客服辅助领域的任务型对话研究,重点从以下三个方向进行研究:面向客服辅助领域的检索式对话研究。传统对话研究主要基于知识库检索和回复匹配,本文依次实现了WMD、BM25和SMN三种检索式对话模型。经实验对比发现,加入深度语义理解的SMN模型在准确率上接近40%,明显优于其他两者,由此表明深度学习方法有利于提取语义特征信息。面向客服辅助领域的生成式对话研究。循环神经网络具有记忆功能、参数共享等特性,且善于处理序列化的数据信息。本文实现了seq2seq的基线模型,并使用LSTM和Bi-LSTM改进模型编码,丰富语义信息表达;在此基础上引入注意力机制,提升模型的解码能力。改进后的实验模型最终达到68.3%的准确率,相比基线模型提升许多,这说明深度学习方法对于语义信息理解效果显著,但实验精度还有待提高。综上,将检索与生成相结合进行实验对话研究。本文将检索信息和检索信息的主题词分别加入到生成模型的编码和解码部分,用以丰富模型信息编码和改善模型解码结果,最优实验结果达到77.41%。为了增加对话模型的落地可行性,在此基础上又添加了任务式对话,与检索式对话和生成式对话基于一定的策略相结合,最后测试实验结果达到88.71%。最终,综合模型汇集了检索与生成的优点,且在对话的效率以及服务体验上都大幅提升,经试验证明,该方案更具落地的可实施性。