论文部分内容阅读
随着人工智能的迅速发展,理解人类语言并能够与人类对话,给出相应的信息反馈的机器人成为了大多数人的需求。在这样的背景下,智能聊天机器人慢慢走入人们的视野。在这股机器人热潮中,能够帮助用户解决日常生活中各种事情的私人助理机器人应运而生。它能够帮助用户解决一系列生活中遇到的问题,如打车、预定餐厅等。与机器人对话的最大挑战就是要把人的自然语言翻译成机器可以听得懂的指令,从而给出相应的正确反馈。机器人能够给出正确反馈的第一步是理解人类需求,所以将用户输入理解为正确的主题,即对话系统中的主题分配起着非常重要的作用。本文的研究任务是将用户的输入分配到这个语句对应的主题下,以保证接下来的反馈方向正确。本文主要介绍了三种主题分配的方法:基于传统分类方法的主题分配模型、基于LDA主题模型特征扩展的主题分配方法以及基于深度学习的对话系统主题分配模型。基于传统分类方法的主题分配模型可以看做是文本分类任务,本文利用有监督学习的方法,在学习的过程中利用学习算法从训练语料中以特征的方式学习有用信息,从而得到主题分配的模型。该方法的效果高度依赖于人工选择的特征。基于LDA主题模型特征扩展的短文本分类方法考虑到了短文本词语稀疏性的特点,加入了扩展词后,主题特征被加入到了原来的短文本中,以达到语义扩展的效果,避免了短文本传统的文本表示方法特征稀疏的问题。实验表明,引入LDA主题词扩展特征后,主题分配模型取得了更好的效果。深度学习方法的避免了人工选取特征对实验结果的影响,使机器自动学习文本中的特征,增加了文本中隐藏的词与词之间的语义联系。本文利用基于卷积神经网络的句子分类方法以及基于循环神经网络的的方法作为主题分配的模型进行实验,实验结果表明基于深度学习的主题分配模型相比于传统方法取得了更好的效果。