基于深度学习的对话系统主题分配技术研究

来源 :哈尔滨工业大学 | 被引量 : 0次 | 上传用户:wangrong2000
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着人工智能的迅速发展,理解人类语言并能够与人类对话,给出相应的信息反馈的机器人成为了大多数人的需求。在这样的背景下,智能聊天机器人慢慢走入人们的视野。在这股机器人热潮中,能够帮助用户解决日常生活中各种事情的私人助理机器人应运而生。它能够帮助用户解决一系列生活中遇到的问题,如打车、预定餐厅等。与机器人对话的最大挑战就是要把人的自然语言翻译成机器可以听得懂的指令,从而给出相应的正确反馈。机器人能够给出正确反馈的第一步是理解人类需求,所以将用户输入理解为正确的主题,即对话系统中的主题分配起着非常重要的作用。本文的研究任务是将用户的输入分配到这个语句对应的主题下,以保证接下来的反馈方向正确。本文主要介绍了三种主题分配的方法:基于传统分类方法的主题分配模型、基于LDA主题模型特征扩展的主题分配方法以及基于深度学习的对话系统主题分配模型。基于传统分类方法的主题分配模型可以看做是文本分类任务,本文利用有监督学习的方法,在学习的过程中利用学习算法从训练语料中以特征的方式学习有用信息,从而得到主题分配的模型。该方法的效果高度依赖于人工选择的特征。基于LDA主题模型特征扩展的短文本分类方法考虑到了短文本词语稀疏性的特点,加入了扩展词后,主题特征被加入到了原来的短文本中,以达到语义扩展的效果,避免了短文本传统的文本表示方法特征稀疏的问题。实验表明,引入LDA主题词扩展特征后,主题分配模型取得了更好的效果。深度学习方法的避免了人工选取特征对实验结果的影响,使机器自动学习文本中的特征,增加了文本中隐藏的词与词之间的语义联系。本文利用基于卷积神经网络的句子分类方法以及基于循环神经网络的的方法作为主题分配的模型进行实验,实验结果表明基于深度学习的主题分配模型相比于传统方法取得了更好的效果。
其他文献
Web服务是一种基于互联网的开发和访问模型,允许用户使用服务提供商在网络上发布的服务,集成到自己的应用程序中。可以从根本上解决跨组织、跨企业的异构系统之间互操作和互
光纤布喇格光栅传感器走过了制作发明、原理性研究、实验性测试等阶段,现在已在桥梁隧道大坝、化工、电力、大型机械装置等领域得到广泛应用,工程化应用也发展到一定程度。光
近些年来,论坛、博客和微博等相继出现在互联网应用中,并逐渐成为人们发布互联网信息的主要方式。其中,论坛已成为信息发布、共享和传播的重要平台。论坛的内容由普通用户创
随着科技的不断发展,无线通信已经成为通信技术未来的发展趋势。而作为无线通信的一个分支,移动自组网Ad Hoc因其无需基础设施便可迅速组网,具有搭建迅速、组网灵活、抗毁性
在软件系统的开发过程中通常会产生了大量结构复杂、语义丰富的数据,而建立个灵活的语义模型是对各类软件工程数据进行统一管理的基础。在管理大量软件工程数据的过程中,如何
随着信息技术和网络的普遍应用,如何更好地保障信息的安全已引起研究人员的广泛关注。信息的安全保密,通常采用的是加密的方式,而加密技术的核心是密钥的保密。秘密共享就是
面向方面编程范式通过引入方面实现横切关注点的分离和封装,很好的解决了代码纠结和代码分散等面向对象程序所面临的难题,使系统易于实现和扩展,同时提升了软件的模块性和可
近年来,随着城市化进程的迅速发展,“数字城市”的建设应运而生。在“数字城市”建设的过程中,是以“数字社区”的建设为基础的,而创建“数字社区”的关键是通过三维建模技术
近年来,计算机视觉技术在农产品检测方面得到了广泛的应用,使得现代农业更具规模性和专业化。本文所研究的内容是柑橘图像分割的具体算法设计。它是课题“柑橘表面破损自动检
在计算机图形学领域,人们逐渐利用计算机来再现周围的真实世界,自然现象的建模和渲染是近几十年来计算机虚拟现实与系统仿真的一个重要研究领域,基于物理模型的流体模拟近年