基于深度学习的人机对话中短文本意图识别

来源 :哈尔滨理工大学 | 被引量 : 2次 | 上传用户:LIUCHANGQI2003
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
自然语言理解是人机对话系统的核心组成部分,意图识别是实现自然语言理解的关键技术之一。随着人机对话系统的不断发展,越来越多的对话机器人产品走进人们的生活中,但是人机对话时人类多使用短句和省略词。这些短文本存在内容短、数据量大、表达不规范等特点,这些特点导致在意图识别时常面临文本噪声多、特征稀疏、一词多义、前后对话信息不独立等问题。为解决上述问题,本文首先针对人机对话中短文本向量化表示时不能表征一词多义以及语义缺失的问题,分别介绍了BERT模型和word2vec模型,以及两个模型向量的融合方法,提出了基于BERT和word2vec的联合模型的短文本向量化表示方法,实验表明融合后的向量化表示可以较大程度的提升分类模型的分类性能。其次针对人机对话的短文本包含多种意图且特征稀疏的问题,描述了CNN、LSTM意图识别模型,重点阐述了多头注意力机制对短文本序列进行权重分配的过程,提出了基于多头注意力机制和特征融合的多意图识别方法,实验结果对比表明该方法的识别效果更好。最后针对前后文对话信息不独立的问题,基于BLSTM模型,通过分析经常出现的两种不同的多轮对话情况分别描述了两个历史存储方法,并阐述了利用门函数筛选有用历史信息的方法,提出了基于BLSTM的多轮对话下的短文本意图识别方法,实验对比结果表明带有独立存储单元和门控函数的BLSTM模型的识别效果优于单纯的BLSTM模型和只带有存储单元的BLSTM模型。
其他文献
在我书桌的一个抽屉里,静静的躺着46封不同署名的书信,它们在那里已经有六年了,那是我教书生涯中学生给我的最珍贵的礼物,每当我对工作感到疲惫不堪,对所教学生感到灰心失望的时候
期刊
电压互感器的正常运行是变电站的准确用电计算、继电保护和自动装置正常运行的基本前提。文章以一实例:220kV变电站电压互感器反充电异常事故,探讨电压互感器反充电异常原因,并
<正>~~
期刊
边塞诗以其慷慨雄浑、大气豪迈的风格为人们所喜爱。古老的《诗经》记载了远古的边塞壮歌,开启了后世边塞诗歌发展繁荣的活水源头。透过《采薇》《无衣》《君子于役》这些诗
随着中国综合国力的不断提升,越来越多国家开始把目光转向中国,与中国的交流逐渐加深,这同时也引起了全球学习汉语的“热潮”。但在汉语学习中,汉字的识记始终既是重点也是难
文章首先阐述了“工匠精神”的含义,其次分析了培养学生“工匠精神”的要求,最后提出了中职建筑装饰专业学生“工匠精神”的培养途径,即发挥榜样的模范带头作用,丰富“工匠精
目的:了解艾滋病流行区农村居民和中学生对艾滋病相关知识和态度情况。试图通过中学生对农村居民进行艾滋病知识的辐射式传播,以致全民了解艾滋病,正视艾滋病。方法:选取安徽省南
工匠精神通常是指工匠在产品创作的过程中追求极致的精神。工匠通过不断打磨自己的作品,并创新工艺手法,力求使作品更加完美,使产品的质量得到大幅度提升。本文就中职建筑专
为探讨木薯块根淀粉含量不同的品种不同生育时期内源激素的变化,以‘华南124’和‘辐选01’2个块根淀粉含量不同的木薯品种为材料,分别对其不同生长发育时期的块根、茎杆及叶
就近几年的发展趋势来看,我们国家对于事业单位进行企业化的管理,采取绩效管理能够对事业单位中绩效不彰的情况产生一定的正面影响,然而因为非盈利的特点以及角色缺位,会导致