基于深度学习的单轮对话语义匹配方法研究

来源 :国防科技大学 | 被引量 : 0次 | 上传用户:chengbj0310
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,随着作战仿真技术的发展,利用作战仿真技术辅助开展指挥训练,极大地提升了人员训练的组织效率和训练效果。其中,基于VR/AR单兵穿戴设备、训练模拟器等装备进行虚实交互的模拟训练是开展人员训练的重要手段。语音交互是人机交互方式中的主要方式,也是支撑模拟训练的基础。模拟训练中的语音交互就是要通过语音命令实现计算机生成兵力(Computer-Generated Forces,CGF)与真实兵力的交互操作,以期能够共同完成合作、对抗等任务。针对战场中常见的单轮对话场景,实现CGF理解真实兵力发出的指令并做出应答,可以有效提高训练的逼真度。其技术难点在于判断CGF的回答是否正确,这需要通过计算两个句子的语义相似度来实现。在语义层次上衡量文本相似度的需求可以归结为语义匹配任务。语义匹配需要在语义层次上计算句子对的匹配程度,涉及到词的表示、句子表示以及句子对表示等诸多难点。传统方法大部分都是基于词法特征,完全通过手动抽取特定任务的语言特征来完成的,存在语言工具难以获得、句子特征抽取困难、可学习参数少、泛化能力差等诸多缺点。基于神经网络的深度学习方法,能够自动从原始数据中抽取特征,避免了传统方法的诸多缺点,可以有效处理语义匹配问题。本文基于深度学习的方法,提出了多颗粒度卷积神经网络,通过关注句子的局部信息,获得词汇、短语甚至句子上等不同颗粒度的语言特征,从而得到更加全面的句子表示。在此基础上,考虑到语义匹配应该融合句子对间的信息,而不是将句子分开建模,本文又提出了双向注意力机制。它一方面能够保留融合之前的每个句子语义特征最明显的部分,另一方面通过特征软对齐(Soft Alignment)的方式,将语义信息融合在一起,然后增强语义关联较强的词权重,降低语义关联较小的词的权重,生成具有语义关联的句子表示,完成句子对的建模。最后,本文将这两种方法结合起来,为语义匹配提供了新的解决方案。三个数据集上的实验结果表明,在MAP和MRR两种常用的衡量指标上,多颗粒度卷积神经网络相对于单层卷积神经网络平均提升8%;双向注意力机制相对于池化注意力机制平均提升7%;二者结合形成的基于双向注意力机制的多颗粒度卷积神经网络的语义匹配算法,相对于目前经典的语义匹配算法提升3%左右。这充分证明了本文算法的有效性,为后面的工程应用奠定了基础。
其他文献
视觉SLAM已广泛应用在仓储物流、AR/VR、无人机、自动驾驶等领域,目前已有的视觉SLAM方法多是假设物体静止,或是将场景中的动态特征当作异常值剔除。本文针对实际环境中动态
随着大数据时代的到来,云存储很好的解决了数据存储与共享问题,但存储在云中的数据频繁遭到黑客攻击,泄露数据的机密性与隐私性.为此,可搜索加密概念的提出实现了在不解密密
随着互联网信息时代的发展以及电脑和手机的普及,人们可以随时随地把生活或者娱乐图像上传到网络中,导致图像呈现出爆炸式增长。因此,如何从大量图像中准确筛选出目标图像已
随着市场竞争逐步加剧,现代企业所处的市场环境发生了深刻的变革,企业竞争越来越强调基于客户需求的竞争,为适应市场需求,满足客户的个性化定制,半导体等制造业中大都采用多
人脸表情作为一种传达情绪状态和意图的主要形式,在人际关系中提供了重要的非语言交际线索。随着人工智能和机器学习等技术的兴起,现有的人机交互方式已经无法满足人类的需求
信息技术的发展对带宽更大、速度更快、精度更高的模数转换器(Analog-toDigital Convertor,ADC)提出了更高的要求,为了解决传统电子ADC采样率难以实现进一步提升的难题,光学A
随着太赫兹(THz)波在安全检查、生物医学、无线通讯等领域的广泛应用,高功率、高能量的THz辐射源的应用需求也大大提高。基于受激电磁耦子散射产生THz波具有高功率、宽调谐、
室内人体感知技术在人员检测、室内定位、运动分析和安防检测等领域有着广泛的应用。由于无源检测的普适性和低成本,利用商用无线信号(Wireless Fidelity,Wi-Fi)进行人员检测
在北方的严寒地区的钢筋混凝土建筑物受到气候、温度的影响时常会遭受冻融所带来的损伤,最终会发生冻融破坏,此外,钢筋结构在潮湿的气候当中也会发生锈蚀,这将对结构安全稳定
随着互联网技术以及移动终端设备的不断发展,图像资源成几何倍数与日俱增,庞大的图像资源对当前的图像识别分类等计算机视觉技术提出了迫切的要求。很长一段时间,图像识别主