论文部分内容阅读
近年来,随着作战仿真技术的发展,利用作战仿真技术辅助开展指挥训练,极大地提升了人员训练的组织效率和训练效果。其中,基于VR/AR单兵穿戴设备、训练模拟器等装备进行虚实交互的模拟训练是开展人员训练的重要手段。语音交互是人机交互方式中的主要方式,也是支撑模拟训练的基础。模拟训练中的语音交互就是要通过语音命令实现计算机生成兵力(Computer-Generated Forces,CGF)与真实兵力的交互操作,以期能够共同完成合作、对抗等任务。针对战场中常见的单轮对话场景,实现CGF理解真实兵力发出的指令并做出应答,可以有效提高训练的逼真度。其技术难点在于判断CGF的回答是否正确,这需要通过计算两个句子的语义相似度来实现。在语义层次上衡量文本相似度的需求可以归结为语义匹配任务。语义匹配需要在语义层次上计算句子对的匹配程度,涉及到词的表示、句子表示以及句子对表示等诸多难点。传统方法大部分都是基于词法特征,完全通过手动抽取特定任务的语言特征来完成的,存在语言工具难以获得、句子特征抽取困难、可学习参数少、泛化能力差等诸多缺点。基于神经网络的深度学习方法,能够自动从原始数据中抽取特征,避免了传统方法的诸多缺点,可以有效处理语义匹配问题。本文基于深度学习的方法,提出了多颗粒度卷积神经网络,通过关注句子的局部信息,获得词汇、短语甚至句子上等不同颗粒度的语言特征,从而得到更加全面的句子表示。在此基础上,考虑到语义匹配应该融合句子对间的信息,而不是将句子分开建模,本文又提出了双向注意力机制。它一方面能够保留融合之前的每个句子语义特征最明显的部分,另一方面通过特征软对齐(Soft Alignment)的方式,将语义信息融合在一起,然后增强语义关联较强的词权重,降低语义关联较小的词的权重,生成具有语义关联的句子表示,完成句子对的建模。最后,本文将这两种方法结合起来,为语义匹配提供了新的解决方案。三个数据集上的实验结果表明,在MAP和MRR两种常用的衡量指标上,多颗粒度卷积神经网络相对于单层卷积神经网络平均提升8%;双向注意力机制相对于池化注意力机制平均提升7%;二者结合形成的基于双向注意力机制的多颗粒度卷积神经网络的语义匹配算法,相对于目前经典的语义匹配算法提升3%左右。这充分证明了本文算法的有效性,为后面的工程应用奠定了基础。