论文部分内容阅读
在众多的信息交互任务中,智能问答系统已成为各类系统中最重要的部分之一,准确地理解客户提出的自然问题是问答系统的关键所在。传统的文本语义处理方法无法准确理解词语上下文语境,且会忽略词与词之间的联系,仅通过统计的方式判断并提取文本中的关键特征词汇,易导致文本处理的效果不佳。本文针对问答系统中自然语言文本长度较短、样本种类受限制以及不能充分捕捉句子语义结构特征等问题,研究了一种基于深度学习的文本语义相似度匹配方法。将FastText模型和改进的双向LSTM(Bidirectional Long Short-Term Memory,长短期记忆网络)相结合,构建了FT-DP-LSTM相似度匹配模型。该模型利用Fast Text模型快速文本分类高效率训练的特点,训练出包含文本语义信息的词向量并作为整个模型的输入,通过在双向LSTM网络中增加peephole connection结构,使其网络中的遗忘门层和输入门层之间会接受当前输入与前一时刻输入,也会接受该时刻细胞状态的输入,从而达到充分的利用词语上下文信息,整体上捕捉句子的长依赖关系目的,最终获取到文本的关键语义信息并进行相似度匹配工作,并通过建立训练、测试数据集对模型进行实验验证。算法有效地提高了相似度匹配的准确率。本文最后设计并实现了基于航空公司的问答系统,将提出的语义相似度匹配模型应用于该系统,设计了自动应答系统与人工处理相结合的智能应答策略,用于回答客户提出的自然语言问题。