论文部分内容阅读
物流文本信息作为物流管理各个环节都会涉及的重要信息,对整个物流系统起着环节衔接的作用。随着现代物流电子化、智能化发展,物流行业中使用的文本数据信息快速增长,如何对海量的物流文本信息进行压缩,从海量的物流文本信息中挖掘出重要的信息,提升阅读效率、协助物流行业进行优化升级已成为当下研究的热点问题。本文以物流文本信息摘要生成方法为研究对象,将主题关键词作为文本结构框架对摘要生成过程起到主题引导作用,并结合Graph2Seq模型完成摘要生成任务,为了避免生成的摘要具有过多的冗余和重复信息,加入了输入输出序列注意力机制,使得最终生成的文本摘要贴近物流专业背景同时能够比较好的概括原文内容。研究中主要包含两点创新之处:提出一种基于图神经网络的关键词提取方法,并将其作为注意力机制融入基于Graph2Seq模型进行物流文本摘要生成。具体工作内容如下:(1)框架理论研究。研究关键词提取技术以及摘要生成方法相关理论,提出基于图神经网络的物流文本信息摘要生成方法模型框架。(2)主题关键词提取。利用图结构信息包含文本语义信息的基本优势,将文本向量化与抽象语义表示方法结合共同生成图结构数据,利用图神经网络对图结构数据中节点及边的特征进行聚合学习的特点,对文章内容进行学习,将学习得到的特征向量与TextRank算法结合,通过迭代计算,取topK个词作为文章主题关键词。(3)基于Graph2Seq模型的摘要生成模型。利用关键词提取阶段已经得到的图结构数据结合Graph2Seq模型图编码结构特点对本文摘要生成模型进行创新,通过Graph2Seq模型的节点嵌入和图嵌入过程得到编解码过程的中间向量,然后结合主题关键词和输入输出序列注意力机制,利用解码器生成文章摘要。本文通过实验分析,证明了结合主题关键词的基于Graph2Seq的生成模型在物流文本信息的摘要生成任务中,较现有方法的准确率有较大提升。