论文部分内容阅读
科学技术的进步推进着军事武器装备的快速更迭,同时自动化信息作战技术日趋成熟,标志着我国军队的高度信息化时代正式到来。在日常军事训练和行动中,形成了海量的作战信息,如何自动化抽取文本当中的装备实体事件结构化信息,是一个艰难且意义重大的问题。主流的方法是基于统计的机器学习方法,基于统计的机器学习方法较为成熟,但利用的特征不能很好体现语言语义的普遍规律,因此效果较差。基于深度学习的方法在语义上有所突破,在模型和效果上一直在进行尝试并取得的效果较好。本文提出的多维特征表示和层次化深度网络模型的军事装备实体事件抽取模型,有效提升了词表示在多种军事信息文本挖掘任务上的语义表示能力。本文提出的两阶段抽取模型:首先采用实例表示与双向长短期记忆网络模型识别出事件触发词;接着利用第一阶段输出状态、本地特征和前向传播全连接网络模型,识别事件元素。实验发现在融合词向量、句法分析结果、词性、局部特征向量、武器装备命名实体等特征,为军事信息领域的文本挖掘系统提供高质量的输入,能够有效的提升事件抽取的整体效果。综上所述,本文从语义和多维特征的角度出发,训练面向军事信息领域的语义生成模型,并将词向量用于基于循环神经网络的军事武器准备实体事件触发词抽取模型和事件元素抽取模型,取得了较好的关系抽取效果,在未来的工作中将针对军事信息中的事件抽取模型进行进一步改进。