论文部分内容阅读
近年来,随着深度学习技术在文本挖掘各项任务中均取得较优的效果,对于装备知识图谱中的难点任务,可以尝试研究如何使用深度学习的基本理论对文本中蕴含的装备实体和关系进行表示和提取。针对传统的基于知识图谱当中存在大量的人工操作预处理、大量的特征工程、人工依赖较重,以及知识图谱严重依赖于句法解析等问题,本文研究基于深度神经网络的军事装备领域知识图谱构建技术,主要研究内容和创新点如下:提出了一种针对装备领域的多源数据采集方法。多源数据采集方法将数据从多个信息源中抽取、解析和转换,最后以统一格式表示和存储。本文从军事装备专业网站、搜索引擎以及维基百科网站进行数据采集,为接下来的分析和挖掘有价值的数据提供有力的数据支撑。提出了一种基于远程监督深度学习的军事装备实体关系抽取技术。本文使用神经网络和注意力机制相结合的方法进行装备实体关系抽取,利用远程监督实现大规模训练数据集的获取。采用远程监督的方法,避免了人工在构建数据集上花费的时间与精力,采用GRU模型克服了传统深度学习模型无法解决长距离依赖的问题,同时在句子层面上引入注意力机制,有效控制了冗杂数据给实验结果带来的影响。构建了一个装备知识图谱原型系统。本文构建的装备知识图谱原型系统主要作用于面向算法的测试人员和面向武器装备知识图谱的使用者,通过真实的数据采用相应的关系提取模型建立图谱。系统的主要功能包括:用户管理、数据概览、实体查询、关系查询和百科浏览。综上所述,本文聚焦军事装备领域知识图谱构建,研究了多源装备数据采集;利用深度神经网络的基本理论,重点研究了装备实体关系抽取技术;最后构建了一个较为实用的装备领域知识图谱原型系统,这些技术和成果对装备信息系统智能化、感知装备发展态势等工作具有一定的理论意义和应用价值。