论文部分内容阅读
随着“互联网+煤矿”智慧矿山建设进程的不断深入,用户可以在互联网站点搜索海量煤矿安全数据,获取煤矿安全相关知识,及时捕捉煤矿行业发展动态。但这类数据规模较大、异构多元、组织结构松散,用户难以迅速甄别有效信息,导致数据利用率低下,煤矿安全知识管理较为混乱。一个能够整合、梳理及存储煤矿安全信息的知识库显得尤为重要。因此选用知识图谱作为知识管理手段,将煤矿安全知识转换为一张精确度高、覆盖范围广、逻辑清晰的图谱,简化人工筛选数据流程,切实提高煤矿安全生产水平。本文主要围绕煤矿安全融合知识图谱构建展开研究,提出煤矿安全概念知识库半自动化构建方法,同时设计煤矿灾害事件库自动化构建流程,并将事件知识库存放有序、层次分明的内化到概念知识库,为煤矿安全融合知识图谱构建作出了初步探索。本文主要工作如下:1)煤矿安全概念知识库半自动化构建。首先提取文本的关键实体,构建关键实体库,提出基于优化词图的多特征TextRank关键词提取算法,改进传统TextRank算法仅依靠词共现统计特性构建词图权重矩阵的缺陷,融入文本语义及结构信息。然后对实体库进行聚类分析,形成大致知识体系,提出基于改进DBSCAN算法完成实体聚类,优化传统DBSCAN算法难以初始化参数Eps和MinPts的缺陷。最后结合专家知识设计实体间逻辑关系,半自动构建煤矿安全概念知识库,并在各知识根类中添加相应的事件节点,为后续事件库的融入奠定基础。2)煤矿灾害事件库自动化构建。结合煤矿灾害场景,提出一种新的灾害事件库构建方法。首先基于高速迭代空洞卷积神经网络(HIDCNN)完成事件检测,检测文本是否属于事件文本及其相应的事件类别。然后结合使用基于复合标签的命名实体识别算法(DMHSA-CRF)和依存句法分析,设计要素提取模板,完成事件文本灾害要素的提取任务,构建灾害事件库。最后将灾害事件库添加到煤矿概念知识库相应的事件节点,自动构建煤矿安全融合知识图谱,并按照预先设计的存储策略存储到Neo4j图数据库。该论文有图47幅,表29个,参考文献78篇。