基于深度学习的领域知识图谱构建关键技术研究

来源 :长江大学 | 被引量 : 0次 | 上传用户:liongliong519
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在中国,大豆的种植和生长过程中会受到多达30多种疾病和大约100种害虫的威胁,造成重大经济损失。大豆病虫害防治专业知识大多存在于专业书籍和科技论文等文献资源中,实际田间作业时,农民无法便利地获得最新的专业知识,信息利用效率低。如何利用计算机技术,辅助农民实时获取相关信息,成为日益突出的需求。针对上述信息鸿沟问题,本文提出用自然语言处理技术,自动从领域文献资源中提取专业知识,对其进行清洗、梳理、整合,构建领域知识图谱,并以此为基础,提供面向田间作业的知识检索服务。主要内容归纳如下:(1)信息来源筛选及标注数据集。针对领域数据集缺乏的问题,本文选择《大豆病虫害原色图谱》一书作为数据来源自建实体及关系数据集。参照前人研究和书中表述,将大豆相关实体之间的关系分为5大类,分别是为害部位、发病症状、防治手段、形态特征和其他,并参照面向开放领域的基准数据集的标注格式对本文自建数据集进行人工标注。(2)领域实体关系抽取方法研究。本研究分别以管道结构和联合学习结构为基础架构,实现了两种关系抽取模型,并以开放领域基准数据集和领域数据集为基础进行了对比分析、消融实验。以管道结构为基础,实现了基于CNN、PCNN、BERT的关系抽取模型。实验结果表明,在大豆病虫害领域文本上,BERT模型的效果优于CNN和PCNN,F1值达到0.9849。以联合学习结构为基础,对实体识别和关系识别任务统一建模,利用两个任务间的关联信息减少错误累积,实现了SPNet关系抽取模型。然而,领域知识中的数据稀疏特性严重影响了联合关系抽取模型的性能。针对数据稀疏问题,引入数据增强方法,有效提升了联合实体关系抽取模型的准确性。比较两类学习结构和模型,管道结构模型可用于构建初始知识图谱,能准确识别已标注实体间的实体关系,而联合学习结构可同时识别实体和关系,可用于拓展知识图谱,但需要注意数据稀疏性的负面影响。(3)领域知识图谱构建方法研究。在关系抽取任务基础上,使用Neo4j知识图谱构建工具搭建领域知识图谱,使用Cypher语言处理数据并搭建领域知识图谱,并搭建基于Web的知识图谱检索服务。本课题以大豆病虫害为样本领域,研究领域知识图谱的构建方法及关键问题。以深度学习为技术框架,在调研现有基准数据集、主流方法和模型的基础上,研究了面向领域文本的实体关系抽取和面向知识图谱的实体关系存储、表示和检索等知识图谱构建过程中的关键问题,实现了动态、个性化的大豆病虫害防治知识检索,强化理论知识和田间的衔接,高效助力实现精准农业。
其他文献
学位
学位
学位
学位
伯克级驱逐舰作为美国主力舰艇,主要承担防空反导任务。基于伯克级FlightⅡA型驱逐舰的防空反导系统的构成,对各装备的性能和特点进行分析,发现伯克级驱逐舰的弱点;并针对其弱点,研究了反舰导弹突防的技术和战术方面的对策,为战时对抗提供了更优方案,也对实战中提升战斗力具有借鉴意义。
期刊
学位
军事术语是军事领域的专业用语,是军人的规范化、标准化语言,规范和统一使用军事术语,是统一军队认知的基本要求、协调部队行动的基本保证。随着军事技术及其理论的不断发展,新军事概念及其指称形式层出不穷,对这些新概念新指称的术语化、规范化工作亟待更新,对创新型军语管理技术与方法的需求十分迫切。由于军事领域术语词汇更新不及时、规范化程度不够高、技术方法落后等原因,导致军事术语应用中语义指代不一致、军事相关文
学位
随着网络互联的发展,互联网上的数据呈指数型增长,大多数信息被存储成二维表格的形式。知识图谱可以有效的对这些二维表数据实行组织、存储和表示。知识图谱由大量的实体和关系组成,具有很强的语义表达、数据建模能力,被广泛的应用在自动问答、搜索引擎、个性化推荐等各个领域。然而,当前基于二维表格数据的知识图谱构建和融合仍存在一些问题。通常情况下,只有具有相似属性的数据集才能被融合。此外,在构建知识图谱时,可能会
学位
局部放电在线监测作为一种有效的高压电缆线路状态监测手段已在电力系统中广泛应用。但该种监测装置的制造企业众多,性能与效用分散性大,至今国内外尚无有效性测评和专项功能综合评估方法。面向DL/T 2271《高压电缆局部放电在线监测系统技术规范》规定的7个专项功能及要求。为此提出一种高压电缆高频法局部放电在线监测装置有效性测评方法,建立现场有效性测评和综合评估方案,在运行现场实际测评了8类不同型号监测装置
期刊
目的 研究人多能干细胞分化的平滑肌细胞(human pluripotent stem cell-derived smooth muscle cells, hiPSC-SMC)促进糖尿病裸鼠创面愈合的能力。方法 将hiPSC-SMC、阳性对照脂肪来源干细胞(adipose-derived stem cells, ADSC)和阴性对照不含细胞的磷酸盐缓冲盐水(PBS)分别加入I型鼠尾胶原蛋白中制成干细
期刊