基于深度学习的作物病虫害知识图谱问答系统的研究与应用

来源 :南京农业大学 | 被引量 : 0次 | 上传用户:xjwyx770729
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
作物生产对我国具有重要的意义,在实际生产环境中,病虫害问题对于作物产量和质量的影响很大。因此,建立作物病虫害知识库,分析影响作物生产的因素,对作物生产质量的提高,具有研究意义。知识图谱技术是一种能够以更接近人类认知世界形式表达信息的方式,可以更好的对作物病虫害领域信息进行表达,帮助我们理解、组织和查询相关信息。构建一个具有知识问答功能的作物病虫害知识图谱系统,分析农作物种植过程中农户遇到的病虫害问题,直接返回对应的答案,将很大程度上简化农民获取信息的复杂性,可为农民的作物生产提供重要的指导作用。本文研究了知识图谱关系抽取的方法,提出了基于注意力机制的Bi-LSTM作物病虫害关系抽取模型,促进了最终作物病虫害知识图谱的构建。问答系统的研究中,相似度计算问题是很重要的部分,它为系统理解用户提问起到关键作用,其准确率直接决定了系统的可靠性。本文引入了词向量和LSTM网络,该方法以词向量作为输入,构建句子相似度模型,并将该模型应用到知识图谱系统的知识问答模块中。本文从作物病虫害知识库构建与数据处理、关系抽取模型构建及实验分析、句子相似度模型构建及实验分析、领域知识图谱系统构建和功能实现三个方面展开研究和讨论,具体内容如下:(1)作物病虫害知识库构建与数据处理。主要基于Scrapy设计网络爬虫,本文采用的作物病虫害数据爬取自“国家农业科学数据共享中心”等专业农事网站。对获取的作物病虫害源数据进行预处理,对其中的数据实体进行人工分类、标注。最终生成作物病虫害数据集、标注的问答集及实体识别筛选出的实体集,其中所有问句划分为了 637类,关系种类预设为5类,最终获得关系总数13182条。(2)关系抽取模型构建及实验分析。为解决传统关系抽取方法的时间复杂性和低效率的问题,提出了基于注意力机制的Bi-LSTM作物病虫害关系抽取模型,包括输入层、嵌入层、网络层和分类层。注意力机制能够帮助模型关注文本中的重要部分,用以增加有效样本的权重。将CNN、RNN、LSTM、BI-LSTM等与本文提出的关系抽取模型进行了对比实验,本文模型综合F1值达到77.60%,相对于其他几种模型,平均提高了近7个百分点。(3)句子相似度模型构建及实验分析。构建了一个基于LSTM的句子相似度模型,包括输入层、嵌入层、LSTM层、全连接层和输出层。首先采集了大量作物病虫害的相关语料,在通用语料和病虫害语料结合的基础上训练了词向量。然后用得到的词向量模型对训练数据向量化后作为输入,训练句子相似度模型。通过调参以得到最好的相似度模型计算结果。对照两种基线方法进行了实验对比,最后从相似度计算值和准确率两个方面分析了结果。结果表明,本文中使用的基于词向量和LSTM的相似度计算方法优于其他两种基线方法,证明本文的研究模型在句子相似度计算上有更好的表现。(4)作物病虫害知识图谱系统功能实现。基于以上研究开发了面向农民及农业推广人员的病虫害知识图谱系统。系统使用Django框架进行了开发,使用Neo4j图数据库对作物病虫害领域的三元组关系进行了存储;在知识问答模块建立了问答库,使用MongoDB存储了三万余条领域问答对。实现的作物病虫害知识图谱系统具有实体识别、实体关系查询、知识概览、知识问答四个功能。最后针对本系统的知识问答模块,与两种领域内的问答系统做了对比实验,证明了该模块功能的实用性。
其他文献
蔗糖是大多数高等植物光合作用的主要产物,也是光合产物在植物体内长距离运输的主要糖类物质。叶片中合成的蔗糖需要通过装载到韧皮部再运输到其它库器官中,参与植物的生长发育及营养积累等生理代谢活动。植物叶片中光合产物装载主要有依赖胞间连丝的共质体运输和依赖SUT/Sweet蛋白的质外体主动运输这两种基本模式,蔗糖转运蛋白SUT基因在质外体主动运输中发挥着重要作用。木薯具有高光效,高产,高淀粉等特点,本研究
学位
冷鲜肉制作过程中,预冷工艺必不可少。在风循环冷却的条件下,宰后胴体的预冷品质除了受生猪品种及预冷工艺影响,更与预冷库内气流分布息息相关。不同于冷排管制冷模式,强制风冷循环预冷模式下,库内气流分布决定了温度与湿度的分布,因此流场优化尤为重要。本研究与苏食淮安食品加工物流中心进行合作,以三元杂交猪胴体[杜洛克父本×(长白父本×大白母本),DYL]为试材,在现有一段式风冷模式下,利用CFD仿真软件,以优
学位
二化螟 Chilo suppressalis(Walker)属鳞翅目螟蛾科(Lepidoptera:Pyraidae),是我国最严重的常发性害虫之一,在我国各大稻区均有分布,幼虫可以为害水稻、茭白、高粱等多种经济作物,给我国农业生产带来了严重威胁。化学防治一直是是缓解二化螟危害的主要防治手段之一,但是由于杀虫剂大量长期不合理使用,导致二化螟对多种药剂产生了抗药性,因此监测二化螟的抗药性发展情况,进
学位
随着信息技术日新月异,互联网、大数据和人工智能产业爆炸式增长,带动大数据处理和人工智能等相关技术的快速发展。近几年,深度学习技术在各领域应用不断深入,种类繁多的深度学习模型不断涌现并取得了卓越的成效。然而,深度学习模型并不具有普适性,同一深度学习模型在不同应用中成效往往大相径庭。因此,针对具体应用,如何选取性能最优的深度学习模型是一个亟需解决的问题。另一方面,由于应用领域的多样性和复杂性,缺乏标准
学位
作为世界上最大的草莓生产国,中国草莓产业现状表现为总体产量高但单位产出效益低,一个重要的原因是草莓生产管理与采摘依然是依靠人工,生产模式粗放,且近年来劳动力成本日趋高昂,随着时间的推移,这一短板逐渐凸显。草莓采摘周期短、强度大,实现草莓采摘的机械化、智能化,进而降低劳动力成本增加产出效益已成必然趋势,其中基于机器视觉的草莓检测与识别是草莓生产精准管理与智能化采摘的前提与关键技术。基于传统图像分割方
学位
快速准确地测量叶绿素含量不仅可以分析植物的营养状况,还可以判断植物对室内空气净化能力的强弱,因此快速获取植物体内叶绿素含量具有重要意义。以绿萝为研究对象,综合运用高光谱分析技术、图像分析技术、计算机科学等多学科知识,分别研究基于高光谱特征和图像特征(纹理特征与颜色特征)的绿萝叶片叶绿素SPAD值的检测模型,提出基于多特征融合的绿萝叶片叶绿素含量检测模型;在多特征融合的基础上,为了提高模型对叶绿素含
学位
淀粉分支酶(EC 2.4.1.18)属于糖苷水解酶13家族,作为一种糖基转移酶能够水解α-1,4糖苷键产生非还原性末端的糖链,再通过转移酶活性将游离糖链的C1端连接到邻近的葡萄糖单元的C6位置上,形成新的α-1,6糖苷键,从而改变淀粉的支链结构和分支化程度。通过改变淀粉的分支度影响淀粉的特性,使得淀粉分支酶成为一种重要的淀粉加工用酶。本论文对微枝形杆菌Microvirga sp.MC18来源的一种
学位
根据粮食作物生长状况的影响因素在空间上的自相关性和异质性,管理分区技术对一个管理区域进行多个子区域的划分,便于对这些不同的子区域实施不同的管理决策,从而合理化差异化的使用精准农作方案,最大化农业生产收益。在较大规模农业生产管理的多田块尺度范围内,使用由单一田块尺度范围划分的作业单元进行大面积变量精准投入难以实现,针对传统模糊C均值聚类未考虑指标权重问题及其产生的破碎不规则分区结果不适于机械作业的缺
学位
叶片是植物进行光合作用最重要的器官,其健康状况是保证梨树稳产、高产、优产的重要保障,直接影响到我国现代梨产业的可持续发展和经济效益。在梨的实际生长过程中,叶片病害,特别是炭疽病是导致梨树落叶进而影响梨产量的重要因素。由于炭疽病侵染叶片后形成的小黑点属于极小目标,难以被肉眼识别,很容易错过梨叶部病害的最佳防治时期。长期以来,许多科研学者需要采集大量的叶片,带回实验室进行人工检测和统计,不仅劳动量大、
学位
革兰氏阴性动植物病原细菌大多数致病效应子通过Ⅲ型分泌系统分泌到细菌细胞外,然后由病菌Ⅲ型转位子转移到寄主细胞内,进而发挥病理功能。植物病原黄单胞菌Xoo(Xanthomonas oryzae pv.oryzae)也不例外,通过Ⅲ型分泌系统分泌类似于转录激活子(transcription-activator-like effectors,TAL)和 non-TAL 两类效应子,non-TAL效应子也
学位