【摘 要】
:
农业病虫害一直是影响我国农业丰收和粮食安全的重要因素。随着我国农业信息化的发展,各类农技服务网站在向农民提供服务的过程中产生了大量病虫害介绍和防治相关的文本数据,其中包含了广大农民遇到的各类生产问题和经验办法,对这些数据进行挖掘和利用具有很高的应用价值。本文以番茄病虫害领域为例开展知识抽取研究,主要包含语料库构建、实体识别和关系抽取等内容,具体工作如下:(1)番茄病虫害领域的语料库构建。首先以期刊
论文部分内容阅读
农业病虫害一直是影响我国农业丰收和粮食安全的重要因素。随着我国农业信息化的发展,各类农技服务网站在向农民提供服务的过程中产生了大量病虫害介绍和防治相关的文本数据,其中包含了广大农民遇到的各类生产问题和经验办法,对这些数据进行挖掘和利用具有很高的应用价值。本文以番茄病虫害领域为例开展知识抽取研究,主要包含语料库构建、实体识别和关系抽取等内容,具体工作如下:(1)番茄病虫害领域的语料库构建。首先以期刊文献、电子书籍和网络文本为数据源,获取了番茄病虫害领域的文本语料,并梳理了番茄病虫害领域常见的实体类别和关系类别,给出了实体识别任务和关系抽取两个任务的分类体系和定义。其次,通过Jieba工具对数据进行了分词、数据标注等与处理工作,制定了了数据标注规则和检验方法,在团队成员协助下完成了完语料库的构建,为后续研究奠定了基础。(2)基于领域预训练BERT的命名实体识别方法。本文采用预训练BERT模型在获取的番茄病虫害文本语料库上进行领域深度预训练,结合当下主流的Bi LSTM-CRF模型进行实体识别。除此之外,根据错误的测试用例设计了番茄病虫害领域的实体边界约束的正则表达式。实验证明,经过领域预训练形成的字向量可以有效提升实体识别的F1值,在实体识别的基础上利用规则约束边界可以进一步提升模型识别效果。(3)基于远程监督和注意力机制的关系抽取方法。首先基于Tbd BERT模型进行文本序列编码,将实体信息和编码一起进行平均最大池化,利用注意力机制增强关键词和语义信息的权重。通过实验分析,CNN网络在远程监督的关系抽取的效果最好,领域知识预训练、实体位置信息、注意力机制和平均最大池化操作均对实体关系抽取效果有不同程度的提升。(4)构建了基于Neo4j的番茄病虫害知识抽取系统,完成了实体识别和关系抽取、实体词入库和实体关系检索和可视化等功能。
其他文献
随着我国智慧农业的快速发展,水产养殖业不断发生技术变革。传统水产养殖模式的智能化与产能较低。为了提高智能化水平,本文针对新型“跑道”水产养殖模式,运用了农业物联网、模糊PID、模糊综合评价和水质等级预测等方法和理论,设计了一套带有跑道养殖区监控与生态净化区水质评价预测功能的水产养殖物联网系统。主要研究内容如下:(1)系统整体结构与硬件设计。首先,本文搭建了水产养殖物联网系统的三层架构,其中感知层以
"大众创业、万众创新"(后称"双创")政策是科技创新政策中最具活力和代表性的一个类别,一方面激励一切民众和企业的创新活力并予以支持,另一方面也是受众最多、最广的创新政策。通过开展对国家、地方双创科技政策的收集与挖掘,通过对政策中涉及的内容、适用群体进行分析和分类,最后总结出我国双创政策取得的阶段性成果。
伴随着地球资源的日益匮乏,新能源汽车产业迎来了发展的新蓝海。永磁同步电机(PMSM)凭借着运行时转矩波动小、振动噪音低等优点被广泛应用在新能源领域。由于车用PMSM运行时需要依靠功率管进行频繁通断,使得逆变器更易发生开路故障。当逆变器开路故障发生时会对PMSM的性能产生影响,缩短其使用寿命。因此无论是从经济效益方面还是社会发展方面来看,深入研究逆变器开路故障问题都具有重要的意义。本文以表贴式PMS
随着时代的发展,传统的特征提取和人工监测方法已经无法满足人们的需要,计算机视觉技术也因此有快速发展的势头。目前我国在养殖行业的问题主要是无法及时发现家畜的健康问题,导致大量家畜因为患有常见的传染性疾病而死亡,造成经济上的重大损失。运用计算机视觉技术既可以无接触地实现自动化识别,又可以减少人工,同时这项技术可以十分高效地对猪的采食行为进行识别,也能对采食猪只的身份进行准确识别。因此,使用计算机视觉技
随着能源短缺和环境污染问题日益严峻,人们越来越重视对清洁、高效可再生能源的开发。微电网技术作为分布式电源并网的关键技术手段,能够综合利用多种可再生能源,满足用户多样化的用电需求,受到了广泛的关注。由于分布式电源出力具有随机性,导致微电网并网时给配电系统带来了不可忽视的电能质量问题,其中电压波动问题较为突出,不仅造成设备损坏,还会带来巨大的经济损失。因此,深入研究微电网接入配电网的电压控制问题,对提
<正> 笔者采用补益法治疗“先天性心脏病”手术后非感染性发热取得良好疗效。介绍如下:陈××男17岁学生住院号A32184。患者因“先天性室间隔缺损”于1986年11月5日在低温、体外循环、静脉复
中国是农业大国,其苹果产出量位居世界第一。但随着经济的快速发展,国内的农业劳动力资源日益紧张,同时,苹果采摘具有季节性明显、工作量较大等特点。因此,为了降低苹果采摘的人力成本,提高采摘效率,亟需展开对农业机器人采摘技术的研究。苹果采摘机器人末端执行器是执行采摘任务时与苹果产生直接接触的重要设备,由于苹果生物特性脆弱,在采摘的过程中时常会出现由于抓取力过大导致苹果损伤或者抓取力过小导致苹果跌落等情况
在手机等电子产品生产领域中,通常采用点胶机对手机零部件进行粘合或者加固处理,点胶机由于受到不同恶劣工况因素影响,会造成胶水缺陷。目前胶水缺陷通常采用传统视觉进行检测,其易受作业环境影响,且过于依赖人工设计的特征提取算法,不利于推广和维护。本文针对工业场景下的胶水缺陷检测,进行基于语义分割的补强胶缺陷检测系统的设计与研究。主要工作内容如下:首先,对工业相机、镜头以及光源进行选型,建立图像采集平台采集
谷物及其加工品,是人体营养摄入的关键来源,是老百姓日常膳食结构中必不可少的食物。在生活中,不良商家使用成本较低的谷物粉以次充好,牟取暴利,严重危害消费者权益与身心健康。针对这一现象,专家学者提出诸多检测技术,但是对于外观、气味没有明显差异的谷物粉及其掺杂物,采用传统化学计量法的检测技术速度慢,而采用机器视觉方法的检测识别精度较低。微波与毫米波无损检测技术灵敏度高、抗干扰能力强,结合分类算法能够区分
与现有人工或耳标监测相比,计算机视觉技术对猪场图像的提取与分析具有不接触、高效和全时间段的优点。现有的猪饮水行为及身份识别方法在条件较理想的情况下可以达到很好的效果,但在复杂条件下的识别效果仍具有提升空间。因此,本文对提升猪图片的亮度和细节特征、增强猪体分割边缘的清晰度、选取关联性高的饮水行为时空特征和选取与融合饮水猪身份识别特征等方面进行了研究。依据以上研究目的,本文主要研究内容及成果如下:(1