面向茶叶病虫害领域的实体关系抽取研究

来源 :中南民族大学 | 被引量 : 0次 | 上传用户:oikikukka
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
茶叶病虫害是制约茶叶产业发展的重要因素,一直备受茶农关注。目前随着网络的发展,出现了大量和茶叶病虫害相关的无结构化或半结构化的文本,传统的搜索方法无法高效精准的获取茶叶病虫害领域的相关信息,由于知识图谱能实现实体的语义搜索、实体间的关系搜索,所以构建关于茶叶病虫害领域的知识图谱势在必行。关系抽取作为构建茶叶病虫害知识图谱的核心步骤,主要是提取两实体间的语义关系。本文采用了深度神经网络和远程监督学习实现了面向茶叶病虫害领域的实体关系抽取,为构建茶叶病虫害知识图谱奠定了基础。本文主要工作集中在以下三个方面:(1)使用远程监督的方法构建了茶叶病虫害领域的语料。首先利用领域知识采用三元组的形式构建茶叶病虫害领域一个小型知识库;接着利用实体尽可能爬取出训练的文本语料,解决训练语料数量过少的问题;其次,对语料文本进行过滤清洗、分词等处理,接着利用所构建的知识库与处理后的文本自动对齐,完成语料的标注工作;最后对语料文本进行了无监督训练,获取了语料文本相关的词向量,更好的提取文本特征。(2)提出了一种基于通道注意力机制的茶叶病虫害实体关系抽取研究方法。在远程监督关系抽取任务上PCNN模型常被用作于提取句子语义特征,在其提取过程中,以两个实体为界限将句子划分为三段,进行最大池化,存在的问题是无法区分哪一段对于最后句子的分类任务具有较大的贡献。针对于此问题,我们借鉴于图像领域里面所使用的通道注意力机制,给经过卷积后的每一个句子分段分配一个不同的权重,使得对于最后的关系分类任务具有重要作用的关键句子分段的权重变大,突出PCNN中关键分段的影响,有效的挖掘出句子特征,以此来提高模型的准确率。(3)提出了一种基于门控模块的茶叶病虫害关系抽取研究方法。针对语料中出现包中所含句子全是噪声句子的情况,前人提出在包的基础上构造“超包”,再次使用注意力机制,效果依然不佳的问题。基于此,本章节提出了基于门控模块的关系抽取解决方法,该方法旨在通过包间注意力机制分配权重之前,通过该模块对包的语义特征向量先行进行过滤,使得部分噪声包完全被过滤掉。以此来降低噪声句子对模型的干扰,进一步提高模型的准确率。实验结果表明,相比于传统关系抽取方法,模型在采取通道注意力机制和门控模块等两种改进方案后,准确率、f1等指标都有明显提升。
其他文献
在过去的250年里,大气中二氧化碳(CO2)增加了近40%(从工业革命前的280 μatm到现在的400 μatm),大气中不断上升的CO2主要来自工业革命后人类活动大量化石燃料的燃烧,大气中CO2除了加剧温室效应,还与海洋不断进行着气体交换,使得人类活动排放的CO2约有1/3被海洋吸收,造成了海水酸度的增加、pH值的降低等,也就是,海洋酸化(Oceanacidification,简称为OA)。据
刺五加[Acanthopanax senticocus(Rupr.et Maxim.)Harms]系五加科植物(Araliaceae),是我国北方地区常用的药材之一。刺五加全株皆可入药,其中尤以叶子使用普遍。刺五加叶药理作用有抗肿瘤、抗疲劳、抗应激、抗炎抗菌及免疫调节等,常用于治疗心脑血管疾病、糖尿病等临床病症。本课题以刺五加叶为材料,研究干法(振动式超微粉碎)和湿法(高压均质)两种超微粉碎方式对
目的:比较HIV阴性与HIV阳性患者感染马尔尼菲蓝状菌(Talaromyces marneffei,TM)的临床特征的异同。方法:用回顾性的方法分析广西医科大学第一附属医院2012年5月-2019年4月通过血液、骨髓、痰液等标本真菌培养或皮肤组织、淋巴结等组织标本病理检查出TM确诊及临床考虑TM感染,多次标本真菌培养未培养出TM,但血清TM载量分子检测阳性的TM感染的175例住院患者的临床特征。结
目的:人类免疫缺陷病毒-1型反式转录激活因子(HIV-1 transactivator of transcription,HIV-1 Tat)可引起血脑屏障(blood-brain barrier,BBB)功能障碍和β-淀粉样蛋白(amyloid-beta,Aβ)脑内沉积,促进HIV-1相关性神经认知障碍(HIV-1-associated neurocognitive disorder,HAND)
目的:分析1995-2014年间5次广西学生体质与健康调查研究中汉、壮族7~18岁学生的视力动态变化状况,总结其特点和规律,比较学生视力低下检出率在民族、性别、城乡、年龄组间的差异,探讨广西汉、壮族学生视力低下的防控重点,为制定学生的近视防控措施和策略提供参考依据。方法:采用文献资料查询法,搜集1995年、2000年、2005年、2010年、2014年学生体质与健康调研报告资料,提取广西汉、壮族7
目的:探究马尔尼菲篮状菌(Talaromyces marneffei,T.marneffei)感染THP-1细胞后对THP-1细胞CD86蛋白表达情况的影响以及潜在机制的讨论。方法:1、从皮肤软组织感染患者皮损组织中分离得到真菌菌株,分别在27℃及37℃培养该组织分离株并对其形态进行鉴定;2、提取该分离株DNA,进行PCR扩增及产物琼脂糖凝胶电泳,对PCR扩增产物进行测序并在NCBI上进行序列比对
血清型作为大多数病原菌的一种生物学表型,在病原菌的鉴定、传染病的调查和溯源等方面具有重要意义。志贺氏菌(Shigella)是引起五岁以下儿童中至重度腹泻的主要病原体。目前,志贺氏菌血清型的鉴定主要采用传统的玻片凝集试验,但该方法费时耗力。文献已报道的基于PCR的分子鉴定方法不能覆盖全部志贺氏菌的血清型。因此建立高效、快速、高通量的新型志贺氏菌血清型分子鉴定方法具有重要意义。具体研究成果如下:第一章
目的探讨2例CT平扫为双侧基底节高密度灶的隐球菌性脑膜炎患者的临床特点、影像学表现、治疗方案、预后等,并复习相关文献,拓展临床工作者对该病的相关知识。方法回顾性分析2例患者的临床表现、颅脑CT、脑脊液检查、治疗及预后。并复习相关文献探讨患者CT表现基底节高密度的可能原因。结果共有2例CT平扫累及基底节区高密度灶的隐球菌性脑膜炎病例,病例1患者发病后4月余在CT平扫表现为双侧基底节区多发结节状或类圆
钛和钛合金因其优异的力学性能、耐腐蚀性能及生物相容性,广泛应用于医用植入材料领域。但钛合金要直接应用到植入体领域,还存在一些问题,比如钛合金表面粗糙度高低以及在人体内部钛合金表面要具有一定的抑菌效果,而这些问题与钛合金表面状态密切相关,所以需要对钛合金表面进行处理已提高钛合金各方面性能。电化学抛光技术和制备钛合金的超疏水表面是两种重要的表面处理技术。另外,除了医用植入材料领域,钛合金还广泛应用于航
自20世纪80年代以来,在传统教科书体系的改革潮流中,学术界开始尝试重新构建马克思的思想体系。随着对马克思思想体系的重新阐释,马克思的历史观问题也越来越受到更多的关注,并且也在马克思主义研究之中占据了越来越重要的位置。在21世纪初,国内学术界仍旧围绕着马克思的历史观问题展开研究,并且关于这一问题的研究或许在未来相当长的一段时间内会继续成为马克思主义研究的中心热点。马克思历史观是马克思思想体系中的重