【摘 要】
:
电力设备种类繁多、结构复杂,在实际生产运行中,必须对其进行巡检和试验以及时发现缺陷,保证电力设备安全稳定运行,因此大量与电力设备运行状态相关的缺陷描述被记录在案。根据缺陷描述确定缺陷等级是电网故障处理的重要过程,不同缺陷等级对应不同的消缺时限要求,所以缺陷等级的准确分类对电网安全稳定运行至关重要。而文本数据因为其语义多样性和句法结构复杂性,难以直接采用计算机程序进行分析识别,目前主要以人工分类为主
论文部分内容阅读
电力设备种类繁多、结构复杂,在实际生产运行中,必须对其进行巡检和试验以及时发现缺陷,保证电力设备安全稳定运行,因此大量与电力设备运行状态相关的缺陷描述被记录在案。根据缺陷描述确定缺陷等级是电网故障处理的重要过程,不同缺陷等级对应不同的消缺时限要求,所以缺陷等级的准确分类对电网安全稳定运行至关重要。而文本数据因为其语义多样性和句法结构复杂性,难以直接采用计算机程序进行分析识别,目前主要以人工分类为主。这种缺陷文本分类方式,不仅工作量大,效率较低,而且易受工作人员经验影响,准确率不高。随着人工智能和自然语言处理技术的飞速发展,利用深度学习对电力设备缺陷文本进行分类成为可能。基于此,本文提出了基于自注意力记忆网络的缺陷文本分类方法和改进BERT模型表示的缺陷文本分类方法。本文的主要工作和研究成果如下:1.分析了电力设备缺陷文本特点,建立了电力分词词典及停用词词典,构建了电力设备缺陷文本数据集,提出了基于自注意力记忆网络的缺陷文本分类方法。该方法能够有效记忆上下文信息,且能够对重要信息赋予权重从而更好地抽取缺陷文本特征。利用构建的电力设备缺陷文本数据集进行对比实验验证,结果表明该方法具有良好的缺陷文本分类能力。2.在文本表示方面,虽然BERT模型能解决Word2vec等词嵌入方法存在的一词多义问题,但是在其预训练任务中,单字遮蔽训练割裂了连续字之间的相关性,词的语义信息无法有效学习。为此,本文提出了一种改进BERT模型特征表示的缺陷文本分类方法,该方法对BERT模型的输入层进行改进,即通过实体链接、抽取,将Token与实体融合进行特征拼接再进行预训练任务。改进的BERT模型训练生成动态词向量能够学习到词的语义信息且具有实体知识信息,这同时也是一种对缺陷文本特征的有效拓展,一定程度上改进了缺陷文本特征稀疏性问题。实验结果表明,将改进BERT模型训练输出的缺陷文本表示向量用于缺陷文本分类任务,缺陷文本分类准确性得到了有效提升。
其他文献
花椒(Zanthoxylum bungeanum Maxim.),又称秦椒、蜀椒、大红袍等,其果实、根、茎皆可入药。作为一种药食同源的植物,花椒除了在日常生活中常被用作香料和调味品外,也是一种被广泛使用的中药材。2020版《中国药典》中记载,花椒可用于治疗腹痛、呕吐、泄泻、蛔虫症、湿疹、瘙痒等。现代药理学研究表明花椒有抗菌、杀虫、抗氧化、抗肿瘤、抗炎镇痛、降血糖、抑制乙酰胆碱酯酶、抑制血小板凝集等
随着城镇化进程的推进,当代人们超过80%的时间是在室内度过的,室内空气品质与室内人员的身心健康息息相关。甲醛是室内最常见和关注度较高的污染物,在我国有毒化学品优先控制名单上高居第二位。因此,室内甲醛污染的去除刻不容缓。植物修复技术中的主动绿墙因其社会、经济、人文效益受到了越来越多的关注。然而,当前对绿墙的甲醛净化研究较少,植物介导的效果及其对甲醛的耐受性研究仍存在不足。本文以优化主动绿墙的甲醛净化
目前铁路选线设计基本依赖于设计工程师的知识与经验,结合地形、地质等因素决策出最终线路空间位置,存在设计工作强度大,比选方案有限,决策周期长等缺陷。而面对高度复杂的环境会使线路设计变得异常困难,选线工作的难度递增,周期大大增长,因此如何利用路径规划算法进行铁路线路走向方案生成的研究一直都是工作重点。论文从研究区域的综合环境因素分析入手,结合A-star算法与改进SA混合算法在选线上的可行性进行分析与
随着轨道交通系统的飞速发展及人们对出行便利需求的日益提高,综合交通枢纽已逐步发展为集交通、商业、居住及休闲等为一体的城市功能中心。对于具有盘活存量空间、促进城市集约化发展等特点的地下综合交通枢纽已成为发展趋势。通过研究其室内热环境,不仅能有效改善站内环境热舒适性,也能为正在设计规划阶段的地下车站提供参考,具有十分重要的工程应用意义。本文主要通过数值模拟的方法对地下综合交通枢纽室内热环境进行了研究。
模因论是一种揭示文化演变的新理论。纵观国内外关于模因论的研究,从Kate Distin在其著作The Selfish Meme中得出模因论应该对语言相关问题做出新的解释后,国内何自然教授等一批学者也开始将目光放在模因论与语言应用相关研究上。国内关于模因论的研究多在语言学领域展开,以翻译为背景的研究却仍属少数。本文将以“仿拟翻译”为主要研究对象,以霍克思和杨宪益夫妇《红楼梦》英译本为语料,以模因论为
根据2019年全国大、中城市固体废物污染环境年报,2018年上海市的城市生活垃圾产生量在全国大、中城市中排第一,基于此,上海市在2019年1月通过了《上海市生活垃圾管理条例》将垃圾分类正式纳入法律框架,之后采取了各种动员方式,上海市垃圾分类政策正式实施之后,取得了显著的成效,上海市垃圾分类政策能够顺利实施和上海市所采取的动员措施是密切相关的,因此能够为其他城市的垃圾分类政策的顺利推广提供一定的借鉴
基于相位敏感光时域反射计(Phase-sensitive Optical Time Domain Reflectometer,Φ-OTDR)的分布式光纤传感系统具有抗电磁干扰、高灵敏度、高分辨率及测量距离远等优点,在周界防护、建筑结构健康监测、管道泄露监测等领域具有重要的应用价值。在实际应用中,该系统存在着两个关键问题,一是由于噪声干扰导致信号的信噪比较低,出现定位不准的情况,二是系统对干扰信号种
当今世界能源供应形势日趋紧张,核电凭借高效、清洁等特点已经成为解决资源短缺的重要途径。在核电系统中,热传导过程产生的流致振动会引起核燃料包壳管与定位格架之间发生微动磨损,进而导致包壳管表面破损、核燃料泄露,严重影响核电安全。研究锆合金包壳管在复杂环境下,尤其是在交变载荷与核辐照条件下的微动磨损行为对提高核电站服役寿命、保障核电站安全运行具有重要意义。本文以Zr-4合金材料作为研究对象,在多功能微动
文章以道路集约化“多杆合一”建设为例,探讨城市集约化建设的实践应用及其面临的问题和发展趋势,以期为集约化建设的相关市政工程研究提供借鉴参考。
将深度学习算法及计算机视觉技术应用于工件表面缺陷检测是目前的研究热点,并在多种缺陷检测任务中取得了良好的效果。但目前仍然存在深度学习技术操作门槛高、缺陷检测系统通用性差、小样本学习精度差等问题。本文针对上述问题展开研究,以期开发一款工件表面缺陷检测系统。论文对经典的图像分类网络和目标检测网络进行了研究,结合工件表面缺陷检测系统的设计需求,选择了图像分类网络作为缺陷检测系统的基础网络。利用深度学习方