基于深度学习的电力缺陷文本多标签分类与规范度评价

来源 :重庆大学 | 被引量 : 0次 | 上传用户:slik
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
当前电力设备缺陷文本信息存在数据丰富,利用率较低的情况,电力公司现有的缺陷文本信息管理系统对缺陷文本信息的分类方法不够完善,系统仅能实现对缺陷文本简单的单一分类,无法完成对缺陷文本的精确分类,同时缺陷文本填写不规范的情况也影响着缺陷文本的分类正确性与精确性。由于对缺陷文本信息的利用不足,常出现同一缺陷在不同地区重复发生的情况,且随着我国电网规模的扩大,设备使用年限的增加,该问题变得越来越突出。因此,需要找到新的缺陷分类方法实现对缺陷文本的自分类,进而实现对缺陷文本信息填写规范度的评价,保证缺陷填写分类的准确性,实现缺陷文本信息的精确查询与数据挖掘,使缺陷文本信息得到有效利用,从而帮助现场人员快速发现缺陷,减少事故发生,提高电力公司运行维护水平。本文针对该问题,结合近年来电力公司缺陷文本信息管理系统中所积累的大量数据,利用多标签分类法对电力缺陷文本进行多标签分类,利用分类数据进行电力缺陷文本信息数据的规范度评价与数据挖掘的研究工作。第一部分,介绍了本文所用的相关方法与技术;第二部分,分析多标签分类的优势以及提出基于深度学习的多标签电力缺陷文本分类实现方案,利用分词工具与Word2vec完成面向电力缺陷文本的预处理,结合Seq2seq模型与注意力机制实现对电力缺陷文本的多标签分类;第三部分,从缺陷文本的规范性信息中筛选指标建立缺陷文本信息规范度评价指标体系,结合模糊层次分析法建立缺陷文本信息规范度评价模型评价缺陷文本信息规范度与准确性,综合改进型Apriori算法与缺陷文本信息规范度评价模型以某电力公司缺陷数据为目标进行数据挖掘,得到缺陷关联性信息以辅助现场快速判断缺陷情况,为领导层决策提供依据,为缺陷分析提供更多数据支持,论文主要工作及研究成果包括有:(1)针对目前电力缺陷文本存在数据多、利用少,分类方法效果差、不合理等问题,分析比较多标签分类方式在缺陷文本分类与当前分类方式的分类效果,提出基于深度学习的多标签电力缺陷文本分类实现方案,结合电力缺陷文本专业性强、逻辑性强、长文本、噪音强等特点完成对电力缺陷文本的短文本化、分词、去停顿词、词向量化等预处理操作,结合Seq2seq模型与注意力机制实现对电力缺陷文本的多标签分类,最后利用三种设备类型的缺陷数据集实验证明该方法的有效性与性能优越性。(2)建立缺陷文本信息规范度评价体系,提出基于模糊层次分析法的缺陷文本信息规范度评价模型,考虑专家经验和数据自身变化,实现对缺陷文本信息规范度的定量评价,实例研究表明,本文提出的模型对缺陷文本信息规范度评价具有较高的准确性与通用性;基于缺陷多标签分类法提出布尔矩阵与改进型Apriori算法相结合的缺陷文本信息数据挖掘方法,结合实际案例表明,该方法可以利用挖掘所得缺陷关联性信息辅助现场运维工作,为缺陷分析提供更多数据支持。
其他文献
学位
厚规格钢板作为重要的钢铁品种,广泛应用于国民经济建设各个方面。如何克服连铸坯内部组织疏松、晶粒粗大和偏析等问题在较小压缩比条件下生产高质量的厚规格钢板产品,保证其产品质量与性能,尤其是特厚板产品的内在质量,是一直困扰各中厚板生产企业和轧制工艺研究需要着力解决的一个重要问题。本论文提出采用差厚轧制技术来改善厚规格钢板轧制条件,克服厚坯轧制时的咬入限制,减小头部冲击造成力矩峰值的影响,增加单道次压下量
土壤重金属复合污染现状日益严峻,在金属冶炼、化工制造和电镀等行业场地,镉(Cd)、铅(Pb)、铬(Cr)三种重金属的复合污染严重程度不容忽视。当前,碳酸盐、磷酸盐、Fe(Ⅱ)等常用修复材料在同步稳定土壤中Cr(Ⅵ)、Cd和Pb上均存在不足,新型的修复材料还有待进一步发展;FeS纳米颗粒(FeS NPs)在单一Cr(Ⅵ)、Cd或Pb污染水溶液和土壤的修复中能达到较好的效果,但在同步修复Cr(Ⅵ)、C
好氧颗粒污泥(Aerobic granular sludge,AGS)是一种高效的污水生物处理技术,被认为是21世纪最有前途的生物废水处理技术之一。与传统活性污泥(activated sludge,AS)相比,AGS具有高污染物去除能力,良好的生物质沉降能力,强大而紧凑的微生物结构,可以回收资源等特点。但由于启动时间长、颗粒运行不稳定等因素,AGS在污水处理中的应用受到限制。促进AGS形成对于AG
并联式混合动力汽车(Parallel Hybrid Electric Vehicle,PHEV)通过机械连接将发动机和电动机接入驱动系统,并且可以根据汽车行驶工况的需要,两者分别驱动或者进行一起驱动汽车行驶。本文以选取的某型PHEV为研究对象,在选取的工况的基础上对其动力系统与传动系统的参数匹配优化和其控制策略的制定进行了分析研究。本文首先根据混合动力汽车的零部件总类和连接方式对其进行分类,然后对
随着人口老龄化进程的加速以及人们生活方式的改变,糖尿病已逐渐成为了严重威胁着人类生命健康的慢性非传染性疾病之一。末梢血检测血糖是应用最广泛的方法。但相比之下,持续血糖监测(CGMS)因能提供更加全面的血糖浓度和波动信息,对于治疗和预防糖尿病有着重大意义。葡萄糖传感器作为决定CGMS核心性能的重要组成部件,存在着监测性能及稳定性较差的问题从而限制了其在我国众多糖尿病患者中的推广使用。因此,本文研究并
随着近年来污泥产量的剧增,如何对其进行合理的处理处置成为一个亟待解决的问题。同时,不可再生磷资源的锐减,也迫使我们必须重视对于污泥这一“第二磷源”的资源化利用。污泥热解过程中磷迁移转化特性是目前研究的热点。本文通过standards,measurements,and testing protocol(SMT)方法,确定不同热解温度下污泥中各种形态磷的迁移转化特性,系统地研究了钙基添加剂对磷的含量以
Nomex蜂窝复合夹芯板材具有高刚度、高强度、高疲劳、质量轻、绝缘、耐压、稳定性好等诸多特点,目前已经被广泛应用于航天航空、列车等领域中。但同时蜂窝复合夹芯板材也是一种典型的难加工材料,普通切割加工会出现蜂窝芯纸张开裂、蜂窝芯毛刺多、蒙皮毛刺多、蒙皮和蜂窝芯脱胶的现象,影响蜂窝复合夹芯板材结构件的质量,难以满足实际使用需求。超声切割加工技术是近20年兴起的一项工艺技术,相比于传统切割加工方法,由于
钛及钛合金以其优异的力学性能、良好的耐腐蚀性以及优良的生物相容性在医用金属材料领域得到广泛应用,其中Ti-6Al-4V合金是当前医用钛合金中使用量最大的钛合金。但是Ti-6A1-4V合金因其耐腐蚀磨损性能方面存在缺陷,在使用中容易产生磨屑,可导致无菌性炎症。同时磨损可促进合金的腐蚀,加速合金中的Al和V进入人体,降低钛合金植入体的使用寿命,并给患者带来健康安全隐患。传统的表面改性中在Ti-6Al-
随着城市化进程的推进,我国作为世界城市化的主要阵地,在取得了伟大建设成就的同时,城市与自然之间的矛盾也逐渐凸显出来,在此背景下我国先后提出了园林城市、生态园林城市、森林城市等响应措施,在缓解城市与生态之间的矛盾起到了很大的作用,但仍存在许多突出的问题。以往的园林城市建设重视绿化指标而轻质量,只着眼于绿地数量的提升,对于绿色空间的品质、城市形象魅力的塑造以及居民生活品质的提升这些方面则较少涉及。本文