论文部分内容阅读
摘要:随着科学技术的不断进步,电网的智能化水平也越来越高,也因此在电网运行和设备监测的过程中产生了大量的数据,例如系统运行数据、设备状态数据、用户需求数据等等。另外,物联网技术和云计算的蓬勃发展,也进一步增强了电网数据的体量和复杂度。如此庞大的数据体系难免会带来一些数据质量问题,如数据缺失、数据冗余、数据异常等。数据质量的好坏不仅关乎电网应用分析的可靠性与正确性,还会对电力系统的稳定运行产生影响。所以,进行高效可靠的数据质量管理对电力系统具有重要意义。本文基于数据挖掘技术在电网安全生产风险管控中的应用研究展开论述。
关键词:数据挖掘技术;电网安全生产;风险管控;应用研究
引言
电力行业在大数据时代也面临着新的挑战和难得的发展机遇。应用大数据挖掘和分析可以极大弥补现有的人工处理数据的不足,提高电网运营监控的辅助决策水平和工作效率与质量,将重点放在检查关注各项生产任务计划产生异常预警的原因上,全面管控各种生产经营风险,提高公司管理水平和运营效率。但以往国内外学者侧重于电网运营监测体系的分析研究,采用大数据分析方法对安全生产风险智能管控的研究较少。
1技术应用方式
近年来,数据挖掘技术由于其很强的技术优越性,已经成为一种各领域广泛使用的先进技术,尤其是在电力系统中,数据挖掘技术可以对电网的数据进行优化处理,从而达到提高电网运行效率的目的。另外,电网管理者还可以通过使用数据挖掘技术对人员绩效考核、保护功耗记录在内的多项日常工作进行应用,以提高数据应用程序的准确性,经过各种挖掘算法的研究,可以有效地分析数据之间的隐式关系。在这一过程中采用数据挖掘技术的优势显而易见,同时也可以为下一步发电量预测、负荷预测等提供更为可靠的技术支持。神经网络作为一种广泛使用的人工智能研究方法,在我国已得到广泛应用。电力调度自动化系统的数据挖掘技术具有自我处理、数据分发以及高容错性等优越性,使得神经网络数据挖掘方法更适合处理电力调度自动化系统数据。考虑到数据挖掘技术本身存在固有的数据误差和不准确性,电网调度人员在进行调度自动化系统数据挖掘过程中应当充分考虑到电能分配的实际需要,并在此基础上不断改进数据逻辑的处理方法。电网调度人员首先应做好数据集成管理工作,这是因为电力调度自动化系统需要处理海量的电网运行数据,这些数据具有复杂性和多样性。此外,技术人员通过应用神经网络数据挖掘方法,可以对电网各种运行方式、典型区域电网的运行状态、每条线路的连接方式和每个变电站的设备参数等信息进行合理地挖掘和排序,同时保证相关数据信息综合应用,进而可以实现电网运行的综合分析和决策。另外,技术人员可以结合神经网络收集的电网数据,进行更高效率的分析、决策和数据交换。
2安全生产业务相关数据模型
数据模型包括数据结构和数据约束条件。数据结构是数据模型的基础,它描述了数据的类型、性质、内容以及数据间的联系等。数据约束建立在数据结构基础上,指的是数据结构内数据间的语法、制约和依存关系,以及數据动态变化的规则,以保证数据的正确和完整有效。运营监控业务数据模型是为了对变电巡视核查、输电巡视核查、配网巡视核查、保供电核查等业务数据存储建立的数据模型,不同业务数据模型需要在一个统一的规范下建立,以便于不同业务模型之间的信息交换和共享。安全生产业务数据模型建立的步骤分为获取业务数据、数据整理、数据存储、数据分析与信息交付等五层。
3数据挖掘系统
对于一个完整的数据挖掘系统,其主要由数据库、知识库、数据库服务器、数据挖掘引擎、挖掘算法及人机交互界面等模块所构成,在该系统组成中,数据(仓)库主要是通过数据库软件实现对源数据的存储。另外,还包括数据在清理、集成、过滤过程中的中间数据。在功能上,数据库是面向事务的设计,一般用来存储系统运行的实时数据;数据仓库则是面向主题的设计,一般存储历史数据。从数据量的角度上,数据仓库的数据量远大于数据库。数据库服务器与数据仓库服务器由局域网中的1台或多台计算机所构成,主要是为底层的数据库或数据库群提供一个向上的数据接口,使得上层的应用程序能够适时调用数据库中的数据。知识库主要用来放置数据挖掘过程中所用到的专业领域知识与规则。同时,技术人员的经验和常识也可以包括在内,用于辅助指导搜索。数据挖掘引擎是系统中的核心组成,能够利用知识库与使用者实现互动。一般由不同功能的模块所构成,用于聚类分析、特征化、及偏差分析等。模式评估利用兴趣度作为标准,从而可以挖掘出代表知识的真正有趣模式。人机交互用来实现使用者与数据挖掘系统之间的通信,可以使用户利用可视化界面制定数据挖掘查询或任务计划。同时,该部分还允许用户浏览数据库、数据仓库和数据结构,了解系统状态。
4电力统计数据问题
随着电网体系规模的不断扩大,其运行过程中产生的数据量也越来越丰富,这其中蕴含着大量的信息,是可以影响发电、输配电、用户用电管理的决策指标的基础。但由于设备故障、认为原因等,电力数据可能会存在一些误差甚至是错误,这不仅不能为电力系统提供可靠的数据分析基础,而且可能因此带来决策错误,影响整个系统的良好运行。1)格式错误。所获取的数据格式应是统一的,不满足格式的数据组应视为不合格。另外在数据传送过程中,可能会出现乱码等错误,这也是格式检查的重要方向。2)精度错误。在数据获取和传输过程中,所有数据的精度都应保持一致,精度与规定不一致的数据应为不合格3)数据越限。每个数据都有自身约束范围,数据应在规定范围内。4)数据冗余。数据传输过程中可能存在重复记录的问题,因此会产生数据冗余。5)数据缺失。在数据获取和用户访问端,所获取的数据量应一致,不能存在缺失记录或缺失字段。6)合理性问题。所获取数据都应满足电力系统运行要求,各数据之间互相约束,数据段不满足运行条件的为不合格数据段。
结束语
配合K-means算法能更好地适应大容量、多维度文本数据的处理,同时简化了计算流程,一定程度上提高了计算的速度与效果。在此基础上结合多种异常检测算法和合适的文本数据规范化法完成了安全生产风险管控智能分析追踪软件的开发。通过本套系统对区局以及现场的生产计划落实情况开展即时快速的智能分析与快速核查追踪,使得公司可以对异动的每一个生产活动、每一个计划、每一个节点的数据开展全天候快速管控,及时发现异常和预警,对生产风险进行全面管控和分析,保障电网安全经济运行。
参考文献
[1]薛飞.电网安全稳定特性分析的调度运行大数据挖掘技术研究[J].宁夏电力,2019(01):2.
[2]卢颖浩.数据挖掘在电网安全生产监督管理中的应用研究[D].华北电力大学,2018.
[3]莫琦,李矛,李翔,付龙明,王立娜,卢颖浩.数据挖掘技术在电网安全检查管理中的应用[J].科技创新导报,2017,14(19):209-210+212.
[4]李翔,莫琦,付龙明,王立娜,卢颖浩.基于数据挖掘的电网隐患等级自动评估方法[J].科技创新导报,2017,14(17):99-100.
关键词:数据挖掘技术;电网安全生产;风险管控;应用研究
引言
电力行业在大数据时代也面临着新的挑战和难得的发展机遇。应用大数据挖掘和分析可以极大弥补现有的人工处理数据的不足,提高电网运营监控的辅助决策水平和工作效率与质量,将重点放在检查关注各项生产任务计划产生异常预警的原因上,全面管控各种生产经营风险,提高公司管理水平和运营效率。但以往国内外学者侧重于电网运营监测体系的分析研究,采用大数据分析方法对安全生产风险智能管控的研究较少。
1技术应用方式
近年来,数据挖掘技术由于其很强的技术优越性,已经成为一种各领域广泛使用的先进技术,尤其是在电力系统中,数据挖掘技术可以对电网的数据进行优化处理,从而达到提高电网运行效率的目的。另外,电网管理者还可以通过使用数据挖掘技术对人员绩效考核、保护功耗记录在内的多项日常工作进行应用,以提高数据应用程序的准确性,经过各种挖掘算法的研究,可以有效地分析数据之间的隐式关系。在这一过程中采用数据挖掘技术的优势显而易见,同时也可以为下一步发电量预测、负荷预测等提供更为可靠的技术支持。神经网络作为一种广泛使用的人工智能研究方法,在我国已得到广泛应用。电力调度自动化系统的数据挖掘技术具有自我处理、数据分发以及高容错性等优越性,使得神经网络数据挖掘方法更适合处理电力调度自动化系统数据。考虑到数据挖掘技术本身存在固有的数据误差和不准确性,电网调度人员在进行调度自动化系统数据挖掘过程中应当充分考虑到电能分配的实际需要,并在此基础上不断改进数据逻辑的处理方法。电网调度人员首先应做好数据集成管理工作,这是因为电力调度自动化系统需要处理海量的电网运行数据,这些数据具有复杂性和多样性。此外,技术人员通过应用神经网络数据挖掘方法,可以对电网各种运行方式、典型区域电网的运行状态、每条线路的连接方式和每个变电站的设备参数等信息进行合理地挖掘和排序,同时保证相关数据信息综合应用,进而可以实现电网运行的综合分析和决策。另外,技术人员可以结合神经网络收集的电网数据,进行更高效率的分析、决策和数据交换。
2安全生产业务相关数据模型
数据模型包括数据结构和数据约束条件。数据结构是数据模型的基础,它描述了数据的类型、性质、内容以及数据间的联系等。数据约束建立在数据结构基础上,指的是数据结构内数据间的语法、制约和依存关系,以及數据动态变化的规则,以保证数据的正确和完整有效。运营监控业务数据模型是为了对变电巡视核查、输电巡视核查、配网巡视核查、保供电核查等业务数据存储建立的数据模型,不同业务数据模型需要在一个统一的规范下建立,以便于不同业务模型之间的信息交换和共享。安全生产业务数据模型建立的步骤分为获取业务数据、数据整理、数据存储、数据分析与信息交付等五层。
3数据挖掘系统
对于一个完整的数据挖掘系统,其主要由数据库、知识库、数据库服务器、数据挖掘引擎、挖掘算法及人机交互界面等模块所构成,在该系统组成中,数据(仓)库主要是通过数据库软件实现对源数据的存储。另外,还包括数据在清理、集成、过滤过程中的中间数据。在功能上,数据库是面向事务的设计,一般用来存储系统运行的实时数据;数据仓库则是面向主题的设计,一般存储历史数据。从数据量的角度上,数据仓库的数据量远大于数据库。数据库服务器与数据仓库服务器由局域网中的1台或多台计算机所构成,主要是为底层的数据库或数据库群提供一个向上的数据接口,使得上层的应用程序能够适时调用数据库中的数据。知识库主要用来放置数据挖掘过程中所用到的专业领域知识与规则。同时,技术人员的经验和常识也可以包括在内,用于辅助指导搜索。数据挖掘引擎是系统中的核心组成,能够利用知识库与使用者实现互动。一般由不同功能的模块所构成,用于聚类分析、特征化、及偏差分析等。模式评估利用兴趣度作为标准,从而可以挖掘出代表知识的真正有趣模式。人机交互用来实现使用者与数据挖掘系统之间的通信,可以使用户利用可视化界面制定数据挖掘查询或任务计划。同时,该部分还允许用户浏览数据库、数据仓库和数据结构,了解系统状态。
4电力统计数据问题
随着电网体系规模的不断扩大,其运行过程中产生的数据量也越来越丰富,这其中蕴含着大量的信息,是可以影响发电、输配电、用户用电管理的决策指标的基础。但由于设备故障、认为原因等,电力数据可能会存在一些误差甚至是错误,这不仅不能为电力系统提供可靠的数据分析基础,而且可能因此带来决策错误,影响整个系统的良好运行。1)格式错误。所获取的数据格式应是统一的,不满足格式的数据组应视为不合格。另外在数据传送过程中,可能会出现乱码等错误,这也是格式检查的重要方向。2)精度错误。在数据获取和传输过程中,所有数据的精度都应保持一致,精度与规定不一致的数据应为不合格3)数据越限。每个数据都有自身约束范围,数据应在规定范围内。4)数据冗余。数据传输过程中可能存在重复记录的问题,因此会产生数据冗余。5)数据缺失。在数据获取和用户访问端,所获取的数据量应一致,不能存在缺失记录或缺失字段。6)合理性问题。所获取数据都应满足电力系统运行要求,各数据之间互相约束,数据段不满足运行条件的为不合格数据段。
结束语
配合K-means算法能更好地适应大容量、多维度文本数据的处理,同时简化了计算流程,一定程度上提高了计算的速度与效果。在此基础上结合多种异常检测算法和合适的文本数据规范化法完成了安全生产风险管控智能分析追踪软件的开发。通过本套系统对区局以及现场的生产计划落实情况开展即时快速的智能分析与快速核查追踪,使得公司可以对异动的每一个生产活动、每一个计划、每一个节点的数据开展全天候快速管控,及时发现异常和预警,对生产风险进行全面管控和分析,保障电网安全经济运行。
参考文献
[1]薛飞.电网安全稳定特性分析的调度运行大数据挖掘技术研究[J].宁夏电力,2019(01):2.
[2]卢颖浩.数据挖掘在电网安全生产监督管理中的应用研究[D].华北电力大学,2018.
[3]莫琦,李矛,李翔,付龙明,王立娜,卢颖浩.数据挖掘技术在电网安全检查管理中的应用[J].科技创新导报,2017,14(19):209-210+212.
[4]李翔,莫琦,付龙明,王立娜,卢颖浩.基于数据挖掘的电网隐患等级自动评估方法[J].科技创新导报,2017,14(17):99-100.