论文部分内容阅读
摘 要:近年来,随着全球能源问题日益严峻,世界各国都开展了智能电网的研究工作。智能电网的最终目标是建设成为覆盖电力系统整个生产过程,包括发电、输电、变电、配电、用电及调度等多个环节的全景实时系统。而支撑智能电网安全、自愈、绿色、坚强及可靠运行的基础是电网全景实时数据采集、传输和存储,以及累积的海量多源数据快速分析。因而随着智能电网建设的不断深入和推进,电网运行和设备检/监测产生的数据量呈指数级增长,逐渐构成了当今信息学界所关注的大数据,这需要相应的存储和快速处理技术作为支撑。
一、概述
目前,大数据已成为学术界和产业界共同关注的研究主题,在很多领域获得了应用,具有广阔的应用前景。2011年5月,麦肯锡公司发布了关于大数据的调研报告《大数据:下一个前沿,竞争力、创新力和生产力》,文中充分阐明了大数据研究的地位以及将会给社会带来的价值,大数据研究已成为社会发展和技术进步的迫切需要。
在智能电网系统中,大数据产生于整个系统的各个环节。比如在用电侧,随着大量智能电表及智能终端的安装部署,电力公司和用户之间的交互行为迅猛增长,电力公司可以每隔一段时间获取用户的用电信息,从而收集了比以往粒度更细的海量电力消费数据,构成智能电网中用户侧大数据。通过对数据进行分析可以更好地理解电力客户的用电行为、合理地设计电力需求响应系统和短期负荷预测系统等。
二、电网大数据特性
电网中数据符合大数据的特点。电网中的大数据具备“4V”特征,即规模大(volume)、类型多(variety)、价值密度低(value)和变化快(velocity)。
电网中的大数据电网业务数据大致分为3类:一是电网运行和设备检测或监测数据;二是电力企业营销数据,如交易电价、售电量、用电客户等方面的数据;三是电力企业管理数据。根据数据的内在结构,这些数据可以进一步细分为结构化数据和非结构化数据。结构化数据主要包括存储在关系数据库中的数据,目前电力系统中的大部分数据是这种形式,主要包括视频监控、图形图像处理等产生的数据。在电力系统中,非结构化数据占到了智能电网数据的很大比重。结构化数据根据处理时限要求又可以划分为实时数据和准实时数据,比如电网调度、控制需要的数据是实时数据,需要快速而准确地处理;而大量的状态监测数据对实时性要求相对较低,可以作为准实时数据处理。
在电网中,大数据产生于电力系统的各个环节,包括:1)发电侧。随着大型发电厂数字化建设的发展,海量的过程数据被保存下来。2)输变电侧。基于电网的SCADA系统、故障录波等为电力运行提供了大量数据,这些数据中蕴藏着丰富的信息,对于分析生产运行状态、提供控制和优化策略、故障诊断以及发现和数据挖掘具有重要意义。就国网资阳供电公司而言,截止到2018年底,公司SCADA系统有10107个遥测点,按采样间隔5s计算,每年产生0.76TB数据(0.76TB= 12字节/帧?0.2帧/s?10107遥测点?86400s/天?365天。3)用电侧。为准确获取用户的用电数据,电力公司部署了大量的具有双向通信能力的智能电表,这些电表可以每隔5 min的频率向电网发送实时用电信息。
三、电网大数据挖掘带来的增值效益
未来智能电网环境下,家庭可能配备多种电能、电量监测设备,用以实现低成本的用电,并与电网的负载相匹配。例如,电热水器可能会选择夜间这种用电量低谷时段运行;空调会根据用户舒适度、电价以及电网负荷等参数实时自动调整。某种程度上,我们可以认为SCADA系统进入了普通家庭,用电环节的实时数据处理变得越来越重要。外部应用指利用电力行业大数据可获得的社会效益,主要包括以下方面。
1)、丰富增值服务
利用电力行业数据可给用户提供更加丰富的增值服务内容。例如,通过给用户提供其各月份分时明细用电视图,可让用户了解自身用电习惯并能根据需要进行调整,同时也使得电力收费过程更透明。随着无线M2M传感器和大数据分析的普及,智能恒温控制器等新型工具进入大型楼房和消费者家庭成为可能,未来这些技术将给用户带来很大的节能空间。
2)提供經济指导
作为重要经济先行数据,用电数据是一个地区经济运行的“风向标”,可作为投资决策者的参考依据。美国加州大学洛杉矶分校的研究者根据大数据理论,将人口调查信息、电力企业提供的用户实时用电信息和地理、气象等信息全部整合,设计了一款“电力地图”。该图以街区为单位,可以反映各时刻的用电量,并可将用电量与人的平均收入、建筑类型等信息进行比照。通过完善“电力地图”,能更准确地反应该区经济状况及各群体的行为习惯,以辅助投资者的决策,也可为城市和电网规划提供基础依据。
3)建立客户信用评级模型。
将客户的个人资料信息、缴费情况、缴费能力、经济实力、资本结构、经营效益、发展前景和社会信用记录等信息纳入信用评级模型。导出客户的违约概率,并转化成信用积分,从而根据积分分布制定相应的业务策略。
四、地市公司电网大数据挖掘存在的问题
一是数据获取较困难。目前,虽然大数据分析及数据挖掘方兴未艾,地市公司要开展数据分析,想要获取的这些数据今后均在省公司或国网公司,而国网公司对这些数据管理越来越严格。二是对这些数据的分析方向有待验证。基于大数据的分析目的就是我们根据这些数据的趋势变化给出一个合理的预测,让客户或自身从这些预测中获得价值。但是,这些大数据的分析的结果或数据的趋势最大的需求者是否还是电力公司?同时我们能得出的什么样的趋势分析还需要进一步讨论并验证。三是数据质量还有待提高。如果数据错误、过时或者片面,分析结果将是不正确的;而如果数据冗余、混乱,则会增加获取数据有效信息的难度,并使数据处理效率低下。因此,确保数据高质量、规范化、格式统一是大数据应用的基础。
五、结论
大数据已经成为科技界和产业界共同关注的热点。一个国家拥有数据的规模和运用数据的能力将成为综合国力的重要组成部分,对数据的占有和控制也将成为国家间和企业间新的争夺焦点。目前全球数据的存储和处理能力已远落后于数据的增长幅度。与大数据在商业及互联网领域的广泛研究和应用相比,大数据在智能电网建设的研究中还有待进一步加强。由于大数据的数据量和分布式的特点,使得传统的数据管理技术难以胜任这种海量数据,海量数据存储和数据并行处理技术将会成为电网大数据今后的发展方向。
一、概述
目前,大数据已成为学术界和产业界共同关注的研究主题,在很多领域获得了应用,具有广阔的应用前景。2011年5月,麦肯锡公司发布了关于大数据的调研报告《大数据:下一个前沿,竞争力、创新力和生产力》,文中充分阐明了大数据研究的地位以及将会给社会带来的价值,大数据研究已成为社会发展和技术进步的迫切需要。
在智能电网系统中,大数据产生于整个系统的各个环节。比如在用电侧,随着大量智能电表及智能终端的安装部署,电力公司和用户之间的交互行为迅猛增长,电力公司可以每隔一段时间获取用户的用电信息,从而收集了比以往粒度更细的海量电力消费数据,构成智能电网中用户侧大数据。通过对数据进行分析可以更好地理解电力客户的用电行为、合理地设计电力需求响应系统和短期负荷预测系统等。
二、电网大数据特性
电网中数据符合大数据的特点。电网中的大数据具备“4V”特征,即规模大(volume)、类型多(variety)、价值密度低(value)和变化快(velocity)。
电网中的大数据电网业务数据大致分为3类:一是电网运行和设备检测或监测数据;二是电力企业营销数据,如交易电价、售电量、用电客户等方面的数据;三是电力企业管理数据。根据数据的内在结构,这些数据可以进一步细分为结构化数据和非结构化数据。结构化数据主要包括存储在关系数据库中的数据,目前电力系统中的大部分数据是这种形式,主要包括视频监控、图形图像处理等产生的数据。在电力系统中,非结构化数据占到了智能电网数据的很大比重。结构化数据根据处理时限要求又可以划分为实时数据和准实时数据,比如电网调度、控制需要的数据是实时数据,需要快速而准确地处理;而大量的状态监测数据对实时性要求相对较低,可以作为准实时数据处理。
在电网中,大数据产生于电力系统的各个环节,包括:1)发电侧。随着大型发电厂数字化建设的发展,海量的过程数据被保存下来。2)输变电侧。基于电网的SCADA系统、故障录波等为电力运行提供了大量数据,这些数据中蕴藏着丰富的信息,对于分析生产运行状态、提供控制和优化策略、故障诊断以及发现和数据挖掘具有重要意义。就国网资阳供电公司而言,截止到2018年底,公司SCADA系统有10107个遥测点,按采样间隔5s计算,每年产生0.76TB数据(0.76TB= 12字节/帧?0.2帧/s?10107遥测点?86400s/天?365天。3)用电侧。为准确获取用户的用电数据,电力公司部署了大量的具有双向通信能力的智能电表,这些电表可以每隔5 min的频率向电网发送实时用电信息。
三、电网大数据挖掘带来的增值效益
未来智能电网环境下,家庭可能配备多种电能、电量监测设备,用以实现低成本的用电,并与电网的负载相匹配。例如,电热水器可能会选择夜间这种用电量低谷时段运行;空调会根据用户舒适度、电价以及电网负荷等参数实时自动调整。某种程度上,我们可以认为SCADA系统进入了普通家庭,用电环节的实时数据处理变得越来越重要。外部应用指利用电力行业大数据可获得的社会效益,主要包括以下方面。
1)、丰富增值服务
利用电力行业数据可给用户提供更加丰富的增值服务内容。例如,通过给用户提供其各月份分时明细用电视图,可让用户了解自身用电习惯并能根据需要进行调整,同时也使得电力收费过程更透明。随着无线M2M传感器和大数据分析的普及,智能恒温控制器等新型工具进入大型楼房和消费者家庭成为可能,未来这些技术将给用户带来很大的节能空间。
2)提供經济指导
作为重要经济先行数据,用电数据是一个地区经济运行的“风向标”,可作为投资决策者的参考依据。美国加州大学洛杉矶分校的研究者根据大数据理论,将人口调查信息、电力企业提供的用户实时用电信息和地理、气象等信息全部整合,设计了一款“电力地图”。该图以街区为单位,可以反映各时刻的用电量,并可将用电量与人的平均收入、建筑类型等信息进行比照。通过完善“电力地图”,能更准确地反应该区经济状况及各群体的行为习惯,以辅助投资者的决策,也可为城市和电网规划提供基础依据。
3)建立客户信用评级模型。
将客户的个人资料信息、缴费情况、缴费能力、经济实力、资本结构、经营效益、发展前景和社会信用记录等信息纳入信用评级模型。导出客户的违约概率,并转化成信用积分,从而根据积分分布制定相应的业务策略。
四、地市公司电网大数据挖掘存在的问题
一是数据获取较困难。目前,虽然大数据分析及数据挖掘方兴未艾,地市公司要开展数据分析,想要获取的这些数据今后均在省公司或国网公司,而国网公司对这些数据管理越来越严格。二是对这些数据的分析方向有待验证。基于大数据的分析目的就是我们根据这些数据的趋势变化给出一个合理的预测,让客户或自身从这些预测中获得价值。但是,这些大数据的分析的结果或数据的趋势最大的需求者是否还是电力公司?同时我们能得出的什么样的趋势分析还需要进一步讨论并验证。三是数据质量还有待提高。如果数据错误、过时或者片面,分析结果将是不正确的;而如果数据冗余、混乱,则会增加获取数据有效信息的难度,并使数据处理效率低下。因此,确保数据高质量、规范化、格式统一是大数据应用的基础。
五、结论
大数据已经成为科技界和产业界共同关注的热点。一个国家拥有数据的规模和运用数据的能力将成为综合国力的重要组成部分,对数据的占有和控制也将成为国家间和企业间新的争夺焦点。目前全球数据的存储和处理能力已远落后于数据的增长幅度。与大数据在商业及互联网领域的广泛研究和应用相比,大数据在智能电网建设的研究中还有待进一步加强。由于大数据的数据量和分布式的特点,使得传统的数据管理技术难以胜任这种海量数据,海量数据存储和数据并行处理技术将会成为电网大数据今后的发展方向。