论文部分内容阅读
摘要:现如今,科学技术不断的创新,促进智能电网的建设,大量的智能电表及其配套监测设备投入使用,种类繁多的电力大数据被及时采集,其中包括电力生产过程中的数据资料、音频资料和影像資料等。
关键词:电力大数据;用户用电行为
引言
对大数据技术进行了详细阐述,在此基础上对用户用电行为分析中涉及的聚类分析法、模糊C均值聚类算法以及云计算法等进行了介绍,希望能对今后基于电力大数据的用户用电行为分析工作提供借鉴。
1大数据技术
大数据的处理过程比较复杂,需要从不同类型的数据中“去粗存精”“去冗分类”,最终获得有价值的信息,整个过程需要经过多个处理阶段。如今大数据处理模型中比较经典的是UsamaFayyad等设计的多阶段处理模型,其中包含了数据采集、预处理、数据管理与存储以及数据分析等各个环节步骤。通常情况下,可以将大数据采集分为基础支撑层以及智能感知层。大数据采集技术主要包含感知技术、智能识别技术、大数据接入和传输技术以及大数据压缩技术等。所谓的大数据预处理是指对大数据进行抽取、分辨并予以清洗等操作。因得到的数据可能类型以及结构比较多,所以抽取数据的过程是将复杂的数据转化成便于处理的或者是单一的结构,以便对其快速地进行分析处理,对于大数据中没有利用价值的内容,需要对其进行“去噪”处理。对大数据进行存储及处理时,需要用到储存器将采集所得的数据存储起来,并建立对应的数据库,同时开展管理以及调用工作,解决大数据可表示、可存储等方面的问题。大数据的存储及管理技术包含了大数据的数据组织技术、存储技术、数据库技术和可视化技术等方面的关键技术。目前比较常用的大数据存储和管理方法主要有Tachyon、QFS(Quant-castFileSystem)、HDFS(HadoopDistributedFileSystem)和ClusterFS等,其中HDFS是一种能够支持Hadoop计算框架的分布式大数据存储系统,具备可扩展性、容错性以及高并发性,同时能够在廉价的服务器设备上运行,是目前使用比较广泛的大数据存储系统。所谓数据挖掘是指“数据库中的知识发现(KDD)”,在此过程中,前面的几个步骤都是为开展数据分析工作做好相应的准备。而数据挖掘过程是提取隐藏其中的潜在知识以及信息的过程。以往所用到的数据分析方法主要分为统计法、机器学习法、数据库法以及神经网络法等。尽管可以将以往的分析方法应用到大数据领域,但是在集合规模比较大的数据时具有一定的局限性,这时候就需要使用云计算技术,在多台计算机上分解大数据的挖掘任务,以此有效增强数据的挖掘效率。大数据处理的最后一个环节是知识成果的展示和使用。如果难以正确显示数据分析所得的结果,就会对决策者产生误导。作为大数据最有力的展示方式,数据可视化技术可以分为基于图像的可视化技术和基于集合、图标的可视化技术等。目前大数据技术正逐渐广泛应用于智慧城市建设、在线社交网络、智慧医疗健康以及智能电网等各个方面。
2电力大数据分析与用户用电行为研究
2.1用户分类
传统的电力用户分类是根据用户的用电电压等级与用电模式不同进行分类,大致分为:工业用电、农业用电、商业用电和居民用电。其中工业用电可细分为大工业用电、普通工业用电和非工业用电,大工业用电电压等级较高,一般为10kV、35kV或110kV,非工业用电一般指政府机关、科研单位和学校用电,电压等级一般不超过10kV,普通工业用电的电压等级介于大工业用电和非工业用电之间。农业用电、商业用电和居民用电的电压等级较低,一般不超过10kV,甚至不满1kV。不同类型的电力用户对电压等级要求不同,对电能质量要求也不同。基于电力大数据的电力用户分类主要是运用电力大数据内部包含的信息,并结合一定的数据分析算法对电力用户进行分类。常见的分类方法是运用电力大数据中的数据信息作出相应的曲线,并结合曲线变化的影响因素以及模糊算法、聚类算法和最小二乘法进行分类。回归方法等算法对电力用户进行分类,如无监督的层次聚类、k-means聚类和自组织神经网络等,以及有监督的KNN、支撑向量机和决策树等方法。此外还可以运用逆向分析的方法,从不同类型用户的特点出发,根据用户特点运用熵权法分析用户电力数据的特点以及各部分数据的权重,最后根据求得的数据特点在电力大数据中找到相应特点的数据,确定该部分数据的用户类别。基于电力大数据的用户分类方法更具科学性,分类结果更加准确,具有坚强的理论支撑。对电力用户进行恰当的分类,可以使电网公司根据用户分类不同提供更具针对性的服务,有助于实现电力行业的资源优化配置,此外对用户的准确分类使用户用电行为分析更加准确,用户特征更具代表性。
2.2用户用电行为影响因子确定
(1)自我影响因子。自我影响因子主要是指由于用户自身原因对用户用电行为产生影响的影响因子,一般涉及用户的用电计划变化、自身重大用电事故等,这类影响因子可以根据用户的历史用电数据变化或用户的用电计划变化分析得出,在用户的用电计划未知的情况下可以将足够大的历史用电数据进行一些分析计算,预测用户的用电计划。(2)自然环境影响因子。自然环境影响因子是指用户的用电行为受到自然环境变化的影响,主要包括温度、湿度、风力、天气以及季节的变化对用户用电行为的影响,这类影响因子结合用户的用电行为曲线与气象曲线对比得出,添加恰当的数理分析方法可以筛选出电力大数据中受自然环境影响因子影响的电力数据。(3)社会环境影响因子。社会环境影响因子主要包括国内节假日以及重大国家事件对用户用电行为的影响,如春节、黄金周、APEC和十九大会议等对用户行为的影响。由于此类影响因子的随机性与不确定性因素较大,因此该类影响因子有时需要手动选择并筛选。分析可能影响用户用电行为的影响因子,并对不同种类的影响因子进行准确的筛选可以使电力数据更具代表性,使基于电力大数据的用户用电行为分析结果更加特性鲜明,用户用电行为特征更加明显,基于用户用电行为特征的分析预测更加准确,更有利于实现电网资源的优化配置。
2.3用户用电行为分析
电力大数据的用户用电行为分析比较热门的研究包括:电力用户的分类及细分建模研究、电力用户用电负荷研究、电网设备状态预警与故障率预测、电价与激励下的电力用户响应行为研究等。用户用电行为的分析主要是借助电力大数据分析平台,将平台采集到的电力大数据进行及时分类存储,选定某一特定类型的用户用电数据进行研究。研究一类用户用电行为时首先通观整体数据,作出该类数据的用电量、有功、电压和电流等方面的用电曲线图,分析数据的总体特征,然后剔除不同影响因子下的数据,如剔除周末、节假日和重大事件日的数据,再对数据进行详细的分析研究,最后对剔除影响因子后的数据进行月、季、年分段,比较各段时间数据的特性。在分析用户用电行为时,可结合负荷分析方法、聚类算法、负荷预测算法和回归方法等对数据进行分析研究,寻找数据间存在的联系与规律,建立不同负荷类型的用户模型,对用户用电行为进行全面分析预测。
结语
总而言之,电力行业的数据价值高且数据量比较大,提高数据的利用率能够有效提升电力企业的营利水平,无论将其应用于行业内还是行业外,都会带来新的发展机遇。
参考文献
[1]俞海淼,周海珠,忻闻.崇明岛风力资源分析与评价[J].可再生能源,2018,26(3):76-79.
[2]刘苏云,王笛,蒋丹,等.基于场景概率的风电机组的选址和定容[J].电气自动化,2018,36(5):38-40.
关键词:电力大数据;用户用电行为
引言
对大数据技术进行了详细阐述,在此基础上对用户用电行为分析中涉及的聚类分析法、模糊C均值聚类算法以及云计算法等进行了介绍,希望能对今后基于电力大数据的用户用电行为分析工作提供借鉴。
1大数据技术
大数据的处理过程比较复杂,需要从不同类型的数据中“去粗存精”“去冗分类”,最终获得有价值的信息,整个过程需要经过多个处理阶段。如今大数据处理模型中比较经典的是UsamaFayyad等设计的多阶段处理模型,其中包含了数据采集、预处理、数据管理与存储以及数据分析等各个环节步骤。通常情况下,可以将大数据采集分为基础支撑层以及智能感知层。大数据采集技术主要包含感知技术、智能识别技术、大数据接入和传输技术以及大数据压缩技术等。所谓的大数据预处理是指对大数据进行抽取、分辨并予以清洗等操作。因得到的数据可能类型以及结构比较多,所以抽取数据的过程是将复杂的数据转化成便于处理的或者是单一的结构,以便对其快速地进行分析处理,对于大数据中没有利用价值的内容,需要对其进行“去噪”处理。对大数据进行存储及处理时,需要用到储存器将采集所得的数据存储起来,并建立对应的数据库,同时开展管理以及调用工作,解决大数据可表示、可存储等方面的问题。大数据的存储及管理技术包含了大数据的数据组织技术、存储技术、数据库技术和可视化技术等方面的关键技术。目前比较常用的大数据存储和管理方法主要有Tachyon、QFS(Quant-castFileSystem)、HDFS(HadoopDistributedFileSystem)和ClusterFS等,其中HDFS是一种能够支持Hadoop计算框架的分布式大数据存储系统,具备可扩展性、容错性以及高并发性,同时能够在廉价的服务器设备上运行,是目前使用比较广泛的大数据存储系统。所谓数据挖掘是指“数据库中的知识发现(KDD)”,在此过程中,前面的几个步骤都是为开展数据分析工作做好相应的准备。而数据挖掘过程是提取隐藏其中的潜在知识以及信息的过程。以往所用到的数据分析方法主要分为统计法、机器学习法、数据库法以及神经网络法等。尽管可以将以往的分析方法应用到大数据领域,但是在集合规模比较大的数据时具有一定的局限性,这时候就需要使用云计算技术,在多台计算机上分解大数据的挖掘任务,以此有效增强数据的挖掘效率。大数据处理的最后一个环节是知识成果的展示和使用。如果难以正确显示数据分析所得的结果,就会对决策者产生误导。作为大数据最有力的展示方式,数据可视化技术可以分为基于图像的可视化技术和基于集合、图标的可视化技术等。目前大数据技术正逐渐广泛应用于智慧城市建设、在线社交网络、智慧医疗健康以及智能电网等各个方面。
2电力大数据分析与用户用电行为研究
2.1用户分类
传统的电力用户分类是根据用户的用电电压等级与用电模式不同进行分类,大致分为:工业用电、农业用电、商业用电和居民用电。其中工业用电可细分为大工业用电、普通工业用电和非工业用电,大工业用电电压等级较高,一般为10kV、35kV或110kV,非工业用电一般指政府机关、科研单位和学校用电,电压等级一般不超过10kV,普通工业用电的电压等级介于大工业用电和非工业用电之间。农业用电、商业用电和居民用电的电压等级较低,一般不超过10kV,甚至不满1kV。不同类型的电力用户对电压等级要求不同,对电能质量要求也不同。基于电力大数据的电力用户分类主要是运用电力大数据内部包含的信息,并结合一定的数据分析算法对电力用户进行分类。常见的分类方法是运用电力大数据中的数据信息作出相应的曲线,并结合曲线变化的影响因素以及模糊算法、聚类算法和最小二乘法进行分类。回归方法等算法对电力用户进行分类,如无监督的层次聚类、k-means聚类和自组织神经网络等,以及有监督的KNN、支撑向量机和决策树等方法。此外还可以运用逆向分析的方法,从不同类型用户的特点出发,根据用户特点运用熵权法分析用户电力数据的特点以及各部分数据的权重,最后根据求得的数据特点在电力大数据中找到相应特点的数据,确定该部分数据的用户类别。基于电力大数据的用户分类方法更具科学性,分类结果更加准确,具有坚强的理论支撑。对电力用户进行恰当的分类,可以使电网公司根据用户分类不同提供更具针对性的服务,有助于实现电力行业的资源优化配置,此外对用户的准确分类使用户用电行为分析更加准确,用户特征更具代表性。
2.2用户用电行为影响因子确定
(1)自我影响因子。自我影响因子主要是指由于用户自身原因对用户用电行为产生影响的影响因子,一般涉及用户的用电计划变化、自身重大用电事故等,这类影响因子可以根据用户的历史用电数据变化或用户的用电计划变化分析得出,在用户的用电计划未知的情况下可以将足够大的历史用电数据进行一些分析计算,预测用户的用电计划。(2)自然环境影响因子。自然环境影响因子是指用户的用电行为受到自然环境变化的影响,主要包括温度、湿度、风力、天气以及季节的变化对用户用电行为的影响,这类影响因子结合用户的用电行为曲线与气象曲线对比得出,添加恰当的数理分析方法可以筛选出电力大数据中受自然环境影响因子影响的电力数据。(3)社会环境影响因子。社会环境影响因子主要包括国内节假日以及重大国家事件对用户用电行为的影响,如春节、黄金周、APEC和十九大会议等对用户行为的影响。由于此类影响因子的随机性与不确定性因素较大,因此该类影响因子有时需要手动选择并筛选。分析可能影响用户用电行为的影响因子,并对不同种类的影响因子进行准确的筛选可以使电力数据更具代表性,使基于电力大数据的用户用电行为分析结果更加特性鲜明,用户用电行为特征更加明显,基于用户用电行为特征的分析预测更加准确,更有利于实现电网资源的优化配置。
2.3用户用电行为分析
电力大数据的用户用电行为分析比较热门的研究包括:电力用户的分类及细分建模研究、电力用户用电负荷研究、电网设备状态预警与故障率预测、电价与激励下的电力用户响应行为研究等。用户用电行为的分析主要是借助电力大数据分析平台,将平台采集到的电力大数据进行及时分类存储,选定某一特定类型的用户用电数据进行研究。研究一类用户用电行为时首先通观整体数据,作出该类数据的用电量、有功、电压和电流等方面的用电曲线图,分析数据的总体特征,然后剔除不同影响因子下的数据,如剔除周末、节假日和重大事件日的数据,再对数据进行详细的分析研究,最后对剔除影响因子后的数据进行月、季、年分段,比较各段时间数据的特性。在分析用户用电行为时,可结合负荷分析方法、聚类算法、负荷预测算法和回归方法等对数据进行分析研究,寻找数据间存在的联系与规律,建立不同负荷类型的用户模型,对用户用电行为进行全面分析预测。
结语
总而言之,电力行业的数据价值高且数据量比较大,提高数据的利用率能够有效提升电力企业的营利水平,无论将其应用于行业内还是行业外,都会带来新的发展机遇。
参考文献
[1]俞海淼,周海珠,忻闻.崇明岛风力资源分析与评价[J].可再生能源,2018,26(3):76-79.
[2]刘苏云,王笛,蒋丹,等.基于场景概率的风电机组的选址和定容[J].电气自动化,2018,36(5):38-40.