论文部分内容阅读
摘 要:现代科学技术研究的体系正处于不断完善健全的阶段,大数据角度的信息分析正在不断地得到应用和更新,在这个变化过程中,积累大数据的速度逐步加快,大数据对于现代企业的可持续健康发展有着深远影响。为了能够提高现阶段我国供电企业在市场上的竞争力,有必要针对供电企业的大数据分析及管理应用模式进行优化。本篇文章就大数据分析的概念以及应用的意义展开阐述,意在制定更加科学合理的供电企业解决方案,力争实现我国供电企业在整体上的运作效率有所提升。
关键词:供电企业;大数据分析;处理应用
大数据又可以称之为海量数据,这些所有的数据在没有经过一定处理之前不具有任何方面的参考价值,根本无法作为辅助或者参考相关决策的根据,但是一旦这些数据经过一定程序恰当的分析和处理就能够做到将海量的数据高效转化为有着极高参考价值的有效数据,进一步提高供电企业的竞争力和社会服务水平。
一、电力行业大数据特征
供电企业的大数据特征是大数据技术、思想和理论在整个电力行业的具体实践,这其中提供了从大数据信息的采集、储存、处理、分析直到整理为可见展示的完整的一套解决办法。
(一)体量大
从体量上来看电力行业有着级别上的跃升,目前我国电网的信息化、智能化建设已经实现了大数据信息的实时传输和采集,其间隔数量级为秒数,数据总量在以指数形式的快速增长。但是针对所有海量数据的储存和应用,现在还存在着一些技术上的瓶颈,尚有部分数据的价值没有被挖掘出来[1]。
(二)类型多
供电企业大数据的类型主要包括半结构化、非结构化和结构化数据。伴随着基础信息系统的逐步完善,整体上来看,非结构化的大数据信息越来越多,比如有视频、音频、图片等。除此之外,为了保证电力供应的可靠性,国家电网公司也需要了解一定的气象数据、能源数据等一些外部数据,种种情况就造成了电网的大数据信息类型越来越复杂。
(三)价值密度低
大数据信息的价值是能够从海量的原始数据中发掘出有效的信息。举个例子来说,在输变电设备的检测系统所采集和储存的数据中,绝大多数都是正常运转的数据,只有极少的一部分存在异常的数据。而这些少数的异常数据则是判断设备运行状态的关键信息。
(四)处理速度快
在数据信息辅助和参考决策的方面,对初步的数据进行在线、实时的处理要求越来越精确。数据信息的处理速度至少需要能够满足制定决策的要求,在秒数级别内对海量的原始数据进行关联性分析,来支撑最终决策的确定。
(五)交互
供电行业中的国有企业正在经历着由“以电力生产为核心”向“以用户为核心”的角度变化,用户对供电企业服务的满意程度成为越来越关键的电力企业的考核标准,需求侧的管理才是未来国家推进信息化建设的最重要方向,因此,供电企业就可以通过大数据信息的分析与参考更好的了解到各电力用户的个性化要求[2]。
二、大数据处理平台
互联网时代下的社会民众日常生活与大数据信息分析应用的联系日益密切,几乎已经涉及到了交通、天气、电力、购物等各个模块,在数据应用过程中,通过分析不同类型的大数据信息,可以得出一些隐藏在海量原始数据之中的信息和模式。
(一)大数据处理平台的建立与完善
实际操作证明,通过对HDFS文件系统、Hadoop平台核心技术、Map Reduce分散算法的应用,更有利于满足我国现阶段电力行业的大数据储存、分析以及处理工作的要求。Hadoop是对于大数据信息框架构建的一个有着分散运算功能的开放型平台,其中包括著名的分散形数据处理结构、分散形数据储存系统、分布式文件整合系统,提供可伸缩、高效、可靠的分散形处理平台。
通过应用Hadoop技术,就可以实现供电企业采集运行产生的各类数据,同时还需要使用一定数量的电脑,将经过一定处理的数据储存在电脑内,为了提高数据信息整体保存的安全性,还需要做好处理后保留数据的备份工作,尽量避免因为计算机故障而导致数据丢失的问题发生,使数据处理工作的整体保存安全性得到提高。这个过程是必须要使用Hadoop平台,通过应用分散形处理技术,实现电力行业大数据信息的结构化处理提高整体运算系统的工作准确性。
在原始数据的批量处理任务模块中,Hadoop MapReduce技术扮演着极为重要的地位,但是必须注意到,这种技术也存在着一定程度上的局限性,每执行一次特定程序,都要在数据信息收集的背景下,结束执行任务,这种处理技术不适合应用在高迭代的运算工作中。
Spark是一种数据内存运算结构且有与之兼容的功能,其运算特性更适合迭代型运算,在数据函数运算后,不会直接将结果输出,只有减少执行任务的次数,才能够有效增加效率。由此可见,Spark更适合反复迭代型的运算方法和交叉对比式分析。
(二)大数据处理平台的意义
在电力行业的企业运行过程中大数据信息的分析,从客户注册、缴费支付(包括现金支付、银联支付、代为缴扣等)一直到核销对账的结束。所有类型的数据信息都储存在同一系统中,构成电力体系的营销大数据信息整合平台,使供电企业的数据管理更加方便快捷,同时也能够做到有效的分析和识别潜在销售风险,并及时制定和实施相对应的防范措施[3]。
三、大数据应用案例
为了适应我国现阶段电力行业的供电要求,针对大数据信息处理技术的优化是非常有必要的,只有这样才能进行更大規模数据信息的处理与解决。在构建Hadoop大数据信息平台的过程中,很多电力企业将销售电量的数据记录传送到Hadoop信息数据库中储存,分析其中的单位电量销售价格、电量供应峰值情况等。通过整理和统计用户的用电信息,可以快速了解得到每个供电企业客户的特征。通过分析大数据信息,可以针对电能进行精确性地营销,提高国家电网工作过程的安全性。
通过应用大数据信息分析技术,能够有效了解客户用电情况、电网故障情况、电流峰值情况等信息,从而判断各种类型的电力故障,提高电力检修效率和国家电网运行的整体效益,确保电力企业的经济效益稳步提高,确保电力设备运作安全性,提高电网电压的稳定性,要进一步完善这些目标,都需要大数据信息处理过滤技术的支持与应用。
结束语
实际应用证明,通过针对大数据信息的分析,确实有利于电力企业制定合理科学的发展方针,有利于提高我国电网整体的供电质量和运作效率。
参考文献
[1]刘寅.大数据技术在智能电网的应用.电子技术与软件工程,2018(8):167-167.
[2]刘玉芳,高骞,徐超,杨俊义,陈泰铭.电力大数据价值与应用需求分析.中国管理信息化,2018,21(20):54-56.
[3]赵宇震.大数据时代企业会计信息化的风险及措施分析.经贸时代,2018(19):108.
关键词:供电企业;大数据分析;处理应用
大数据又可以称之为海量数据,这些所有的数据在没有经过一定处理之前不具有任何方面的参考价值,根本无法作为辅助或者参考相关决策的根据,但是一旦这些数据经过一定程序恰当的分析和处理就能够做到将海量的数据高效转化为有着极高参考价值的有效数据,进一步提高供电企业的竞争力和社会服务水平。
一、电力行业大数据特征
供电企业的大数据特征是大数据技术、思想和理论在整个电力行业的具体实践,这其中提供了从大数据信息的采集、储存、处理、分析直到整理为可见展示的完整的一套解决办法。
(一)体量大
从体量上来看电力行业有着级别上的跃升,目前我国电网的信息化、智能化建设已经实现了大数据信息的实时传输和采集,其间隔数量级为秒数,数据总量在以指数形式的快速增长。但是针对所有海量数据的储存和应用,现在还存在着一些技术上的瓶颈,尚有部分数据的价值没有被挖掘出来[1]。
(二)类型多
供电企业大数据的类型主要包括半结构化、非结构化和结构化数据。伴随着基础信息系统的逐步完善,整体上来看,非结构化的大数据信息越来越多,比如有视频、音频、图片等。除此之外,为了保证电力供应的可靠性,国家电网公司也需要了解一定的气象数据、能源数据等一些外部数据,种种情况就造成了电网的大数据信息类型越来越复杂。
(三)价值密度低
大数据信息的价值是能够从海量的原始数据中发掘出有效的信息。举个例子来说,在输变电设备的检测系统所采集和储存的数据中,绝大多数都是正常运转的数据,只有极少的一部分存在异常的数据。而这些少数的异常数据则是判断设备运行状态的关键信息。
(四)处理速度快
在数据信息辅助和参考决策的方面,对初步的数据进行在线、实时的处理要求越来越精确。数据信息的处理速度至少需要能够满足制定决策的要求,在秒数级别内对海量的原始数据进行关联性分析,来支撑最终决策的确定。
(五)交互
供电行业中的国有企业正在经历着由“以电力生产为核心”向“以用户为核心”的角度变化,用户对供电企业服务的满意程度成为越来越关键的电力企业的考核标准,需求侧的管理才是未来国家推进信息化建设的最重要方向,因此,供电企业就可以通过大数据信息的分析与参考更好的了解到各电力用户的个性化要求[2]。
二、大数据处理平台
互联网时代下的社会民众日常生活与大数据信息分析应用的联系日益密切,几乎已经涉及到了交通、天气、电力、购物等各个模块,在数据应用过程中,通过分析不同类型的大数据信息,可以得出一些隐藏在海量原始数据之中的信息和模式。
(一)大数据处理平台的建立与完善
实际操作证明,通过对HDFS文件系统、Hadoop平台核心技术、Map Reduce分散算法的应用,更有利于满足我国现阶段电力行业的大数据储存、分析以及处理工作的要求。Hadoop是对于大数据信息框架构建的一个有着分散运算功能的开放型平台,其中包括著名的分散形数据处理结构、分散形数据储存系统、分布式文件整合系统,提供可伸缩、高效、可靠的分散形处理平台。
通过应用Hadoop技术,就可以实现供电企业采集运行产生的各类数据,同时还需要使用一定数量的电脑,将经过一定处理的数据储存在电脑内,为了提高数据信息整体保存的安全性,还需要做好处理后保留数据的备份工作,尽量避免因为计算机故障而导致数据丢失的问题发生,使数据处理工作的整体保存安全性得到提高。这个过程是必须要使用Hadoop平台,通过应用分散形处理技术,实现电力行业大数据信息的结构化处理提高整体运算系统的工作准确性。
在原始数据的批量处理任务模块中,Hadoop MapReduce技术扮演着极为重要的地位,但是必须注意到,这种技术也存在着一定程度上的局限性,每执行一次特定程序,都要在数据信息收集的背景下,结束执行任务,这种处理技术不适合应用在高迭代的运算工作中。
Spark是一种数据内存运算结构且有与之兼容的功能,其运算特性更适合迭代型运算,在数据函数运算后,不会直接将结果输出,只有减少执行任务的次数,才能够有效增加效率。由此可见,Spark更适合反复迭代型的运算方法和交叉对比式分析。
(二)大数据处理平台的意义
在电力行业的企业运行过程中大数据信息的分析,从客户注册、缴费支付(包括现金支付、银联支付、代为缴扣等)一直到核销对账的结束。所有类型的数据信息都储存在同一系统中,构成电力体系的营销大数据信息整合平台,使供电企业的数据管理更加方便快捷,同时也能够做到有效的分析和识别潜在销售风险,并及时制定和实施相对应的防范措施[3]。
三、大数据应用案例
为了适应我国现阶段电力行业的供电要求,针对大数据信息处理技术的优化是非常有必要的,只有这样才能进行更大規模数据信息的处理与解决。在构建Hadoop大数据信息平台的过程中,很多电力企业将销售电量的数据记录传送到Hadoop信息数据库中储存,分析其中的单位电量销售价格、电量供应峰值情况等。通过整理和统计用户的用电信息,可以快速了解得到每个供电企业客户的特征。通过分析大数据信息,可以针对电能进行精确性地营销,提高国家电网工作过程的安全性。
通过应用大数据信息分析技术,能够有效了解客户用电情况、电网故障情况、电流峰值情况等信息,从而判断各种类型的电力故障,提高电力检修效率和国家电网运行的整体效益,确保电力企业的经济效益稳步提高,确保电力设备运作安全性,提高电网电压的稳定性,要进一步完善这些目标,都需要大数据信息处理过滤技术的支持与应用。
结束语
实际应用证明,通过针对大数据信息的分析,确实有利于电力企业制定合理科学的发展方针,有利于提高我国电网整体的供电质量和运作效率。
参考文献
[1]刘寅.大数据技术在智能电网的应用.电子技术与软件工程,2018(8):167-167.
[2]刘玉芳,高骞,徐超,杨俊义,陈泰铭.电力大数据价值与应用需求分析.中国管理信息化,2018,21(20):54-56.
[3]赵宇震.大数据时代企业会计信息化的风险及措施分析.经贸时代,2018(19):108.