论文部分内容阅读
线路损耗,简称线损,是电能通过输电线路传输而产生的能量损耗。线损率的大小集中反映电力公司电网的规划、检修、调度、营销水平。线损是电网发展的重要经济技术指标,降低线损能显著提升电力公司经济效益。传统的线损分析系统基于关系数据库Oracle架构,系统在处理电压电表等海量电网运行数据计算电网线损时,在数据同步、数据存储、数据处理、数据反馈等环节存在效率低下,无法满足线损应用需求的问题。迫切需要研究新型的线损系统处理架构。本文为了解决上述线损系统分析的主要问题,在以下两方面作了研究工作:1、基于Hadoop技术的线损分析系统分析与设计:在研究Hadoop大数据技术和线损分析业务基础之上,对系统功能进行总体和详细设计。1)、设计了基于分布式并行抽取技术Sqoop的电网台帐及运行数据的数据集成方法,实现电网线损分析数据从关系数据库到分布式数据仓库的快速抽取与集成。2)、在Hadoop组件Hive和HBase上,设计了行列并存、行列自动转换的电网线损数据的存储结构,满足了电网线损分析业务的定时批量计算和即时查询的计算需求。3)、设计了基于模版技术的线损计算任务编排方法,实现线损计算流程和业务计算逻辑的松耦合,并在分布式数据仓库Hive上实现了线损计算的并行化运行。4)、设计了同步(数据即时回写)及异步(服务调用)相结合的线损分析结果数据数据反馈方法,解决了海量结果数据及小批量结果数据的反馈问题。2、线损系统实现及测试:在线损分析功能总体设计及详细设计基础上,利用开源Hadoop技术,搭建了分布式计算集群,实现了线损分析系统,并对系统进行了测试及验证,测试结果表明,基于Hadoop技术的电网线损分析系统,相比于基于传统关系数据库架构的计算系统性能提升显著,有6倍的性能提升。通过上述研究工作,本文设计并实现的基于大数据技术Hadoop的线损分析系统有效解决了线损分析处理效率及时效性不满足业务需求的问题,为电网线损精益化管理提供了信息系统技术支撑。