电网仿真计算文件多层索引设计

来源 :中国电气工程学报 | 被引量 : 0次 | 上传用户：zfx523

【摘要】

：

【作者】

：

张志强

【出处】

：

中国电气工程学报

【发表日期】

：

2019年9期

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

　　【摘要】随着电力系统仿真计算产生的数据量逐渐增多，对数据存储的要求逐渐提升，电力系统人员希望采用大数据平台对海量电网仿真计算文件进行存储。同时海量的电网仿真计算文件在 Hadoop 平台上的检索也很困难，给研究带来了诸多难题。本文分析 Hadoop 的分布式文件系统在存储和处理海量的电网仿真计算文件时出现的问题，并分析出现这些问题的原因。然后介绍电网仿真计算文件多层索引的总体架构设计，阐述了电网仿真计算文件多层索引技术的总体模块设计，以及各个模块的功能设計。包括对电网仿真计算文件的合并设计，以及电网仿真计算文件的全局索引和局部索引的设计，为电网仿真计算文件多层索引技术的实现奠定基础。
　　关键词：电网;多层索引技术;架构设计
　　1、前言
　　随着电力系统仿真计算产生的数据量逐渐增多，对数据存储的要求逐渐提升，电力系统人员希望采用大数据平台对海量电网仿真计算文件进行存储。在众多大数据平台中，Hadoop 采用多台廉价计算机组成集群，并具有良好的扩展性和容错性，成为众多项目首选的大数据处理平台。HDFS是 Hadoop的分布式文件系统，HDFS 有一个名字节点（Name Node）和多个数据节点（Data Node）。
　　文件数据经过分块后存储在 HDFS 的数据节点中，每一个文件在名字节点中都保存有 metadata 信息。所以当电网仿真计算产生的数据结果文件有 10million 时，由于每个 block 块默认大小为 64M，对于文件大小远小于 64MB 的电网仿真计算文件来说，每一个电网仿真计算文件将对应一个 block 块，将占用名字节点 3G 内存。如果文件的数量再多一些的话，将会超过名字节点所能承受的极限，因为 Hadoop 是由若干普通廉价的计算机组成的集群。同时海量的电网仿真计算文件在 Hadoop 平台上的检索也很困难，给研究带来了诸多难题。
　　2、系统总体设计
　　电网海量仿真计算文件多层索引技术是对海量的电网仿真计算文件在 Hadoop 平台下处理前的预处理技术，该项技术包括合并电力系统仿真计算数据文件模块、Hadoop 自定义输入分片模块和建立电网仿真计算文件多层索引模块。电网海量仿真计算多层索引技术在 Hadoop 平台下的模块图如图 1 所示。
　　电网仿真计算文件通过合并具有相同文件类型的文件来大量减小电网仿真计算文件的数量，从而达到减小 Name Node 节点内存占用的效果，并通过自定义 Hadoop输入分片使其特殊的数据结构能够在Hadoop分布式文件系统进行分片处理，图中“#”作为电网仿真计算文件在Hadoop平台进行分布式处理的分隔符。为了方便文件检索与访问，进一步为所有电力系统仿真计算文件建立基于Trie树数据结构的多层索引。将电网仿真计算文件的合并条件“文件类型”作为仿真计算文件的全局索引，在此基础上进一步建立基于Trie树的数据结构的电网仿真计算文件名字的局部一级索引，并通过一级索引Trie树的分裂建立电网仿真计算文件名首字母到一级索引分片的映射，电网仿真计算文件名字的首字母即为其局部二级索引。
　　为了实现项目需求，解决海量的电力系统仿真计算文件在分布式文件系统上进行数据处理时的NameNode节点内存占用过多问题以及提升电网仿真计算文件检索效率的问题，设计了以下几个模块对数据文件进行处理：合并电网仿真计算文件模块，自定义Hadoop输入分片模块，和建立电网仿真计算文件的多层索引模块。
　　合并电力系统仿真计算文件模块负责将海量的电网仿真计算文件通过合并算法进行合并。通过调研电网仿真计算文件的数据特点，可根据电网仿真计算文件的文件类型进行文件的合并。自定义Hadoop输入分片文件通过重写Hadoop的InputFormat类，自定义适用于电网仿真计算文件的split分隔符。建立多层索引模块为电力系统仿真计算结果文件建立索引，其中全局索引是文件类型，局部索引借鉴Trie树的数据结构，为电网仿真计算文件的文件名建立Trie树索引。这样设计的好处是利用Trie树空间换时间思想减小检索时间开销。为了减小电网仿真计算文件索引臃肿带来的检索困难问题，接着为其建立以电网仿真计算文件名首字母的局部二级索引，配合进行检索。
　　3、电网仿真计算文件合并设计
　　通过调研分析，对电网仿真计算文件进行适当的合并可以有效减小分布式文件系统中主节点的内存占用。借鉴相关技术中的合并思想，本课题通过自定义的合并算法对海量电网仿真计算文件进行合并。
　　由于BPA， PSASP， PSCAD等电力系统仿真计算软件多种多样，电力系统仿真计算的模型也是多种多样，其产生的大量的电力系统方针计算数据可以称之为海量。由电网仿真计算文件数据可得，电力系统仿真计算主要包括潮流计算和暂态稳定计算，其产生的结果文件皆为单个文件体积很小的小文件。通过将这些电网仿真计算文件进行适当的合并，可以从宏观上减少需要分布式文件系统处理的文件数目，进而减小Block块数目，那么它在NameNode节点上的元数据信息就得到减小，从而减小其占用的内存。
　　通过分析电力系统仿真计算数据文件的文件类型，发现有一些不同格式的文件，例如JPg.格式、 .txt格式等等，按照仿真计算数据文件的文件类型进行合并不仅能够减小在HDFS中NameNode节点的内存消耗，还可以将文件类型作为全局索引配合多层索引的建立，从而提高电网仿真计算结果文件的检索效率。
　　电网仿真计算文件具体合并过程如下，新建一个文件路径印用来存放合并后的电网仿真计算文件，新建一个字符串数组fl用来存放要合并的电网仿真计算文件，遍历印路径下的所有电网仿真计算文件，读取它们的后缀名进而得到电网仿真计算文件的文件类型，创建文件类型对应的文件夹，并将属于该类型的电网仿真计算文件进行集合，具体流程如图2所示，判断该电网仿真计算文件的文件类型，判断是否新建了该类型的字符串数组，若存在，则放入该字符串数组;若不存在，则新建该类型的文件集合。直到所有电网仿真计算文件被处理完成，即可完成合并操作。　　4、电网仿真计算文件索引设计
　　电网仿真计算数据文件按照文件的类型进行合并后，使用Hadoop的分布式文件系统进行存储和数据处理。HDF S的原理是将需要处理的文件块自动分成若干块，这些数据块分布在各个数据节点上。当有一些需求需要检索电网仿真计算数据文件时，由于合并后的仿真计算文件与原仿真计算文件的对应以及海量的文件仅凭文件类型很难进行检索，所以需要为其设计建立索引，方便进行快速检索。
　　如图3所示是电网仿真计算文件的多层索引模块图，其中电网仿真计算文件根据文件后缀名进行合并后交给HDFS进行处理，合并后的电网仿真计算文件通过block分块进而存储在数据节点上，NameNode节点中存储着每个合并后的电网仿真计算文件数据块的元数据信息。同时，电网仿真计算文件的合并依据：电网仿真计算文件的文件类型将作为全局索引，也将存储于主节点的内存中。为减小内存压力，电网仿真计算文件的局部索引存储于数据节点的内存中。
　　5、结论
　　本文分析了 Hadoop 的分布式文件系统在存储和处理海量的电网仿真计算文件时出现的问题，并分析出现这些问题的原因。然后介绍电网仿真计算文件多层索引的总体架构设计，阐述了电网仿真计算文件多层索引技术的总体模块设计，以及各个模块的功能设计。包括对电网仿真计算文件的合并设计，以及电网仿真计算文件的全局索引和局部索引的设计，为电网仿真计算文件多层索引技术的实现奠定基础。
　　参考文献
　　[1]黄阮明，黄一超，费斐， et al. 电网规划仿真自动潮流计算软件的设计[J]. 工业控制计算机， 2018， v.31（06）：53-54.
　　[2]吴苏波. 变电站仿真培训系统电网计算模块的开发[J]. 广东科技， 2007（s2）：123-124.
　　[3]梁文腾，乔卉，龚庆武， et al. 可扩展性虚拟配电网仿真系统设计[J]. 電网技术， 2010（8）：102-107.
　　[4]姜文立. 论调度系统大电网离线仿真计算基础工作相关问题[J]. 华中电力， 2010， 23（3）：21-23.
　　[5]Steinmacher I ， Wiese I S ， Chaves A P ， et al. Newcomers Withdrawal in Open Source Software Projects： Analysis of Hadoop Common Project[C]// Brazilian Symposium on Collaborative Systems. IEEE Computer Society， 2012.
　　[6]Cai X ， Li F ， Li P ， et al. SLA-aware energy-efficient scheduling scheme for Hadoop YARN[J]. Journal of Supercomputing， 2017， 73（8）：3526-3546.
　　[7]张海，马建红. 基于HDFS的小文件存储与读取优化策略[J]. 计算机系统应用， 2014（5）：34-36.
　　[8]段隆振，洪新利，邱桃荣. 基于MapFile的HDFS小文件存取优化[J]. 南昌大学学报（工科版）， 2017， 39（2）：175-178.
　　[9]赵晓南，曾雷杰，李战怀. 一种基于块级的存储性能优化方法[J]. 计算机科学， 2009， 36（6）：129-132.

其他文献

探究电网调度运行中的故障与处理策略

【摘要】现代社会的发展过程中，随着科学技术的不断进步，电力系统也发挥着重要作用，人们在工业生产及日常生活中，都对电力存在大量的需求，这就要求电网的布置范围要不断扩大。因此，提高电力系统的安全平稳调度，保证电力系统运行的各个环节的可靠程度，就要加强对电网运行的控制与调整，最大限度地保证电网运行的安全与可靠。一旦在电网调度过程中，出现故障问题，就要根据电网的运行状态及时提供解决对策，保证电力系统的顺利

期刊

火电厂汽轮机安装工艺分析

摘要：伴随着经济的发展和社会的进步，人们对电力资源的需求不断增大，也使得生产电力资源的方式和工艺受到了广泛关注，其中，作为主要电力资源产出形式之一的火力发电要想有效提高效率，就要对机组安装有明确且完整的认知，保证具体工艺流程符合安全标准。本文结合案例对火电厂汽轮机安装准备工作、注意事项以及工艺流程进行了集中分析，以供参考。　　关键词：火电厂;汽轮机;安装;流程　　中图分类号：TK266 文献标识

期刊

智能电网调度控制系统安全防护技术探讨

【摘要】随着国家经济与科技的发展，我国电网事业得到了快速发展。智能电网调度系统是指依靠计算机技术所构建的能够全方位对于电网系统进行智能调度和可控制的防护体系，这项技术能够促进电网体系更加高效、安全地运行。本文针对智能电网调度控制系统安全防护技术进行了分析，以供参考。　　【关键词】智能电网调度;控制系统;安全防护技术　　随着社会的发展，国家现在极度重视网络安全方面的问题，成立了专门的部门进行规划管理

期刊

配电自动化设备在电力调度系统的应用

摘要：现阶段，随着社会的发展，我国用电量的快速增长和对电能质量要求的日益严格，自动化、信息化、智能化设备在电力调度中的应用已成为一种趋势。　　关键词：配电自动化设备;电力调度系统;应用　　引言　　要想更有效地发挥电力系统的功能，就必须要对用户侧用电设备、通信裝置、网络管理软件、输电网络、测控系统等多个模块进行合理调度。2011年以来，中国大力建设第二批配电自动化项目，为配电网调度自动化系统的发展注

期刊

浅述电网运营监控平台建设中数据挖掘技术的应用

【摘要】现阶段我国经济及科学技术已经得到了高速发展，并带动了我国电力行业、电网运营行业等的发展，其中电网运营的发展速度最快。电网运营中需要进行监督及控制，以保证电网运营效率，从而创造出更多的经济效益及社会效益，故建设电网运营监控平台是必要和重要的，而数据挖掘技术则是现时代较为先进的电网运营控制平台建设技术，理应得到相关工作者的重视及关注。基于此，本文分析了电网运营监控平台建设中数据挖掘技术的应用。

期刊

电力调度运行中的调度安全风险及防护措施

摘要：现阶段，随着社会的发展，我国的电力工程的发展也日新月异。人们日常生活以及工业生产用电的日益广泛在促进电力行业发展的同时也给电力调度带来了挑战，如何对电力调度中的安全隐患问题进行防护也成为电力企业要面临的重要内容。电力调度运行中的安全风险防护对于电力系统的安全运行具有重要意义，只有将电力调度中的安全隐患问题进行合理有效的防护，才能避免电力调度过程中安全事故的发生，进而在规避电力调度运行风险的情

期刊

浅谈可视化运维在网络管理中的应用实践

摘要：信息系統与网络已经建设的较为完善，但是网络中还是会经常出现一些疑难的故障。由于网络中有大量的业务在运行，所以保障网络安全、稳定、高效运行是目前信息系统终端运维的目标，要做到这样就需要透视网络，对网络的运行信息系统与可视化分析的研发有一个详细的了解，能够及发现并准确定位网络中行为不正常的终端，对人网设备进行准人控制。通过网络分析的手段和终端技术相结合，全面监控，使信息网络系统可以做到纲举目张，

期刊

电厂热能动力锅炉设计问题及改进策略

摘要：社会生产力的不断提高，导致生产所需要的能源越来越多。为了匹配我国的社会经济发展，必须要提高能源供应效率，而目前的社会现状是，不可再生能源急剧下降，無法满足于当今的生产力水平。想要走出困境，提高生产力，就必须要运用新能源。当今我国热能动力工程发展尤为迅速，不但提升了电厂锅炉的运转效率，还为能源的供应提供了稳定输出。　　关键词：热能动力工程;电厂锅炉;运用分析　　1 热能动力工程运用的概述　　首

期刊

电力配网技术改造现状及网络优化策略研究

摘要：受国民生产总值提高的影响，居民生活水平日益提高，居民開始关注用电安全问题，提出高质量、安全稳定用电的新要求。供电企业为满足用电客户的要求，积极地对电力配网技术进行优化改造工作，以确保电力配网可以满足现阶段人们对供电质量的要求。然而在实际电力配网技术的改造期间，会出现许多干扰因素，因此需要对电力配网进行网络优化工作。　　关键词：电力配网;技术改造;网络优化;策略研究　　1、目前我国的电力配网技

期刊

电厂锅炉运行中节能降耗技术的应用策略探讨

摘要：现代社会的发展和经济运行与电厂的运转是分不开的，其为城市进步和社会、经济发展提供重要的电力保障。伴随着我国经济整体结构的调整和发展，电厂锅炉中的节能降耗问题已经得到了更高的认识和重视，节能降耗问题关乎电厂企业的经济效益和环境保护，并对节约能源具有重大的意义。因此，在实际应用过程中，应加大对电厂锅炉节能降耗技术的研究，并提高对节能降耗的认识，进而推进电厂可以全面健康的发展。　　关键词：电厂锅炉

期刊

电网仿真计算文件多层索引设计

与本文相关的学术论文