论文部分内容阅读
智能电网调度控制系统(简称D5000系统)监控电力系统发、输、变、配和用电的全过程,并实现“调控一体化”,是电网安全稳定运行的关键。在D5000系统运维管理过程中,虽然调度人员可以获取该系统的运行健康状态,但针对其在线健康状态评估方法的客观性还有待提升。因此,本文结合D5000系统的实际需求,开展基于机器学习算法的在线健康度评价研究工作,针对其业务繁多、评价体系复杂、评价指标众多、指标间关系模糊、评价计算量大、时效性需求高等特点,研究了基于机器学习的D5000系统在线健康度评价方法。研究成果对提高D5000系统的健康度评价可靠性,保障智能电网安全稳定运行具有重要意义。本论文的研究内容来源于国家电网公司总部科技项目“调度自动化设备健康度评价”(项目编号:A2017069),本论文的研究对象为智能电网调度控制系统,针对该系统的评价指标体系,展开基于机器学习的健康度评价研究,本论文主要工作如下:(1)研究了基于半监督聚类的D5000系统健康度评价方法。在考虑提升评价客观性以及难以大量获取系统健康状态样本标签的基础上,提出一种基于决策图和成对约束的半监督聚类算法进行健康度评价。首先,分析了 D5000系统评价指标体系的特点;其次,分析D5000系统原始监测数据的特点,并针对数据特点对样本数据进行预处理;然后,确定了基于决策图和成对约束的半监督聚类D5000系统健康度评价方法;最后,利用UCI数据集选取的三组数据进行聚类实验,结果表明所提算法可以有效提升聚类性能,并且用国家电网公司实测的D5000系统监测数据进行实验,通过与传统典型方法的比较,验证了本文所提健康度评价方法的有效性,为智能电网调度控制系统健康度评价提供了新思路。(2)研究了基于极端随机森林的D5000系统健康度评价模型。在健康度评价方法的基础上,结合对历史数据分析,确定基于极端随机森林的D5000系统健康度评价模型。首先,针对结果数据特点分析了D5000系统评价模型的需求;其次,提出一种基于随机森林与熵权法结合的指标权重确定方法;然后,依据评价方法结果数据以及权重确定了基于极端随机森林的D5000系统评价模型,并进行实例分析;最后,通过D5000系统模拟系统的故障模拟数据提出了系统评价可靠性验证方法,完成健康度评价模型可靠性验证。(3)构建了基于Hadoop的D5000系统健康度在线评价体系。针对D5000系统评价体系复杂、评价计算量大、评价时限要求高的特点,提出了一种基于MapReduce的健康度并行评价方法。首先,分析了 Hadoop平台以及MapReduce模型的优势;其次,通过组合式MapReduce框架计算系统的健康度分数,在上级MapReduce中,Map读入数据拆分评分任务,Reduce按照层级结构归约计算进程以及硬件健康度级别,在下级MapReduce中汇总平台与应用健康度级别得到D5000系统的状态,同时采用了任务调度自适应算法保证系统的负载均衡;最后,搭建了D5000系统健康度评价实验平台,并通过实验验证了所设计的体系提高了D5000系统健康度评价的效率。