论文部分内容阅读
智能电网是电力工业发展的方向和趋势。智能电网利用先进的信息通信技术、计算机技术、控制技术及其他先进技术,实现对发电、输电、用电和售电的需求和功能的协调。而由于对信息技术的引进,导致电网将积累大量的数据,这些数据被称为电力大数据。这些数据的利用价值巨大,不仅可将电网自身的管理、运行水平提升到新的高度,甚至产生根本性的变革,而且也为电力公司拓展增值业务提供了条件。因此,电力大数据有着迫切的价值挖掘需求。但是,电力大数据来源广泛,形式多样,数据质量不高成为了其显著的问题。国内外的数据预处理技术发展迅猛,数据清洗开始在各个行业发光发热,为电力大数据的数据质量提高创造了条件。本文设计与实现的基于电力大数据的数据挖掘支撑子系统,为用户提供了电力大数据环境下一整套的数据储存、数据融合和数据清洗的方案。相较于以前的电网数据处理平台,本支撑子系统具有处理大数据的能力,拥有友好的访问界面,可以接收多种格式的电网数据文件,并且更加关注数据质量的提高。本支撑子系统提供多种适用于电网的数据清洗方法,并且拥有更高的准确度和效率。为了实现本支撑子系统,本文首先调研了相关技术,明确了系统技术的可行性。接着进行了系统的需求分析,根据数据预处理流程,明确了系统的功能性需求,并分析了非功能性需求。为了实现数据融合,本文结合电网环境和数据挖掘要求,提出了统一的储存形式,并提供了数据融合的方案。为了实现数据清洗,本文提出了一种对不完整数据清洗的方案,采用机器清洗和机器验证的方法,提高了数据清洗的效率。而在清洗验证的过程中,本文引入了机器学习的方法,在参数寻优的基础上寻找最佳验证模型,为验证的准确度提供了保障。然后,完成了支撑子系统的设计和实现工作,并进行了测试分析。最后,对论文进行了总结,提出了本支撑子系统的不足之处和未来发展方向。