基于电力大数据的数据挖掘支撑子系统的设计与实现

来源 :北京邮电大学 | 被引量 : 2次 | 上传用户:ysq2009123
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
智能电网是电力工业发展的方向和趋势。智能电网利用先进的信息通信技术、计算机技术、控制技术及其他先进技术,实现对发电、输电、用电和售电的需求和功能的协调。而由于对信息技术的引进,导致电网将积累大量的数据,这些数据被称为电力大数据。这些数据的利用价值巨大,不仅可将电网自身的管理、运行水平提升到新的高度,甚至产生根本性的变革,而且也为电力公司拓展增值业务提供了条件。因此,电力大数据有着迫切的价值挖掘需求。但是,电力大数据来源广泛,形式多样,数据质量不高成为了其显著的问题。国内外的数据预处理技术发展迅猛,数据清洗开始在各个行业发光发热,为电力大数据的数据质量提高创造了条件。本文设计与实现的基于电力大数据的数据挖掘支撑子系统,为用户提供了电力大数据环境下一整套的数据储存、数据融合和数据清洗的方案。相较于以前的电网数据处理平台,本支撑子系统具有处理大数据的能力,拥有友好的访问界面,可以接收多种格式的电网数据文件,并且更加关注数据质量的提高。本支撑子系统提供多种适用于电网的数据清洗方法,并且拥有更高的准确度和效率。为了实现本支撑子系统,本文首先调研了相关技术,明确了系统技术的可行性。接着进行了系统的需求分析,根据数据预处理流程,明确了系统的功能性需求,并分析了非功能性需求。为了实现数据融合,本文结合电网环境和数据挖掘要求,提出了统一的储存形式,并提供了数据融合的方案。为了实现数据清洗,本文提出了一种对不完整数据清洗的方案,采用机器清洗和机器验证的方法,提高了数据清洗的效率。而在清洗验证的过程中,本文引入了机器学习的方法,在参数寻优的基础上寻找最佳验证模型,为验证的准确度提供了保障。然后,完成了支撑子系统的设计和实现工作,并进行了测试分析。最后,对论文进行了总结,提出了本支撑子系统的不足之处和未来发展方向。
其他文献
地方高校汉语言文学专业由于人才培养模式陈旧,学生创新创业能力不足,就业率低,招生受限制等原因,在应用型大旗下日渐萎缩。改革陈旧的人才培养模式,强化课程准入制度,改革教
叶菜类蔬菜生长周期短,病虫害种类多,农药使用量大,农药残留问题比较严重。本实验选取吡虫啉为供试农药,采用室内水培的方法,研究了7种不同品种叶菜类蔬菜对水体中吡虫啉的吸
本来准备从刚出炉的新一届中国新闻奖作品中找几篇作品正面评一评。简单扫了一下一等奖,优秀的、能够拿得出手让全国同行效仿。并且令人服气的作品有,但是不多;二等奖作品中也存
最近一段时期以来,语文“非连续性文本”阅读正快速走入社会公众的大视野,并且在备受关注和普遍重视下,其教学与研究活动此起彼伏,正逐步形成了一种无可逆转的发展态势。所谓“非连续性文本”,就是与叙事性强的“连续性文本”不同的另一类阅读材料。就小学语文课而言,如何轻轻叩响“非连续性文本”阅读教学的大门呢?笔者结合自身教学实践,拟从如下几个方面,试对此作出简要性阐述。  一、 努力在教材利用中开展非连续性文
1 建园 选海拔450~1200米的塬地或平地,以黄壤土质为佳。株行距2米×3~4米。栽植前季挖宽、深各80厘米的通沟,铺碎秸秆20厘米,加入氮、磷复合肥(50~75公斤/亩),然后按先表土