论文部分内容阅读
(1.北京清大华康电子技术有限责任公司,北京 100083;2.华北电力大学(北京)控制与计算机工程学院,北京 102206)
摘要:数据挖掘技术是一门跨学科的综合研究领域,集计算机机器学习、统计学、数据库管理、数据仓库、可视化、并行计算、决策支持为一体,利用数据库、数据仓库技术存储和管理数据,利用机器学习和统计方法分析数据。在当前社会节能减排的大环境下,电力从业者利用数据挖掘技术对机组发电过程中所产生的各种数据进行深入的分析和研究,并以此来采取相关措施,可以更有效利用现有电力资源,优化整合大型发电设备,不断提高发电的可靠性和经济性。本文将对数据挖掘技术在机组能效分析中的具体应用加以归纳和总结。
关键词:数据挖掘技术;能效测评;数据仓库;OLAP联机分析处理;决策树
中图分类号:TP311 文献标识码:A 文章编号:1007-9599 (2012) 23-0000-02
伴随着中国经济的快速腾飞,各工业、企业、居民对电力的依赖性越来越强,电器设备及产品在日常工作与生活中随处可见。据国际能源署在“全球能源展望报告”中预计:中国的电力需求将在2030年内,每年增长4.5%。为了摆脱持续的电力紧缺局面,国家近年来对电力行业投入了高达数千亿的巨额资金,改造与新建了大批的发电厂与变电站,逐步缓解了用电紧张的局面。但是随着用电负荷的节节攀升,对能源的依赖与消耗也飞速发展。当前国家已经把节能减排作为调整经济结构、转变发展方式的重要抓手,加大了资金投入与责任考核,完善了政策机制与综合协调。发改委在《关于进一步做好当前节能减排工作的紧急通知》中要求实施节能减排预警调控要科学、合理、有序,加强“十二五”规划研究,努力构建节能减排长效机制。
在日益紧张的供电需求压力和市场经济发展必然规律的驱使下,电力企业体制改革不断向纵深方向发展[1]。目前,厂网分开,竞价上网的方式已在全国范围内进行推广。而电厂燃料价格的持续上涨以及国家对节能减排政策的不断加强,所有这些都对各发电企业提出了严峻的挑战,"用电需求"和"节能目标"两大考题是摆在电力从业者面前不能回避的任务,一方面要充分考虑满足用电需求的不断增长,另一方面更要做好电厂内部的节能工作,提高能源利用效率,做到能源消耗稳中有降。而要达到此目的,就需要对发电厂中的重要组成部分-发电机组的日常能效进行全面的分析与调控,从而为各大电厂能够在市场经济中不断的完善自己和向前发展提供有利可靠的后勤保障。
在我国,电厂生产过程监控信息系统经历了近十年的发展,已经开发出了一些成熟的软件,如华北电力大学研制的“机组经济性在线监测诊断指导系统”、“控制系统分析、建模与优化整定系统”、“锅炉受热面积灰结渣检测系统”、“热力设备应力计算与寿命管理系统”、“设备故障检测与诊断系统”、“全厂负荷优化分配系统”等。这些产品已经经受了生产实践的考验,产生了良好的经济效益。但是由于数据源不统一和安装布置的分散,以及不能数据共享等因素导致不能有效地、宏观地得出电厂机组能效的评价和比较。
数据仓库(DataWarehouse)和数据挖掘(DataMining)技术的飞速发展为这种决策分析能力的实现提供了可能,同时也为电厂机组能效分析打开了新的大门,成为评测机组性能的有效途径之一[2]。我们可以在提供的机组数据的基础上,通过创建数据仓库,利用OLAP联机分析处理技术和数据挖掘技术,比较各大电厂机组的能效情况,预测各大电厂机组的能效测评得分。并运用这些数据分析技术形成一个电厂机组能效分析模型,提供多维分析功能、从而提高电厂机组发电效率,为电力企业提供一个高效、可靠的分析系统。
1 数据仓库的概念
数据仓库是一个面向主题的、集成的、非易失的且随时间变化的数据集合。它以大型机组日常运行数据为数据源,如煤质、炉温、蒸汽参数、机组容量等。
2 OLAP联机分析处理技术
建立在数据仓库基础上的联机分析处理技术通过对多维数据的聚合计算和聚合结果的预存储,支持对数据多角度、多侧面的统计和观察,从而达到对数据更为全面的把握和理解的目的。OLAP技术主要对数据仓库中的数据进行表层的聚合统计,力图以统一的应用逻辑和数据模型,在短时间内响应非数据处理专业人员的复杂查询要求。
3 数据挖掘的概念
数据挖掘也叫数据开采,数据采掘等,就是从大量的、不完全的、有噪声的、模糊的、随机的数据中,提取隐含在其中的、人们事先不知道的、但又是潜在有用的信息和知识的过程。一般来说,数据挖掘是利用各种分析方法和分析工具,在大规模海量数据中建立模型和发现数据间关系的过程,这些模型和关系可以用来进行决策和预测。作为一门处理数据的新兴技术,它有许多的新特征。首先,数据挖掘面对的是海量的数据,可能是GB或者TB级,这也是数据挖掘产生的原因。其次,数据可能是不完全的、有噪声的、随机的、有复杂的数据结构、维数大等特点。最后,数据挖掘是许多学科的交叉,运用了统计学,计算机,数学等学科的知识。在较浅的层次上,它利用现有数据库管理系统的查询、检索及报表功能,与多维分析、统计分析方法相结合、进行联机分析处理(OLAP),从而得出可供决策参考的统计分析数据。在深层次上,则从数据库中发现前所未有的、隐含的知识。
数据挖掘的算法主要有:(1)传统统计方法:抽样技术、多元统计分析、因子分析、聚类分析等;统计预测方法,如回归分析、时间序列分析等。(2)可视化技术:用图表等方式把数据特征用直观地表述出来,如直方图等,这其中运用的许多描述统计的方法,可视化技术面对的一个难题是高维数据的可视化。(3)决策树:利用一系列规则划分,建立树状图,可用于分类和预测,常用的算法有CART、CHAID、ID3、C4.5、C5.0等。(4)神经网络:模拟人的神经元功能,经过输入层、隐藏层、输出层等,对数据进行调整,计算,最后得到结果,用于分类和回归。(5)遗传算法:基于自然进化理论,模拟基因联合、突变、选择等过程的一种优化技术。(6)关联规则挖掘算法:关联规则是描述数据之间存在关系的规则。(7)国外数据挖掘主要有对知识发现方法的研究,如近年来注重对Bayes(贝叶斯)方法以及Boosting方法的研究和提高;传统的统计学回归法在KDD中的应用;KDD与数据库的紧密结合。
4 数据挖掘在机组能效分析中的应用
目前,数据分析和数据挖掘技术在电力系统中的应用,还处于起步阶段。可尝试选用大型机组日常运行数据为数据源,创建以机组能效测评为主题的数据仓库。在所建立的数据仓库模型上,对机组日常运行数据进行有目的的分析,主要是利用数据挖掘工具,通过关联分析来挖掘煤质与燃烧率之间、蒸汽参数与热效率之间、短时启停与煤耗之间、机组容量与发电效率之间的关系等内容;用聚类分析挖掘哪些锅炉热效率更高、哪些汽轮机损耗更小、哪些机组在负荷分配、短时启停上更具有优势等内容,并利用OLAP工具创建与主题相关的维度和立方;选择决策树挖掘算法分析各项指标对机组发电效率、节能情况的影响,预测各大电厂机组的能效测评得分情况以及各大电厂机组的能效分析结果,并对分析和挖掘结果进行解释和评价,形成一个电厂机组能效分析评价的解决方案。
5 结束语
数据仓库、数据挖掘技术从一开始就是面向应用的。随着这些技术在理论上的日渐成熟,在实践中的不断发展。将为电力企业提高大型发电机组的经济性能和安全性能提供数据上强有力的保障,为管理者决策提供参考。
参考文献:
[1]付中广,王同宇,付玲.电站机组运行优化[R].全国电力行业CFB机组技术交流服务协作网技术交流论文集,2006:148-155.
[2]申鹏飞.基于数据仓库的汽轮机性能分析预测系统的设计与实现[D].北京:华北电力大学计算机科学与技术学院,2005.
[3]蒙祖强,龚涛.Oracle10g数据库Java开发[M].北京:中国水利水电出版社,2005.
[作者简介]韩磊,男,北京人,本科学历,工程师,北京清大华康电子技术有限责任公司,华北电力大学控制与计算机学院在职硕士研究生,从事电力技术,数据挖掘方向的研究;郑玲,女,华北电力大学控制与计算机学院硕士生导师。
摘要:数据挖掘技术是一门跨学科的综合研究领域,集计算机机器学习、统计学、数据库管理、数据仓库、可视化、并行计算、决策支持为一体,利用数据库、数据仓库技术存储和管理数据,利用机器学习和统计方法分析数据。在当前社会节能减排的大环境下,电力从业者利用数据挖掘技术对机组发电过程中所产生的各种数据进行深入的分析和研究,并以此来采取相关措施,可以更有效利用现有电力资源,优化整合大型发电设备,不断提高发电的可靠性和经济性。本文将对数据挖掘技术在机组能效分析中的具体应用加以归纳和总结。
关键词:数据挖掘技术;能效测评;数据仓库;OLAP联机分析处理;决策树
中图分类号:TP311 文献标识码:A 文章编号:1007-9599 (2012) 23-0000-02
伴随着中国经济的快速腾飞,各工业、企业、居民对电力的依赖性越来越强,电器设备及产品在日常工作与生活中随处可见。据国际能源署在“全球能源展望报告”中预计:中国的电力需求将在2030年内,每年增长4.5%。为了摆脱持续的电力紧缺局面,国家近年来对电力行业投入了高达数千亿的巨额资金,改造与新建了大批的发电厂与变电站,逐步缓解了用电紧张的局面。但是随着用电负荷的节节攀升,对能源的依赖与消耗也飞速发展。当前国家已经把节能减排作为调整经济结构、转变发展方式的重要抓手,加大了资金投入与责任考核,完善了政策机制与综合协调。发改委在《关于进一步做好当前节能减排工作的紧急通知》中要求实施节能减排预警调控要科学、合理、有序,加强“十二五”规划研究,努力构建节能减排长效机制。
在日益紧张的供电需求压力和市场经济发展必然规律的驱使下,电力企业体制改革不断向纵深方向发展[1]。目前,厂网分开,竞价上网的方式已在全国范围内进行推广。而电厂燃料价格的持续上涨以及国家对节能减排政策的不断加强,所有这些都对各发电企业提出了严峻的挑战,"用电需求"和"节能目标"两大考题是摆在电力从业者面前不能回避的任务,一方面要充分考虑满足用电需求的不断增长,另一方面更要做好电厂内部的节能工作,提高能源利用效率,做到能源消耗稳中有降。而要达到此目的,就需要对发电厂中的重要组成部分-发电机组的日常能效进行全面的分析与调控,从而为各大电厂能够在市场经济中不断的完善自己和向前发展提供有利可靠的后勤保障。
在我国,电厂生产过程监控信息系统经历了近十年的发展,已经开发出了一些成熟的软件,如华北电力大学研制的“机组经济性在线监测诊断指导系统”、“控制系统分析、建模与优化整定系统”、“锅炉受热面积灰结渣检测系统”、“热力设备应力计算与寿命管理系统”、“设备故障检测与诊断系统”、“全厂负荷优化分配系统”等。这些产品已经经受了生产实践的考验,产生了良好的经济效益。但是由于数据源不统一和安装布置的分散,以及不能数据共享等因素导致不能有效地、宏观地得出电厂机组能效的评价和比较。
数据仓库(DataWarehouse)和数据挖掘(DataMining)技术的飞速发展为这种决策分析能力的实现提供了可能,同时也为电厂机组能效分析打开了新的大门,成为评测机组性能的有效途径之一[2]。我们可以在提供的机组数据的基础上,通过创建数据仓库,利用OLAP联机分析处理技术和数据挖掘技术,比较各大电厂机组的能效情况,预测各大电厂机组的能效测评得分。并运用这些数据分析技术形成一个电厂机组能效分析模型,提供多维分析功能、从而提高电厂机组发电效率,为电力企业提供一个高效、可靠的分析系统。
1 数据仓库的概念
数据仓库是一个面向主题的、集成的、非易失的且随时间变化的数据集合。它以大型机组日常运行数据为数据源,如煤质、炉温、蒸汽参数、机组容量等。
2 OLAP联机分析处理技术
建立在数据仓库基础上的联机分析处理技术通过对多维数据的聚合计算和聚合结果的预存储,支持对数据多角度、多侧面的统计和观察,从而达到对数据更为全面的把握和理解的目的。OLAP技术主要对数据仓库中的数据进行表层的聚合统计,力图以统一的应用逻辑和数据模型,在短时间内响应非数据处理专业人员的复杂查询要求。
3 数据挖掘的概念
数据挖掘也叫数据开采,数据采掘等,就是从大量的、不完全的、有噪声的、模糊的、随机的数据中,提取隐含在其中的、人们事先不知道的、但又是潜在有用的信息和知识的过程。一般来说,数据挖掘是利用各种分析方法和分析工具,在大规模海量数据中建立模型和发现数据间关系的过程,这些模型和关系可以用来进行决策和预测。作为一门处理数据的新兴技术,它有许多的新特征。首先,数据挖掘面对的是海量的数据,可能是GB或者TB级,这也是数据挖掘产生的原因。其次,数据可能是不完全的、有噪声的、随机的、有复杂的数据结构、维数大等特点。最后,数据挖掘是许多学科的交叉,运用了统计学,计算机,数学等学科的知识。在较浅的层次上,它利用现有数据库管理系统的查询、检索及报表功能,与多维分析、统计分析方法相结合、进行联机分析处理(OLAP),从而得出可供决策参考的统计分析数据。在深层次上,则从数据库中发现前所未有的、隐含的知识。
数据挖掘的算法主要有:(1)传统统计方法:抽样技术、多元统计分析、因子分析、聚类分析等;统计预测方法,如回归分析、时间序列分析等。(2)可视化技术:用图表等方式把数据特征用直观地表述出来,如直方图等,这其中运用的许多描述统计的方法,可视化技术面对的一个难题是高维数据的可视化。(3)决策树:利用一系列规则划分,建立树状图,可用于分类和预测,常用的算法有CART、CHAID、ID3、C4.5、C5.0等。(4)神经网络:模拟人的神经元功能,经过输入层、隐藏层、输出层等,对数据进行调整,计算,最后得到结果,用于分类和回归。(5)遗传算法:基于自然进化理论,模拟基因联合、突变、选择等过程的一种优化技术。(6)关联规则挖掘算法:关联规则是描述数据之间存在关系的规则。(7)国外数据挖掘主要有对知识发现方法的研究,如近年来注重对Bayes(贝叶斯)方法以及Boosting方法的研究和提高;传统的统计学回归法在KDD中的应用;KDD与数据库的紧密结合。
4 数据挖掘在机组能效分析中的应用
目前,数据分析和数据挖掘技术在电力系统中的应用,还处于起步阶段。可尝试选用大型机组日常运行数据为数据源,创建以机组能效测评为主题的数据仓库。在所建立的数据仓库模型上,对机组日常运行数据进行有目的的分析,主要是利用数据挖掘工具,通过关联分析来挖掘煤质与燃烧率之间、蒸汽参数与热效率之间、短时启停与煤耗之间、机组容量与发电效率之间的关系等内容;用聚类分析挖掘哪些锅炉热效率更高、哪些汽轮机损耗更小、哪些机组在负荷分配、短时启停上更具有优势等内容,并利用OLAP工具创建与主题相关的维度和立方;选择决策树挖掘算法分析各项指标对机组发电效率、节能情况的影响,预测各大电厂机组的能效测评得分情况以及各大电厂机组的能效分析结果,并对分析和挖掘结果进行解释和评价,形成一个电厂机组能效分析评价的解决方案。
5 结束语
数据仓库、数据挖掘技术从一开始就是面向应用的。随着这些技术在理论上的日渐成熟,在实践中的不断发展。将为电力企业提高大型发电机组的经济性能和安全性能提供数据上强有力的保障,为管理者决策提供参考。
参考文献:
[1]付中广,王同宇,付玲.电站机组运行优化[R].全国电力行业CFB机组技术交流服务协作网技术交流论文集,2006:148-155.
[2]申鹏飞.基于数据仓库的汽轮机性能分析预测系统的设计与实现[D].北京:华北电力大学计算机科学与技术学院,2005.
[3]蒙祖强,龚涛.Oracle10g数据库Java开发[M].北京:中国水利水电出版社,2005.
[作者简介]韩磊,男,北京人,本科学历,工程师,北京清大华康电子技术有限责任公司,华北电力大学控制与计算机学院在职硕士研究生,从事电力技术,数据挖掘方向的研究;郑玲,女,华北电力大学控制与计算机学院硕士生导师。