论文部分内容阅读
摘 要:凝汽器真空一直以来被作为火电厂管理降耗工作重要关注点,就是因为凝汽器真空系统庞杂,容易发生真空系统泄漏、凝汽器结垢、热负荷高等动态故障,凝汽器性能不容易维持。本文以凝汽器真空实时寻优作为研究内容,通过研究基于各种数据挖掘算法凝汽器真空预测值与实时值的偏差,来确定相对最佳的适用于凝汽器真空实时寻优的数据挖掘算法,为凝汽器真空优化运行和凝汽器真空系统故障诊断提供技术手段。
关键词:火电厂 凝汽器 真空 实时寻优 数据挖掘
中图分类号:TM62 文献标识码:A 文章编号:1674-098X(2019)06(a)-0078-05
Abstract: Condenser vacuum has always been an important concern in the consumption reduction management of thermal power plants. It is because the condenser vacuum system is complex and prone to take place dynamic faults,such as vacuum system leakage or condenser scaling or high thermal load , condenser performance is not easy to maintain. In this paper, real-time optimization of condenser vacuum is taken as the research content. By studying the deviation between predicted and real-time values of condenser vacuum based on various data mining algorithms, the best data mining algorithm suitable for real-time optimization of condenser vacuum is determined, which provides technical means for optimal operation of condenser vacuum and fault diagnosis of condenser vacuum system.
Key Words: Thermal Power Plant; Condenser;Vacuum ;Real-time Optimization ; Data Mining
随着煤价的持续上涨、环保成本的日益升高和竞价上网火电经营形势的变化,火电厂的生产经营形势异常严峻,火电企业为适应经营形势、提高核心竞争力,必须深入开展挖潜增效工作。凝汽器真空系统作为影响火电厂经济运行的“牛鼻子”,在机组管理降耗中起着至关重要的作用[1],因为凝汽器真空每降低1kPa影响煤耗增加约2.6g/(kW·h),且凝汽器真空系统庞杂容易出现真空系统泄漏、凝汽器结垢等动态故障,凝汽器性能会出现波动性趋势[2],使得凝汽器真空作为管理挖潜的可控耗差而被大家重视。本文重点研究火电厂凝汽器真空实时寻优数据挖掘算法,以便确定相对最优的凝汽器真空实时寻优数据挖掘算法,用于火电厂凝汽器真空运行优化指导和凝汽器故障诊断。
1 研究对象
汽轮机为300MW亚临界、一次中间再热、反动式、单轴、双缸双排汽、高中压合缸,与1025t/h亚临界、中间再热、强制循环汽包炉及300MW水氢氢冷却发电机配套;锅炉汽轮机热力系统采用单元布置;汽轮机在额定主蒸汽及再热蒸汽参数、回热系统及汽泵正常投运,背压11.8kPa,补给水率为3%时机组能连续运行,发电机输出额定功率为300MW。凝汽器规范详见表1。
2 算法选取
由于影响凝汽器真空的因素较多,并且相互之间关系较复杂,单纯通过专家行业经验无法找出它们之间的复杂关系,因此,借助于机器学习与数据挖掘技术,根据实际应用要求,选取适量的数据集,建立目标参数与相关因素之间的回归模型,并实现对目标参数凝汽器真空的实时监控。本文选取线性回归、回归树、支持向量机三种数据挖掘算法对目标参数进行建模。
(1)線性回归数据挖掘算法
线性回归(Linear Regression)是一种通过属性的线性组合来进行预测的线性模型[3],其目的是找到一条直线或者一个平面或者更高维的超平面,线性回归数据挖掘原理详见图1,使得预测值与真实值之间的误差最小化。优点:结果具有很好的可解释性(w直观表达了各属性在预测中的重要性),计算熵不复杂。缺点:对非线性数据拟合不好,适用数据类型:数值型数据。
线性回归算法描述:
从数据集D出发,构建输入矩阵X和输出向量y。
(1)
计算伪逆(pseudo-inverse);返回ω*=X+*y,学得的线性回归模型为y=ω+*y。
(2)回归树数据挖掘算法
首先区分回归树与决策树[4]。决策树的作用说白了是一个分类器,通过对特征的选择,划分,对数据进行分类。与决策树不同,回归树做的是回归,是对值的回归预测。比如可以通过回归树预测房价,或者预测人的年龄,等等。输出的是连续值,而不是离散的分类类别。 算法描述:通俗的讲一回归树的思路,找到一个最好的特征的最优的划分点,把整个数据集根据这个划分点分成大于和小于的两个子集;然后对于这两个划分后的子集再分别寻找最优的划分点;直到满足终止条件,那么回归树就构建完成了。
具体算法如下所述:
输入:训练数据集D;
输出:回归树f(x);
在训练数据集所在的输入空间中,递归地将每个区域划分为两个子区域并决定每个子区域上的输出值,构建二叉决策树:
(1)选择最优切分变量j与切分点s,求解
(2)
遍历变量j,对固定的切分变量j扫描切分点s,选择使式(2)达到最小值的对(j,s).
(2)用选定的对(j,s)划分区域并决定相应的输出值:
(3)继续对两个子区域调用步骤(1),(2),直至满足停止条件。
(4)将输入空间划分为M个区域,生成决策树:
(3)
(3)支持向量机数据挖掘算法
SVM算法是一个很优秀的算法[5],在集成学习和神经网络之类的算法没有表现出优越性能前,SVM基本占据了分类模型的统治地位。目前则是在大数据时代的大样本背景下,SVM由于其在大样本时超级大的计算量,热度有所下降,但是仍然是一个常用的机器学习算法。
优点:解决高维特征的分类问题和回归问题很有效,在特征维度大于样本数时依然有很好的效果;仅仅使用一部分支持向量来做超平面的决策,无需依赖全部数据;有大量的核函数可以使用,从而可以很灵活的来解决各种非线性的分类回归问题;样本量不是海量数据的时候,分类准确率高,泛化能力强。不足:如果特征维度远远大于样本数,则SVM表现一般;SVM在样本量非常大,核函数映射维度非常高时,计算量过大,不太适合使用;非线性问题的核函数的选择没有通用标准,难以选择一个合适的核函数;SVM对缺失数据敏感。
2 模型训练因子
为提高模型训练效果,将现场DCS数据相对准确、稳定,且影响凝汽器真空的关键因素作为模型训练因子[6];根据以上要求经过研究和现场调研,将机组循环水量、循环水温、循环水压(MPa)、轴封供汽温度、轴封供汽压力(kPa)、热井水位(mm)、化补水箱水位(mm)、环境温度8个参数作为模型训练因子。
3 模型训练及测试结果分析
由于凝汽器真空变化较频繁,几分钟内可能就会由于某些人为操作因素导致异常变动,因此选取训练数据为约一天的数据,取数频率每分钟取一次。
训练模型时间:04-Jan-19 00:00:00至04-Jan-19 23:29:00;
测试模型时间:04-Jan-19 23:30:00至04-Jan-19 23:59:00。
(1)实验结果分析
通过数据挖掘建模以及对测试数据进行测试,得到如下分析结果:采用三种算法对测试数据的实际值与预测值进行分析数据详见表2,三种算法绝对误差对比分析详见表3。
计算三种算法的实时值与预测值之间绝对误差,并求得总误差。线性回归、回归树、支持向量机总误差分别为-1.36、-0.45、-81.5,回归树总误差达到-0.45,远远优于其他两中算法。因此,线性回归与回归树算法比支持向量机预测更加符合实际应用,可以使用回归树算法来作为预测凝汽器真空可达值的一种方法,根据其提供的可达值与实时值进行实时对比,确保凝汽器真空一直在最优的状态下运行,并且可以作为凝汽器故障诊断的技术依据。若实时值偏离可达值并且根据偏离的程度,来对凝汽器真空进行重点监控,甚至直接预警并提出相应的操作指导。
4 结语
凝汽器真空作为火电厂节能管理中重要的可控耗差,一直以来作为火电厂管理降耗、节能挖潜的重要手段。本文以凝汽器真空这个多因素影响的综合性指标作为数据挖掘实时寻优的研究对象,也是抓住了凝汽器真空影响因素多、性能动态多变等特点,发挥数据挖掘算法的多变量、非线性预测的优势;通过数据挖掘算法确定、模型训练因子确定、模型训练、模型测试及调试结果分析等工作,最终确定了相对比较适合实時预测凝汽器真空的数据挖掘算法,为指导机组凝汽器真空经济运行和凝汽器故障诊断必将发挥积极作用,同时也进一步掌握了数据挖掘算法适用环境的重要性。
参考文献
[1] 廖新华.凝汽式汽轮机组凝汽器真空降低的分析.热电技术.2008.No.2.
[2] 陈明付.汽轮机凝汽器低真空问题的分析与处理.福建能源开发与节约.2003.No.2.
[3] (美)贝里等.线性回归分析基础[M].Jul.2011.
[4] 黄婷,轩双霞.基于支持向量机回归的土壤有机质含量预测.科学技术创新.2019.No.7.
[5] 吴爽.基于回归树模型的推荐技术研究和应用[D].南京大学,2018.
[6] 张艳萍,张光.凝汽器真空的影响因素分析及定量计算.现代电力.Apr.2009.Vol.26 No.2.
关键词:火电厂 凝汽器 真空 实时寻优 数据挖掘
中图分类号:TM62 文献标识码:A 文章编号:1674-098X(2019)06(a)-0078-05
Abstract: Condenser vacuum has always been an important concern in the consumption reduction management of thermal power plants. It is because the condenser vacuum system is complex and prone to take place dynamic faults,such as vacuum system leakage or condenser scaling or high thermal load , condenser performance is not easy to maintain. In this paper, real-time optimization of condenser vacuum is taken as the research content. By studying the deviation between predicted and real-time values of condenser vacuum based on various data mining algorithms, the best data mining algorithm suitable for real-time optimization of condenser vacuum is determined, which provides technical means for optimal operation of condenser vacuum and fault diagnosis of condenser vacuum system.
Key Words: Thermal Power Plant; Condenser;Vacuum ;Real-time Optimization ; Data Mining
随着煤价的持续上涨、环保成本的日益升高和竞价上网火电经营形势的变化,火电厂的生产经营形势异常严峻,火电企业为适应经营形势、提高核心竞争力,必须深入开展挖潜增效工作。凝汽器真空系统作为影响火电厂经济运行的“牛鼻子”,在机组管理降耗中起着至关重要的作用[1],因为凝汽器真空每降低1kPa影响煤耗增加约2.6g/(kW·h),且凝汽器真空系统庞杂容易出现真空系统泄漏、凝汽器结垢等动态故障,凝汽器性能会出现波动性趋势[2],使得凝汽器真空作为管理挖潜的可控耗差而被大家重视。本文重点研究火电厂凝汽器真空实时寻优数据挖掘算法,以便确定相对最优的凝汽器真空实时寻优数据挖掘算法,用于火电厂凝汽器真空运行优化指导和凝汽器故障诊断。
1 研究对象
汽轮机为300MW亚临界、一次中间再热、反动式、单轴、双缸双排汽、高中压合缸,与1025t/h亚临界、中间再热、强制循环汽包炉及300MW水氢氢冷却发电机配套;锅炉汽轮机热力系统采用单元布置;汽轮机在额定主蒸汽及再热蒸汽参数、回热系统及汽泵正常投运,背压11.8kPa,补给水率为3%时机组能连续运行,发电机输出额定功率为300MW。凝汽器规范详见表1。
2 算法选取
由于影响凝汽器真空的因素较多,并且相互之间关系较复杂,单纯通过专家行业经验无法找出它们之间的复杂关系,因此,借助于机器学习与数据挖掘技术,根据实际应用要求,选取适量的数据集,建立目标参数与相关因素之间的回归模型,并实现对目标参数凝汽器真空的实时监控。本文选取线性回归、回归树、支持向量机三种数据挖掘算法对目标参数进行建模。
(1)線性回归数据挖掘算法
线性回归(Linear Regression)是一种通过属性的线性组合来进行预测的线性模型[3],其目的是找到一条直线或者一个平面或者更高维的超平面,线性回归数据挖掘原理详见图1,使得预测值与真实值之间的误差最小化。优点:结果具有很好的可解释性(w直观表达了各属性在预测中的重要性),计算熵不复杂。缺点:对非线性数据拟合不好,适用数据类型:数值型数据。
线性回归算法描述:
从数据集D出发,构建输入矩阵X和输出向量y。
(1)
计算伪逆(pseudo-inverse);返回ω*=X+*y,学得的线性回归模型为y=ω+*y。
(2)回归树数据挖掘算法
首先区分回归树与决策树[4]。决策树的作用说白了是一个分类器,通过对特征的选择,划分,对数据进行分类。与决策树不同,回归树做的是回归,是对值的回归预测。比如可以通过回归树预测房价,或者预测人的年龄,等等。输出的是连续值,而不是离散的分类类别。 算法描述:通俗的讲一回归树的思路,找到一个最好的特征的最优的划分点,把整个数据集根据这个划分点分成大于和小于的两个子集;然后对于这两个划分后的子集再分别寻找最优的划分点;直到满足终止条件,那么回归树就构建完成了。
具体算法如下所述:
输入:训练数据集D;
输出:回归树f(x);
在训练数据集所在的输入空间中,递归地将每个区域划分为两个子区域并决定每个子区域上的输出值,构建二叉决策树:
(1)选择最优切分变量j与切分点s,求解
(2)
遍历变量j,对固定的切分变量j扫描切分点s,选择使式(2)达到最小值的对(j,s).
(2)用选定的对(j,s)划分区域并决定相应的输出值:
(3)继续对两个子区域调用步骤(1),(2),直至满足停止条件。
(4)将输入空间划分为M个区域,生成决策树:
(3)
(3)支持向量机数据挖掘算法
SVM算法是一个很优秀的算法[5],在集成学习和神经网络之类的算法没有表现出优越性能前,SVM基本占据了分类模型的统治地位。目前则是在大数据时代的大样本背景下,SVM由于其在大样本时超级大的计算量,热度有所下降,但是仍然是一个常用的机器学习算法。
优点:解决高维特征的分类问题和回归问题很有效,在特征维度大于样本数时依然有很好的效果;仅仅使用一部分支持向量来做超平面的决策,无需依赖全部数据;有大量的核函数可以使用,从而可以很灵活的来解决各种非线性的分类回归问题;样本量不是海量数据的时候,分类准确率高,泛化能力强。不足:如果特征维度远远大于样本数,则SVM表现一般;SVM在样本量非常大,核函数映射维度非常高时,计算量过大,不太适合使用;非线性问题的核函数的选择没有通用标准,难以选择一个合适的核函数;SVM对缺失数据敏感。
2 模型训练因子
为提高模型训练效果,将现场DCS数据相对准确、稳定,且影响凝汽器真空的关键因素作为模型训练因子[6];根据以上要求经过研究和现场调研,将机组循环水量、循环水温、循环水压(MPa)、轴封供汽温度、轴封供汽压力(kPa)、热井水位(mm)、化补水箱水位(mm)、环境温度8个参数作为模型训练因子。
3 模型训练及测试结果分析
由于凝汽器真空变化较频繁,几分钟内可能就会由于某些人为操作因素导致异常变动,因此选取训练数据为约一天的数据,取数频率每分钟取一次。
训练模型时间:04-Jan-19 00:00:00至04-Jan-19 23:29:00;
测试模型时间:04-Jan-19 23:30:00至04-Jan-19 23:59:00。
(1)实验结果分析
通过数据挖掘建模以及对测试数据进行测试,得到如下分析结果:采用三种算法对测试数据的实际值与预测值进行分析数据详见表2,三种算法绝对误差对比分析详见表3。
计算三种算法的实时值与预测值之间绝对误差,并求得总误差。线性回归、回归树、支持向量机总误差分别为-1.36、-0.45、-81.5,回归树总误差达到-0.45,远远优于其他两中算法。因此,线性回归与回归树算法比支持向量机预测更加符合实际应用,可以使用回归树算法来作为预测凝汽器真空可达值的一种方法,根据其提供的可达值与实时值进行实时对比,确保凝汽器真空一直在最优的状态下运行,并且可以作为凝汽器故障诊断的技术依据。若实时值偏离可达值并且根据偏离的程度,来对凝汽器真空进行重点监控,甚至直接预警并提出相应的操作指导。
4 结语
凝汽器真空作为火电厂节能管理中重要的可控耗差,一直以来作为火电厂管理降耗、节能挖潜的重要手段。本文以凝汽器真空这个多因素影响的综合性指标作为数据挖掘实时寻优的研究对象,也是抓住了凝汽器真空影响因素多、性能动态多变等特点,发挥数据挖掘算法的多变量、非线性预测的优势;通过数据挖掘算法确定、模型训练因子确定、模型训练、模型测试及调试结果分析等工作,最终确定了相对比较适合实時预测凝汽器真空的数据挖掘算法,为指导机组凝汽器真空经济运行和凝汽器故障诊断必将发挥积极作用,同时也进一步掌握了数据挖掘算法适用环境的重要性。
参考文献
[1] 廖新华.凝汽式汽轮机组凝汽器真空降低的分析.热电技术.2008.No.2.
[2] 陈明付.汽轮机凝汽器低真空问题的分析与处理.福建能源开发与节约.2003.No.2.
[3] (美)贝里等.线性回归分析基础[M].Jul.2011.
[4] 黄婷,轩双霞.基于支持向量机回归的土壤有机质含量预测.科学技术创新.2019.No.7.
[5] 吴爽.基于回归树模型的推荐技术研究和应用[D].南京大学,2018.
[6] 张艳萍,张光.凝汽器真空的影响因素分析及定量计算.现代电力.Apr.2009.Vol.26 No.2.