论文部分内容阅读
污水处理系统是一个复杂的生化反应系统,具有非线性、滞后性大、干扰强等特点。这使得污水处理厂有时会出现各种原因导致的故障,如果故障没有被及时诊断将会导致一系列严重问题。运用机器学习与数据挖掘相关的算法对于污水处理具有重大意义。但由于污水处理过程采集到的污水处理数据是不平衡的,经典机器学习算法在进行污水处理数据的故障诊断时往往难以识别出故障状态的样本。因此需要研究故障诊断方法来对污水处理系统进行及时的故障诊断,以便进行处理。本文以污水处理为应用背景,主要研究内容如下:1.在通过对常用的聚类算法理论进行研究的基础上,针对不平衡数据分类问题提出一种基于聚类的不平衡数据处理方法。通过实验结果表明该方法可以有效提高分类器多数类样本的分类准确率,并有效提高分类器的分类G-mean值,在污水处理过程的故障诊断中有着良好的效果。2.通过对单隐层前馈神经网络、用于样本过采样的SMOTE算法和Bagging集成框架相关理论的研究,在以上理论基础上针对污水数据的不平衡性提出了一种基于加权极限学习机的SMOTE_Bagging集成污水处理故障诊断方法。对比实验结果表明该方法在污水处理故障诊断场合对故障类样本有着更高的分类准确率和更高的G-mean值,适用于实际污水处理故障诊断。3.针对SMOTE_Bagging_WELM训练时间较长的问题进一步对集成框架进行改进,提出了一种基于加权极限学习机的重采样池快速集成污水处理故障诊断方法SP-EWELM。实验结果表明SP-EWELM在污水处理故障诊断场合对故障类样本有着更高的分类准确率,同时建模需要的训练时间更少,适用于实际污水处理故障诊断。4.为了方便污水处理系统工作人员对污水处理故障诊断算法的实际运用,使用Python设计并实现了一个污水生化处理故障诊断与预警系统软件,实现了出水指标预测、污水故障诊断、污水数据管理的功能。经测试证明该软件性能可靠,使用简单,能够极大地方便工作人员对污水处理系统进行故障诊断。