论文部分内容阅读
空气环境是人类生存和发展的基础前提,空气质量的恶化不仅会影响城市居住环境和生活环境,而且这种影响往往会映射到个人和多层次社会的物质和精神方面,甚至对国民经济构成威胁。随着时代的发展,优质环境和健康空气逐渐成为一种稀缺资源,空气质量的提升已经成为国家战略层面的治理要求。在此背景下,人们对空气质量标准以及环境发展的需求逐渐提高,空气污染预警防控对社会经济持续健康运行的重要性也会日益显著。当前,空气污染预警的作用不断凸显,迫切需要掌握现代化管理手段和治理方法。为提升预警系统的精准化管理水平,需要结合大量复杂数据、融合大数据技术进行新的探索。但如何从复杂多样的数据中挖掘出有价值信息、对未来空气污染的趋势变化和等级状况做出准确判断,进而辅助环保部门监测和治理空气环境,是新时代下开展空气污染预警工作的要求。由于空气环境系统中大量的数据信息之间存在关联关系,因而传统方法和模型已经不能满足对复杂的关联数据进行有效分析和处理的需要,亟需开发新的研究方法,为解决人类社会生产、生活中的空气环境问题提供必要的技术支持。针对上述问题和研究目标,本文从数据挖掘与处理、时间序列预测和综合评判研究等视角入手,利用数据预处理算法、机器学习理论、智能优化算法以及模糊数学理论等进行空气污染预警系统的建立与应用研究。该预警系统针对具有复杂多元的空气污染数据,构建空气污染预测和空气质量评估模型,并结合数据预处理分析方法,对典型城市的空气污染变化状况进行实证研究,进一步验证该系统的科学性和可操作性。主要研究内容包括以下三个方面:首先,本文提出的数据预处理框架为空气污染预警系统提供建模和数据分析基础。数据预处理框架能够为模型构建提供完整的数据源,并实现模型训练所需数据的无量纲化;通过对插值后的数据进行去噪,有利于模型预测性能的提升,同时提高模型运算的效率。针对空气污染数据中的缺失情况,采用分段三次Hermite插值方法对原始时间序列数据的缺失值进行填补,该方法很好地模拟原始数据的真实变化过程,使所有的缺失数据信息得到有效补充和完善。针对空气污染数据中的噪声信息,改进的完备总体经验模态分解算法能够将原始数据序列分解为高频和低频成分,进而提取趋势和噪声序列,通过过滤噪声可获得平稳的数据序列。实证结果表明,相比于奇异谱分析算法、变分模态分解算法和完备总体经验模态分解算法,改进的完备总体经验模态分解方法能够使去噪后数据的样本复杂度达到最低。此外,采用规范化处理方法对数据进行归一化,很好地解决量纲不一致的问题。其次,本文提出基于最小二乘支持向量机的预测模型进行空气污染状况的预测。最小二乘支持向量机能够将二次规划问题转化为求解线性方程组问题,进而提高模型的求解速度和网络收敛效率,对时间序列预测精度的提升具有重要作用。该预测模型结合数据预处理方法,分别采用群智能算法的单目标优化和多目标优化对最小二乘支持向量机的正则化参数和核宽度参数进行优化,旨在保持预测模型在处理非线性和多因索复杂性问题优势的同时,提升预测结果的稳定性与精确性。通过实证对比表明,所构建的预测模型具有较高的预测精度。此外,多目标优化模型的对比也能够证明最小二乘支持向量机方法用于预测的有效性与实用性。由此可见,所提出的预测模型可实时预测未来空气污染状况的变动情况,能够向决策者提供可靠的空气污染实况。最后,本文构建了基于模糊数学原理的空气质量评估模型,实证表明该评估模型可取得良好且合理的模型效果。该模型的基本思想是:采用模糊数学原理对空气污染因子和评估等级进行模糊语言描述和处理。具体而言,就是在运用评估模型前,首先确定影响空气质量的污染因子,然后将这些污染因子以模糊集的形式表示,并根据环境空气质量标准的设定和实际问题的需要确定评估集;其次利用降半阶梯形分布函数计算模糊关系矩阵,判断因素集与评估集间的隶属关系,进而结合权重系数进行模糊数学运算,并采用熵权法对各因子进行赋权,而无需对每日监测数据进行权重计算,这不仅可以简化模糊评估过程,而且能够使信息利用率和评估结果可靠性得到较大程度改善,从而提高模糊数学方法在空气质量评估应用中的适用性;最后根据最大隶属度原则,对空气质量等级进行判定。该空气质量评估方法能够弥补传统空气质量评估方法在系统性、客观性以及可比性等方面存在的缺陷,从而实现对空气质量的综合评估。构建的新型评估模型的输出结果不仅可以为环境决策者提供空气污染预警信息,而且能够提醒相关人群根据相应的空气质量水平及时采取有效的防护措施。基于以上研究,全文的主要结论如下:(1)构建空气污染预警系统需要有效的数据分析工具作为研究基础。数据是问题分析和模型建立的基础,本文采用数据预处理分析框架对空气污染数据进行分析:一方面,数据预处理分析框架可以对缺失样本信息进行有效的插值补充,并解决建模过程中数据量纲不一致的问题;另一方面,针对非平稳时间序列数据的噪声项,该框架通过引入去噪算法能够有效提取数据中的有价值信息,通过实证分析证明改进的完备总体经验模态分解算法具有最佳的去噪效果,并能够明显提高预测模型的性能。因此,数据预处理对于预警系统的建立具有非常重要的作用。(2)预警系统的成功运用得益于模型的有效改进与合理优化。最小二乘支持向量机对非线性数据拟合具有较好的效果,但其良好的性能需要建立在平稳时间序列和参数合理设置的基础上。文中构建的预测模型通过结合去噪算法对历史时间序列的非平稳特征做出有效分析和处理;群智能优化算法是一种十分有效的参数寻优方法,通过对正余弦优化算法进行改进,可以使该算法的收敛效率得到明显提升。实证分析证明,单目标优化能够降低模型的预测误差,多目标优化能够兼顾区间预测的覆盖概率和区间平均宽度。(3)准确客观的预警结果主要依赖于模糊数学方法的融合互补。构建的新型评估模型有效融合模糊数学理论,能够将空气质量的评估因子和评估等级转化为模糊集的形式,并结合空气污染浓度限值,通过隶属函数对空气质量等级进行有效计算。此外,该模型采用信息熵的方式设定模糊权重集,综合考虑各项污染因子对空气质量的相对重要程度。通过对预警结果进行分析,能够证明空气污染预警系统的合理性。本研究的主要创新之处主要包括:(1)现有研究中的单一的时变回归模型并没有考虑输入数据的不稳定性和模型预测参数优化的适应性。本文结合最小二乘支持向量机构建预测模型,在数据非线性和非平稳性特征分析的基础上,提出使用群智能优化算法对参数进行优化。通过实证对比发现,群智能优化的单目标优化可以有效提高模型的预测性能,多目标优化能够保障区间预测的覆盖概率和区间平均宽度;(2)针对空气质量评估,本文提出利用影响空气环境的各污染因子,构建综合评价模型。该模型将空气环境的污染因子和评估等级转化为模糊集的形式,结合隶属函数和设置空气污染浓度限值对空气质量进行评估,取得良好且合理的模型效果。提出的模型能够有效避免不同环境决策者之间的主观偏好,弥补现有研究中关于空气质量标准差异引起的空气质量等级不可比的空白;(3)在数据预处理研究方面,本文通过比较和筛选数据的常规预处理方法及去噪预处理方法,从而提出预处理分析框架,对原始时间序列的所有缺失信息作插值补充,并对数据进行去噪化处理,将数据中的噪声信息剔除,有效保障了模型的预测性能,实证分析结果证明改进的完备总体经验模态分解算法具有最佳的去噪效果。本研究的不足之处包括:本文通过使用多种单一方法和辅助工具来构建模型,不可否认,或许存在其它可替代的算法或工具,由于篇幅有限,本文未对所有的算法展开细致研究,因此,在理论研究方面仍需深入探究;由于相关数据存在客观上的不可获得性,本文未考虑环境投资决策对空气质量变化的影响。未来可从相关投资因素对空气质量的影响关系角度进行探讨,为空气环境可持续发展提供更扎实的研究基础。