论文部分内容阅读
随着中国进入高速发展阶段,城市人口正在增长,工业和农业继续快速发展,PM2.5和许多分子和其他物质大幅增加。这些事件的发生表明环境问题非常严重,因此目前空气质量研究非常重视PM2.5的监测预测。本文对PM2.5数值预测进行研究,选用北京地区2019年前6个月数据做训练,7月份数据做检测,采用BPANN神经网络,SVM回归模型,ARIMA模型做预测,并将三者混合形成组合模型,通过分析预测结果以及真实值之间的误差来比较各个预测模型的预测精度。首先使用BP神经网络预测PM2.5,根据数据自动连接的特性开发训练和测试样本,以确定最佳神经网络结构,然后调整参数以改进BP学习算法。获得期望,最终通过计算可得误差为24.9%,精度在70%以上。接着我们结合支持向量机对缺乏样本或者小样本应用的良好预测效果的优点,对带有约束的大规模样本集进行进一步的预测,用误差平方代替松弛变量C,并将不等式约束改为等式约束,对预测结果再次进行了修正,精度在75%左右。紧跟着我们分析了PM2.5数据的特征,数据稳定化,图表分析自动连通功能和部分自动连通功能,以确定合理的ARIMA模型,然后计算AIC和BIC值以确定最佳模型,然后使用参数估计值来获得基于ARIMA的PM2.5预测模型。计算可得结果误差率为24%,精度在70%以上。然后我们将ARIMA模型,SVM回归模型与BP神经网络模型结合起来,以获得权重和集成结构(ARIMA-BP-SVM),预测结果表明,综合模型的准确度高于个体模型的准确度。在此基础上,将神经元结合起来,以获得综合ARIMA-BP-SVM,并以更高的准确度获得模型和结果。最终得到预测结果的平均值误差率为0.1864,精度在82%左右,满足期望预测精度,整体预测精度较高。最后我们对模型进行了推广以及评价。ARIMA-BP-SVM综合预测模型,它既解决了ARIMA模型的线性局限以及BP模型的非线性局限性,又将多种模型的优点结合起来,得到精度较高的综合预测模型,对于接下来的PM2.5以及其他多因素影响的变量预测提供了参考。