论文部分内容阅读
2019年12月,由新型冠状病毒引发的肺炎疫情在武汉等多地爆发,对我国的经济发展,社会秩序等方面都带来了极大的负面影响。2020年2月,在巴西,尼日利亚等地也都爆发了不同的传染病疫情,引发了世界公民的“疫情恐慌”。以上种种的公共卫生事件将传染病防御防控这个概念重新带回到了大家的视野。国内外很多专家学者在传染病预测方面做了大量的研究工作,也取得了很多显著的成绩,如小波模型[9]、灰色动态模型[36]、ARIMA模型[23-26]等,在很多方面得到了成功的运用。但与此同时这些预测模型也存在各式各样的问题,比如,对样本数据要求高、计算复杂度高、稳定性差等,由于传染病发病率受较多因素的影响,有明显的随机性与波动性,所以很难利用一般线性回归得到理想的高精度预测结果。随着机器学习和深度学习研究的不断深入,使得很多高随机性,难以预测的非线性问题都能够得到更好的解决,且最终的模型拟合精度也比普通的一般线性模型更为理想。本文着重介绍基于双向长短时记忆循环神经网络(Bi LSTM)与广义回归神经网络(GRNN)相结合的智能预测模型的研究工作。以2004年-2019年上海市细菌性痢疾发病率(Bacillary dysentery,BD)数据作为主要研究对象。通过对比该模型与其他模型的优劣,对其可应用性与有效性进行探讨,重点围绕以下两个内容展开工作:第一,构造新智能模型。主要研究工作分为五个方面:(1)将四种研究数据进行归一化处理,在建模前统一研究数据的量纲;(2)在深度学习架构上分析本文所选取两种算法进行有效结合、构造双层网络结构的可行性,(3)确定最佳深度学习参数,(4)利用预处理后数据进行模型拟合,(5)通过比较不同训练次数的预测对比图与Loss图,验证新智能模型在BD发病率预测的有效性。第二,拟合对比模型,横向验证Bi LSTM-GRNN的高精度优势。选择CS-LSTM与LSTM-GRNN作为对比模型,经过建模计算,在迭代相同次数后,Bi LSTM-GRNN预测模型的MSE,MAE,RMSE分别为(4.205e-05,0.0062,0.0064),均低于CS-LSTM与LSTM-GRNN联合模型的(0.0014,0.0356,0.0356)和(0.0002,0.0152,0.0151),说明构造了误差修正闭环的双重神经网络与经过优化算法寻优的神经网络以及单向误差修正的双重神经网络相比,预测精度更高,模型拟合效果更好。最后为验证新智能模型的稳健性,对三组模型进行Friedman显著性检验,经过计算得出,Bi LSTM-GRNN联合模型残差与对比模型之间存在显著性差异,说明新智能模型的稳健性更高。通过对上海市BD发病率序列的建模研究,探索出更适用于传染病发病率的预测模型,弥补了传统传染病统计预测研究的不足,同时为我国肠道类传染病的防控工作提供了相关的数模支持,研究结果具有较好的应用价值。