论文部分内容阅读
目的:了解长春市2009-2018年麻疹、风疹、病例时间、地区、人群的流行病学特征;建立SARIMA模型,BP神经网络模型分别对2018年长春市麻疹、风疹的发病情况进行预测,比较模型预测精度,得出较优模型,为未来长春市麻疹、风疹的预防和控制提供重要的流行病学依据。方法:本研究中麻疹、风疹病例数据来自于麻疹监测系统,长春市常住人口数据来自于吉林省统计年鉴。本文利用Excel2016对数据进行整合,处理,描述其时间分布,地区分布,年龄,职业及性别等流行病学特征;应用SPSS24.0软件建立SARIMA模型,应用MATLAB2016a建立BP神经网络模型,并通过以上两种模型对长春市2018年麻疹、风疹的发病率进行预测;通过比较MAE、RMSE等指标对模型预测效果进行评价。结果:1.2009年-2018年麻疹的发病率在0.18/10万-22.03/10万之间,年均发病率为6.25/10万;麻疹的发病有明显的季节特征,以第二季度为主,发病人数占比86.57%;人群分布中,病例以2岁以内小年龄组为主,占比61.25%,男性发病率高于女性,散居儿童病例数最多,占比71.07%;地区分布上,除了2017年外,其余年份二道区的发病率均高于其他地区,宽城区只在2018年出现一例病例,其余年份均无病例发生。2.2009年-2018年风疹的发病率总体上呈下降趋势,由2009年的3.52/10万降至2018年的0.04/10万;发病季节上,以第二季度为主,占比43.68%;人群分布中,15-39岁年龄组病例数最多,占比42.32%,<8月龄病例数最少,占比3.01%,男性发病率高于女性,职业分布上主要以散居儿童和学生为主,占比67.02%;地区分布上,朝阳区发病率较高,农安县和南关区发病率较低。3.利用2009-2017年麻疹月发病率建立SARIMA模型,确立较优模型为SARIMA(0,0,1)(0,0,0)12模型,各模型参数均有统计学意义(P<0.05),利用该模型预测长春市2018年麻疹的月发病率,且实际值均在预测值的95%的可信区间内,MAE和RMSE值分别为0.644和1.385。4.建立BP神经网络模型,用前三年麻疹月发病率预测当前月发病率,共有84个样本,前60个作为训练集,后12个作为验证集,最后12个为预测集,建立BP神经网络模型,最终确定3-6-1为最终模型。利用3-6-1BP神经网络模型对2018年长春市麻疹发病率进行预测,模型的预测趋势与实际值基本拟合,预测精度为MAE=0.0276,RMSE=0.0375。5.本研究中,SARIMA模型和BP神经网络模型均预测了2018年麻疹月发病率,从预测精度来看,SARIMA模型的MAE和RMSE值分别为0.644和1.385;BP神经网络模型的MAE和RMSE值分别为0.0276和0.0375。预测精度显示BP神经网络模型预测效果较好。6.采用2009~2017年风疹月发病率建立时间序列,SARIMA(3,0,1)(0,0,1)12模型为预测长春市风疹趋势的较优SARIMA模型结构,预测结果显示2018年长春市风疹1~12月的实际发病率均与预测发病率情况相符,且位于其95%的可信区间内,MAE和RMSE值分别为0.0493和0.0808。7.建立BP神经网络模型,利用与麻疹相同方法对风疹数据进行建模,研究得出风疹较优BP神经网络模型为3-4-1。利用3-4-1BP神经网络模型对2018年长春市风疹发病率进行预测,实际发生率均在预测值的95%的可信区间内,MAE和RMSE的值分别为0.0095和0.0101。8.从预测精度来看,SARIMA模型的MAE和RMSE值为0.0493和0.0808,BP神经网络模型的MAE和RMSE值分别为0.0095和0.0101,所以BP神经网络模型更能够较好的预测风疹月发病率。结论:1.时间分布上,2009年-2018年麻疹的年均发病率为6.25/10万,病例以第二季度为主;人群分布上,2岁以内小年龄组,散居儿童为主,男性发病率较高;地区分布上,二道区发病率较高。2.时间分布上,2009-2018年风疹的发病率呈降低趋势,病例以第二季度为主;人群分布上,以15-39岁年龄组,散居儿童和学生为主,男性发病率较高;地区分布上,朝阳区发病率较高。3.分别利用2009-2017年麻疹、风疹月发病率建立SARIMA模型和BP神经网络模型,从预测精度上看,BP神经网络模型更能够较好的预测麻疹、风疹的月发病率。