论文部分内容阅读
基于互联网数据的疾病预测一般具有成本低廉、时效性高的特点,正成为近年来各国学术与医疗界的一个研究热点。本论文利用搜索引擎和社交网络的数据,并结合气象与空气质量数据,对江苏省内的手足口病的流行趋势进行建模预测,从而进行手足口病爆发前的提前预警,帮助决策者在流行病大规模爆发前进行政策布局。本论文采用的实验数据包括百度指数数据、微博文本数据、气象数据、空气质量数据和监测确诊数据。其中,监测确诊数据来自全国法定传染病网络直报系统,其余的数据皆通过编写爬虫从互联网上抓取得到。本论文针对江苏省内13个地级市建立了对应的时序预测模型。第一步,对互联网数据进行处理,筛选出合适的特征进行模型训练。第二步,利用筛选后的特征数据进行时序预测模型的训练,并建立了一个基于多种基模型的混合模型。本文提出了一种改进后的MSE作为损失函数,使得模型的预测性能得到了提升。本研究创新性地提出,将移动流行区间法、与基于互联网数据的时序预测模型相结合,利用前者计算出的预警阈值和后者预测出的发病人数、进行手足口病的预警。最后,本研究提出了一种基于网络阈值疾病扩散模型的联合预警模型。本论文对网络阈值疾病扩散模型进行了改进,其创新之处在于将预警阈值作为判断节点是否激活的阈值,使得模型更加合理、更具有可解释性。本研究将时序预测模型与联合预警模型的预警效果进行比较,并将两个预警模型相结合,得到最终的预警模型。本文提出的最终的预警模型在2018年江苏省内13个地级市上,可预警的城市覆盖率为100%,平均可以提前8.8天进行预警。