论文部分内容阅读
基于互联网数据的传染病疫情监测成为近年来传染病防治的热点研究内容。通过对2014年9月暴发的以广东省为中心的全国登革热疫情与登革热相关关键词的百度指数的关联性分析,发现地区(省、市)登革热疫情严重程度与该地区“登革热”关键词的百度指数呈很强的正相关性。为了实时地预测疫情动态,建立基于12个登革热相关关键词的百度指数的多元线性回归模型。在留一法交叉验证和反向测试中,该模型对于测试数据的预测值和实际值的皮尔森相关系数分别达到了0.89和0.73。经实验,该预测模型能够比较准确地预测登革热疫情动态,同时该研究对