论文部分内容阅读
研究背景及目的传染病严重威胁着人类健康,及时发现和处理传染病突发公共卫生事件,可有效地减少蔓延及危害。目前我国的突发公共卫生事件报告中,对传染病突发公共卫生事件分级仍然是依靠人工完成,不能满足对传染病突发公共卫生事件快速反应的要求,急需要开发出一套基于信息、计算机资源的自动决策系统以辅助科学决策。为达到这一目的,需要选择恰当的判定指标,并进行分级量化,以建立相关的判别模型。研究内容及方法利用国家突发公共卫生事件报告系统中2005至2007年麻疹突发事件的相关数据,使用SPSS Clementine 11.1.1软件,采用C5.0决策树与多分类有序反应变量的logistic回归分析相结合的方法,以发现麻疹事件级别判定的规律性为例,选择判定指标,并进行分级量化,建立用于计算机自动判定级别的最佳模型。研究结果通过C5.0算法获得了决策树模型以及自变量指标的重新分组的标准。采用多分类有序反应变量的logistic回归分析,获得麻疹突发事件级别logistic回归模型。采用训练数据回代和预测测试数据对C5决策树模型、logistic回归模型进行评价,结果显示C5决策树模型的训练回代正确率为92.57%,预测测试数据正确率为85.71%;logistic回归模型的训练数据回代正确率为94.06%,预测测试数据正确率为83.67%;两者对于麻疹突发事件的级别判定和预测都具有很高的正确性,而且两种模型与原始级别判定级别即人工判定结果具有高度一致性,两种模型的预测效果没有显著性差异。结论通过研究确定了麻疹突发事件级别判定的具体指标及其分组标准,结合应用决策树模型和logistic回归模型可实现对麻疹突发事件自动进行级别判定的目的。本研究的方法和过程可为其他传染病或其他公共卫生事件自动判别方法研究提供参考。