论文部分内容阅读
目的:我国糖尿病患者人数多、危害大、经济负担重,且以2型糖尿病(Type 2 Diabetes Mellitus,T2DM)为主。然而,目前胰岛素初始方案的制定未能充分考虑个体化治疗。本研究通过收集真实世界中需要长期使用胰岛素类药物的T2DM患者医疗数据,采用数据挖掘和机器学习方法,建立T2DM患者胰岛素治疗方案个体化的预测模型,以辅助基层医疗机构进行T2DM患者的胰岛素治疗。
方法:本研究收集了四川省人民医院内分泌科、老年内分泌科和草堂内分泌科2016年1月至2019年6月的T2DM住院患者医疗数据。通过数据预处理后,获得可用于建模的数据集。随后,应用随机森林算法进行了特征选择,并应用支持向量机、随机森林、梯度提升决策树和XGBoost四种机器学习算法分别建立了胰岛素用药方案的种类预测模型、剂量预测模型和比例预测模型,分别对胰岛素用药方案的种类选择、每日总剂量以及胰岛素类药物之间的剂量比例进行预测,并通过模型评价和比较筛选出性能最佳的模型。
结果:通过纳入排除标准进行筛选后,获得1048例目标病例数据以及111个变量,包括定性变量31个,定量变量80个。种类预测模型中XGBoost表现最好,其微观平均ROC曲线下面积为0.74,宏观平均ROC曲线下面积为0.73;剂量预测模型中XGBoost表现最好,其MSE、MAE分别为:0.0175、0.0921,90%预测值与其对应的实际值之间的差值绝对值小于0.2014(u/kg),95%预测值与其对应的实际值之间的差值绝对值小于0.2338(u/kg);比例预测模型中表现最好的仍然是XGBoost,其MSE、MAE分别为:0.0420、0.1557,90%预测值与其对应的实际值之间的差值绝对值小于0.2246,95%预测值与其对应的实际值之间的差值绝对值小于0.3040。
结论:本研究给胰岛素用药方案制定提供了一个全新的思路,所建立的三种模型具有一定的参考价值。该模型通过加入其它医疗机构的数据进一步完善后,可以推广使用,实现其临床应用价值。
方法:本研究收集了四川省人民医院内分泌科、老年内分泌科和草堂内分泌科2016年1月至2019年6月的T2DM住院患者医疗数据。通过数据预处理后,获得可用于建模的数据集。随后,应用随机森林算法进行了特征选择,并应用支持向量机、随机森林、梯度提升决策树和XGBoost四种机器学习算法分别建立了胰岛素用药方案的种类预测模型、剂量预测模型和比例预测模型,分别对胰岛素用药方案的种类选择、每日总剂量以及胰岛素类药物之间的剂量比例进行预测,并通过模型评价和比较筛选出性能最佳的模型。
结果:通过纳入排除标准进行筛选后,获得1048例目标病例数据以及111个变量,包括定性变量31个,定量变量80个。种类预测模型中XGBoost表现最好,其微观平均ROC曲线下面积为0.74,宏观平均ROC曲线下面积为0.73;剂量预测模型中XGBoost表现最好,其MSE、MAE分别为:0.0175、0.0921,90%预测值与其对应的实际值之间的差值绝对值小于0.2014(u/kg),95%预测值与其对应的实际值之间的差值绝对值小于0.2338(u/kg);比例预测模型中表现最好的仍然是XGBoost,其MSE、MAE分别为:0.0420、0.1557,90%预测值与其对应的实际值之间的差值绝对值小于0.2246,95%预测值与其对应的实际值之间的差值绝对值小于0.3040。
结论:本研究给胰岛素用药方案制定提供了一个全新的思路,所建立的三种模型具有一定的参考价值。该模型通过加入其它医疗机构的数据进一步完善后,可以推广使用,实现其临床应用价值。