论文部分内容阅读
高血压是最常见的慢性病,也是心脑血管疾病最重要的危险因素。对于那些血压控制不充分或无法通过生活方式干预实现的患者,药物治疗是控制血压最重要的治疗方法。然而,由于高血压患者血压控制因素的复杂性,医生很难给出合适的个性化处方。迄今为止,很少有研究论文从机器学习的角度评价抗高血压药物的疗效。本论文尝试使用机器学习来预测抗高血压药物的疗效,从而为临床抗高血压药物的使用提供一些参考。本文的主要内容如下:首先,我们从华西医院信息系统中收集了2008-2016年期间一共148735例高血压住院患者的相关资料,包括高血压患者的临床检验信息和基本信息。因为本文研究的是单药物治疗方案,因此对五种服用了常用抗高血压药物(Irbesartan,Meto prolol,Felodipine,Amlodipine,Levamlodipine)的患者信息进行了提取和分析,我们选取了高血压患者的的17个临床检验特征以及2个基础特征,构建出了高血压患者的数据集。紧接着我们基于现有提取出来的19个特征的高血压患者数据集,绘制了五种抗高血压药物的特征谱。然后使用logistic回归、支持向量机、随机森林和梯度提升树四种机器学习算法,建立了对应的五种抗高血压药物的预测模型,并且对建立的预测模型进行了性能评价。实验结果表明,机器学习方法对这些药物的控制效果具有较高的预测能力,特别是具有相当高的敏感性。其中,基于SVM的Felodipine药物预测模型敏感性为99%,其他药物模型敏感性均在80%以上,四种机器学习算法的AUC值都接近0.8。最后,我们使用特征工程算法对现有的关键特征进行了特征选择,在保证药物的预测模型性能的前提下,把构建模型的特征数量从原有的19个降低到7个,使得构建的预测模型应用于临床辅助决策时更加简便。论文使用特征选择和特征谱可视化两种方法挖掘了影响血压控制效果的特征因素,为医生在高血压药物治疗中提供了一些新的思路和参考。综上,在本数据集上,机器学习方法能够预测五种常用抗高血压药物的控制效果,建立的预测模型具有较高的预测灵敏度,表明基于临床大数据的机器学习算法可以成为辅助医生开药的有力工具。然而,由于高血压形成和发展的复杂性以及高血压患者数据集的缺乏,机器学习模型也有待进一步改进。