论文部分内容阅读
目的:①筛选原发性高血压病的预后危险因素,探索动脉功能和中医证候与原发性高血压病预后关系;②构建出基于人工智能算法的原发性高血压病预后预测模型,评估并挑选出具有较好的预测能力的预后模型。
方法:采用回顾性队列研究,随访我院2001年-2013年中医治疗原发性高血压患者人群(该队列人群为我院国家自然基金项目“基于临床数据的CPOE模式评价中医疗效的医学循证研究”所建立),随访时间为2015年1月-2016年12月。以确诊为原发性高血压病的患者为研究对象,采集一般资料、病情病史特征、实验室指标、血管功能及心功能检查指标、中医证候等相关基线指标,以及终点结局事件发生情况。使用COX比例风险回归模型筛选与高血压不良预后相关的因素。基于血管功能指标和中医证候,利用R语言将数据按7:3的比例划分为训练集和测试集,分别使用决策树、随机森林、支持向量机和人工神经网络算法建立原发性高血压病的预后预测模型,以测试集评估并对比四种预后预测模型的预测效能,评估并建立具有较好预测能力的模型,以便更准确地对原发性高血压病的不良预后进行预测。
结果:本研究最终共有985例病例进入统计分析,年龄为(55.82±5.80)岁,病程(10.60±4.20)年,其中284例患者出现终点事件。
1原发性高血压病的预后危险因素分析
COX回归单因素分析及共线性诊断提示年龄、病程、性别、早发心血管病家族史、BMI、吸烟史、情绪、饮食习惯、Hcy、Na+、平均ABI、平均动脉压、FMD、头痛、水肿、气虚血瘀证、阴虚阳亢证、肝肾阴虚证、阴阳两虚证这19变量与原发性高血压病预后关系密切(P<0.05)。经COX回归多因素分析提示病程、性别、早发心血管病家族史、BMI、饮食习惯、Hcy、平均ABI、平均动脉压、FMD、头痛、水肿、气虚血瘀证、阴虚阳亢证、肝肾阴虚证、阴阳两虚证这15个变量与原发性高血压病预后关系密切(P<0.05)。
2预后模型的构建和比较
基于血管功能指标、中医证候,结合原发性高血压病的预后危险因素,最终有18个变量进入预测模型建模。基于这18个建模变量,分别通过决策树、随机森林、支持向量机和人工神经网络算法构建4个原发性高血压病的预后预测模型。通过混淆矩阵评估四种算法对训练集的数据解析能力,发现基于相同变量的情况下,人工BP神经网络的错误率最低(19.1%),其次为支持向量机(24.2%),决策树(28.7%)和随机森林(28.7%)并列最差。再将测试集数据分别带入4个模型,横向对比并验证四种模型的预测能力,发现变量相同情况下,支持向量机错误率最低(26.5%),其次为随机森林(28.2%)和决策树(28.9%),错误率最高的是人工BP神经网络(30.9%)。因而,在本研究中,基于相同变量情况下,四种模型中支持向量机的预测效能最好,其次为随机森林和决策树,预测效能最差的是人工BP神经网络。
结论:
1.基于本研究数据的结果,原发性高血压病的预后相关因素如下:病程、性别、早发心血管病家族史、BMI、饮食习惯、Hcy、平均ABI、平均动脉压、FMD、头痛、水肿、气虚血瘀证、阴虚阳亢证、肝肾阴虚证、阴阳两虚证。说明动脉功能指标、血管内皮功能、中医证候均确与原发性高血压病的预后关系密切。对原发性高血压预后判断有一定的帮助。
2.基于相同变量时,四种算法构建的预后模型对训练集数据均具有较好的解析能力;在测试集中进行集中验证和对比评估后,发现支持向量机对原发性高血压病的预测效能最好,其次为随机森林和决策树,人工神经网络最差。
3.动脉功能指标、中医证候对原发性高血压预后判断有一定的帮助,基于血管功能和中医证候建立的原发性高血压预后预测模型也能达到良好的预测效果。
方法:采用回顾性队列研究,随访我院2001年-2013年中医治疗原发性高血压患者人群(该队列人群为我院国家自然基金项目“基于临床数据的CPOE模式评价中医疗效的医学循证研究”所建立),随访时间为2015年1月-2016年12月。以确诊为原发性高血压病的患者为研究对象,采集一般资料、病情病史特征、实验室指标、血管功能及心功能检查指标、中医证候等相关基线指标,以及终点结局事件发生情况。使用COX比例风险回归模型筛选与高血压不良预后相关的因素。基于血管功能指标和中医证候,利用R语言将数据按7:3的比例划分为训练集和测试集,分别使用决策树、随机森林、支持向量机和人工神经网络算法建立原发性高血压病的预后预测模型,以测试集评估并对比四种预后预测模型的预测效能,评估并建立具有较好预测能力的模型,以便更准确地对原发性高血压病的不良预后进行预测。
结果:本研究最终共有985例病例进入统计分析,年龄为(55.82±5.80)岁,病程(10.60±4.20)年,其中284例患者出现终点事件。
1原发性高血压病的预后危险因素分析
COX回归单因素分析及共线性诊断提示年龄、病程、性别、早发心血管病家族史、BMI、吸烟史、情绪、饮食习惯、Hcy、Na+、平均ABI、平均动脉压、FMD、头痛、水肿、气虚血瘀证、阴虚阳亢证、肝肾阴虚证、阴阳两虚证这19变量与原发性高血压病预后关系密切(P<0.05)。经COX回归多因素分析提示病程、性别、早发心血管病家族史、BMI、饮食习惯、Hcy、平均ABI、平均动脉压、FMD、头痛、水肿、气虚血瘀证、阴虚阳亢证、肝肾阴虚证、阴阳两虚证这15个变量与原发性高血压病预后关系密切(P<0.05)。
2预后模型的构建和比较
基于血管功能指标、中医证候,结合原发性高血压病的预后危险因素,最终有18个变量进入预测模型建模。基于这18个建模变量,分别通过决策树、随机森林、支持向量机和人工神经网络算法构建4个原发性高血压病的预后预测模型。通过混淆矩阵评估四种算法对训练集的数据解析能力,发现基于相同变量的情况下,人工BP神经网络的错误率最低(19.1%),其次为支持向量机(24.2%),决策树(28.7%)和随机森林(28.7%)并列最差。再将测试集数据分别带入4个模型,横向对比并验证四种模型的预测能力,发现变量相同情况下,支持向量机错误率最低(26.5%),其次为随机森林(28.2%)和决策树(28.9%),错误率最高的是人工BP神经网络(30.9%)。因而,在本研究中,基于相同变量情况下,四种模型中支持向量机的预测效能最好,其次为随机森林和决策树,预测效能最差的是人工BP神经网络。
结论:
1.基于本研究数据的结果,原发性高血压病的预后相关因素如下:病程、性别、早发心血管病家族史、BMI、饮食习惯、Hcy、平均ABI、平均动脉压、FMD、头痛、水肿、气虚血瘀证、阴虚阳亢证、肝肾阴虚证、阴阳两虚证。说明动脉功能指标、血管内皮功能、中医证候均确与原发性高血压病的预后关系密切。对原发性高血压预后判断有一定的帮助。
2.基于相同变量时,四种算法构建的预后模型对训练集数据均具有较好的解析能力;在测试集中进行集中验证和对比评估后,发现支持向量机对原发性高血压病的预测效能最好,其次为随机森林和决策树,人工神经网络最差。
3.动脉功能指标、中医证候对原发性高血压预后判断有一定的帮助,基于血管功能和中医证候建立的原发性高血压预后预测模型也能达到良好的预测效果。