论文部分内容阅读
目的:利用病人报告结局(PROs)信息采集工具收集慢性肾脏病患者的相关信息,再通过决策树算法对其进行数据挖掘,建立决策树模型,构建适用于西医医师的慢性肾脏病证候诊断工具,有利于促进中成药合理使用。同时,也为中医证候诊断工具研制提供新思路和新方法。方法:利用病人报告结局(PROs)信息采集工具,对在2015年10月至2016年3月于广东省中医院和广州中医药大学第一附属医院的肾病科住院部的慢性肾脏病病人进行数据采集。经数据预处理后,运用SPSS Clementine中的决策树C5.0CART算法对数据进行数据挖掘,建立决策树模型。通过以下3方面对决策树模型进行评价:决策树模型对训练集和测试集的判断准确率:决策树模型的收益图;测试集的诊断性试验评价指标,包括计算其敏感度、特异度、阳性预测值、阳性似然比、约登指数,从而评价其诊断价值。结果:最后参与决策树建模的数据样本量为300例,慢性肾脏病中医证型共两种:脾肾气虚夹湿热瘀阻证和其他证。辨证指标共57个。应用SPSS Clementine的决策树C5.0和CART两种算法构建慢性肾脏病中医证候诊断模型。C5.0决策树模型对训练集、测试集的判断正确率分别为75.11%、68%。CART决策树模型对训练集、测试集的判断正确率分别为75.11%、62.67%。可见,此两个决策树模型的判断准确性尚可。C5.0和CART决策树模型的收益图,都是从较低的左端以斜对角线形状上升到较高的右端,说明此模型未能很好地提供信息,不是一个良好的模型。通过相关诊断性试验评价指标对模型进行评价。C5.0决策树模型敏感度是40%,特异度70%,阳性预测值8.7%,阳性似然比1.33,约登指数0.1。CART决策树模型敏感度是27.3%,特异度68.8%,阳性预测值13.0%,阳性似然比0.87,约登指数-0.04。由此可见,两个决策树模型的检验效果不佳。结论:根据本研究结果,本次研究所构建的慢性肾脏病中医证候诊断决策树模型对训练集、测试集的判断正确率尚可,但评估决策树模型的收益图说明模型未能很好地提供信息,不是一个良好的模型。敏感度、特异度、阳性预测值、阳性似然比、约登指数相关诊断性试验评价指标显示两个决策树模型的检验效果不佳。本次研究所构建的慢性肾脏病中医证候诊断决策树模型并不理想,其未能很好地为中医证候分类提供信息。