论文部分内容阅读
研究背景:川崎病(KD)发病率逐年增高,目前已取代风湿热成为儿童后天获得性心脏病的首因,其治疗主要依赖大剂量静脉注射丙种球蛋白(IVIG)。但临床数据表明约10-20%患儿对单剂IVIG治疗不敏感,导致这部分KD患儿易发生冠状动脉病变(CALs)甚至巨大冠脉瘤,继而影响KD远期预后。目前已发现多个KD IVIG不敏感危险因子,并建立了多个预测模型,但没有一个模型能高效运用到不同地区、不同人群。研究目的:基于医疗大数据挖掘IVIG不敏感KD的独立危险因子,并构建一个适合重庆地区的IVIG不敏感KD早期预测模型。研究方法:1.资料收集:本研究收集2007年10月到2017年12月间在重庆医科大学附属儿童医院第一次因KD住院,且出院第一诊断为KD的患儿全部病例资料信息。2.分组:根据是否对首剂IVIG(2g/kg)敏感,将KD患儿分为IVIG敏感组KD和IVIG不敏感组KD。3.数据清洗:将所有纳入KD患儿信息导入SQL SEVER2008,通过该软件收集KD流行病学资料、实验室检验资料及影像学检查资料,并完成对数据的清洗工作。4.模型构建及验证:随机选择70%的数据集构建预测模型,剩余30%用于模型的验证。5.统计分析:本研究采用R语言3.4.1版进行数据分析,分类资料用百分比表示,连续性变量用均值±标准差表示。对于缺失率小于25%的变量采用多重插补法进行数据填充。对于连续性变量使用Mann-Whitney U检验,对于分类变量采用卡方检验。P值<0.05被认为具有显著统计学差异。组与组之间有显著统计学差异的纳入多变量分析。通过LASSO回归分析精简变量,通过多元逻辑回归分析确定最终独立危险因素。Hosmer-Lemeshow用于回归方程拟合优度检验,P值>0.05说明数据资料与回归方程相符。采用ROC和AUC反应模型的预测能力,以及模型预测的准确度与灵敏度。通过方程式及列线图来判断患儿发生IVIG耐药的可能性。结果:总共收集5789例KD患儿,其中符合纳入标准的患儿5277例。这5277例中包括348例(348/5277,6.59%)IVIG不敏感患儿和4929例(4929/5277,93.41%)IVIG敏感患儿。单因素分析发现42个变量存在显著统计学差异(P<0.05),其中24个变量在IVIG不敏感KD组中显著升高,18个变量显著降低。将单因素分析有统计学差异的变量纳入LASSO和多元逻辑回归分析最终得出8个KD IVIG不敏感独立危险因子包括:红细胞分布宽度(RDW)、血小板计数(PLT)、淋巴细胞百分比(P-LYM)、总胆汁酸(TBA)、钠离子浓度、白蛋白(ALB)、冠脉病变严重程度(D-CALs)和年龄。基于上述结果绘制列线图和建立对数等式。新预测模型的AUC=0.74,敏感性=76%,特异性=59%。随机抽取30%数据进行1000次模型验证,AUC均值=0.72。新模型与此前模型的比较,发现新模型AUC值更高。结论:1.使用SQL能高效准确收集、清洗医疗大数据资料。2.本研究发现3个新的IVIG不敏感KD独立危险因子包括:RDW、P-LYM和D-CALs。并通过RDW、PLT、P-LYM、TBA、ALB、血钠浓度、D-CALs和月龄构建IVIG不敏感KD预测新模型,且较此前预测模型能更好预测重庆地区KD患儿IVIG不敏感。