论文部分内容阅读
目的近年来,由于人口老龄化、不良生活行为习惯及室内外空气污染等因素的影响,慢性阻塞性肺疾病(Chronic Obstructive Pulmonary Disease,COPD)发病率、死亡率逐年增长,防控形势十分严峻,已成为我国最主要的公共卫生问题之一。既往研究显示,我国40岁及以上COPD患者的COPD相关知识知晓率、肺功能检查率及药物治疗率均处于较低水平,COPD在公众认知,疾病诊断及药物治疗等卫生服务利用方面不容乐观。基层医疗机构的医生对肺功能检查掌握不足,对肺功能检查重视不足,同时由于肺功能检查适用人群存在局限性,可能会诱发或加重呼吸系统疾病等诸多问题,均增加了 COPD早期诊断的困难。目前,国内外针对COPD经济、便捷、有效的筛查技术仍在积极探索中。本研究拟探讨广东省40岁及以上COPD患者的COPD相关知识知晓、肺功能检查、药物治疗情况及相关的影响因素,为该地区制定个性化的COPD防控措施提供线索及理论依据,对开展实际工作有重要的现实指导意义;构建基于机器学习算法的COPD诊断模型,为基层医疗机构早期诊断COPD提供决策辅助,为促进科学有效的早期干预提供有利工具。方法依托2014-2015年中国居民慢性阻塞性肺疾病监测项目,该项目采用多阶段分层整群随机抽样方法进行调查。本次研究数据来源于2014-2015年广东省COPD监测数据,对调查对象进行问卷调查、体格检查及支气管扩张试验前后肺功能检查。1.关于社区COPD患者,支气管扩张试验后肺功能检查指标FEV1/FVC<0.70者诊断为COPD患者,共447例COPD患者作为研究对象。采用复杂加权估计患者COPD相关知识知晓率、肺功能检查率和药物治疗率及率的95%置信区间;采用复杂加权校正的Rao-Scottχ2检验分别进行不同人口学特征、呼吸道症状及COPD相关危险因素暴露情况组间率的比较;采用基于复杂抽样设计的Logistic回归进行多因素分析。2.COPD诊断模型构建时,使用问卷调查、体格检查及肺功能检查数据完整的2 867例居民作为研究对象。采用SMOTE(Synthetic Minority Over-sampling Technique)算法以解决数据中存在的类别分布不平衡问题;采用基于随机森林的变量重要性评分方法筛选预测变量;以是否患COPD作为输出变量,基于K最近邻法、支持向量机、决策树、随机森林和Logistic回归五种机器学习算法构建COPD诊断预测模型;采用十折交叉验证对模型进行考核;使用准确率、精确率、召回率、灵敏度、特异度、受试者工作特征曲线及曲线下面积评价五种模型的分类性能,并选择出最佳的分类预测模型。结果1.关于社区COPD患者知识知晓、检查及治疗状况的分析结果显示:广东省40岁及以上COPD患者的COPD相关知识知晓率为7.5%(95%CI:4.8%-10.2%),戒烟、有家族呼吸道疾病史的患者COPD相关知识知晓率较高(P均<0.05);患者肺功能检查率为5.7%(95%CI:3.3%-8.0%),居住地、个人呼吸系统疾病史是COPD患者肺功能检查的影响因素(P均<0.05),城镇患者肺功能检查率(13.5%)高于乡村患者(2.5%),有个人呼吸道疾病史患者肺功能检查率(15.2%)高于无个人呼吸系统疾病史患者(1.9%)。COPD患者药物治疗率为12.9%(95%CI:9.3%-16.5%),婚姻状态、慢性咳嗽、呼吸困难症状及个人呼吸系统疾病史均与药物治疗率有关(P均<0.05),已婚患者药物治疗率(11.5%)低于其他婚姻状态患者(28.5%),有慢性咳嗽的患者药物治疗率(36.3%)高于无慢性咳嗽患者(6.0%),伴有呼吸困难的患者药物治疗率(31.0%)高于无呼吸困难患者(7.3%),存在个人呼吸系统疾病史的患者药物治疗率(30.5%)高于无个人呼吸系统疾病史的患者(6.0%)。2.COPD预测模型的建模结果显示:随机森林模型、支持向量机模型、K最近邻模型、Logistic回归模型、决策树模型的AUC分别为0.963、0.926、0.905、0.820 和 0.813;准确率分别为 90.604%、84.564%、81.029%、72.774%和 77.539%;灵敏度分别为 88.949%、85.235%、84.295%、61.700%和 79.284%;特异度分别为 92.260%、83.893%、77.763%、83.848%和 75.794%;精确率分别为 91.995%、84.106%、79.136%、79.253%和76.611%;召回率分别为 88.949%、85.235%、84.295%、61.700%和79.284%。随机森林模型具有最优的分类预测性能,在五种模型中预测效果最好。结论1.广东省40岁及以上COPD患者的COPD相关知识知晓率、肺功能检查率及药物治疗率均较低。采取有针对性的干预措施,提高患者的COPD相关知识知晓率、肺功能检查率及药物治疗率,加强COPD防控工作,以降低COPD疾病负担。2.基于机器学习算法的COPD诊断预测模型能够较为精准地识别COPD患者,为基层医疗机构早期诊断COPD提供辅助依据,为实现“早诊断、早治疗、早干预”的防控策略提供了新思路。