面向新冠患者恢复期的可解释性机器学习

来源 :华中科技大学 | 被引量 : 0次 | 上传用户:jf_long
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
大数据技术在近年来迅速发展,同时医学研究逐渐迈入信息化时代,两者的融合已经成为当下研究的热点。医疗领域的数据具有宝贵的研究价值,例如预测疾病的发生、分析患者的预后情况等。然而,医疗领域的数据往往是小样本数据集,存在数据量少的问题,无法训练传统的深度学习模型。因此,针对医疗大数据领域中的小样本问题进行研究,具有重大的意义以及现实价值。针对医学领域的小样本数据集,设计了基于医学经验的问题特征空间搜索方法。通过选择不同的特征子集作为分析变量和目标变量,结合专业医师经验,寻找具有研究价值的医学问题。另外设计了基于SHAP特征选择的小样本预测解释模型,首先对模型进行数据预处理,分别使用随机森林模型和SHAP方法得出候选特征子集,通过XGBoost模型比较候选特征子集的性能,筛选最优特征子集,并结合专业医师的判断,得出用于解释小样本问题的特征集合。最后使用该特征集合训练模型,并通过SHAP方法分析特征对于模型的影响。基于问题特征空间搜索的预测解释模型在协和医院的新冠数据集上进行了实验。通过基于医学经验的问题特征空间搜索方法,寻找到具有研究价值的医学问题,并针对“患者入院出院CT数据与出院三个月后的残留病灶的关系”这一问题进行实验。由SHAP产生的备选特征子集,通过专业医师筛选,得出26个指标用于后续实验。对XGBoost模型和Light GBM模型进行训练,AUC达到0.9左右,说明特征选择的效果较好。最后利用SHAP分析方法,挖掘出影响模型结果的医学指标,如真实病灶体积、病灶内有功能肺组织体积比例等,能够帮助医疗人员进行后续科研工作。
其他文献
近十几年来,多智能体系统的协调控制问题备受关注,并在无人机编队、卫星姿态对准和多机器人系统等领域具有广阔的应用前景。一致性作为多智能体系统协调控制的基础问题之一,主要目的是基于局部信息制定一些合适的控制协议,以保证所有智能体达到相同的状态。在多智能体系统的理论研究中,通常假设每个智能体具有充足的能量、良好的运算能力,且智能体间的通信是实时的。然而,在实际应用中,单个智能体的运算能力和通信能力依赖于
学位
随着基于人脸图像的计算机视觉任务广泛应用于商业场景,人脸质量评估的重要性逐渐显现,与深度学习的结合使其更具备实用价值。通过设计合适的人脸质量评估指标评估人脸质量,不仅可以有效给出评价人脸质量的指导性意见,作为参考获取质量更佳的图像,还可以筛选高质量人脸,作为后续处理任务的有效输入图像。本文提出了一种多任务人脸图像质量评估算法,在评估人脸综合质量的同时,给出五种质量评估指标的指导性结果。本文选择CA
学位
船舶火灾事故中约有七成发生在船舶机舱中。机舱内部空间大、环境复杂,火灾一旦发生会迅速蔓延且极难扑救,严重影响船员生命及财产安全。因此,研究一套能在机舱内尽早精确地检测出烟雾、火焰的方法对于船舶安全有着重要意义。基于视频的火灾识别算法具有监控范围大,检测精度高,不受空间、距离环境限制,易于保存数据等优点,但现有火灾识别算法多在一些专有数据集验证,对船舶机舱实际场景适应性不够,直接应用到船舶机舱存在识
学位
是软件维护过程中的重要部分,为开发人员提供简洁易懂的解释说明。工业界软件开发项目中往往缺乏注释。代码摘要的自动生成技术可以减轻繁琐复杂的人工标注,释放更多优质劳动力。因此,研究代码摘要的自动生成技术对促进业界相关应用的发展具有重要意义和价值。领域仍然存在一些挑战:1.传统的序列到序列模型可以学习到源代码的序列表示,却难以学习代码的结构化语义信息;2.在传统代码摘要模型中,模型在训练过程中的目的是将
学位
由于电网络造价昂贵,维护困难等因素,传统的集中式发电技术逐渐难以满足区域分布式多元化发展的需求。微电网作为一种分布式供电技术,可高效整合包括太阳能、燃料电池等多种清洁能源,因地制宜应用灵活,具有广阔的发展前景。但是,受外部环境和天气因素影响,风、光等可再生能源及非弹性负荷的不确定性变化给微电网的能量调度优化带来了巨大挑战。为此,本文以光伏发电单元、固体氧化物燃料电池(Solid Oxide Fue
学位
党建引领既是推动乡村善治的前提,也是乡村治理显著优势的重要体现。党建引领具有保证乡村治理社会主义方向的政治优势,具有提升乡村治理体系和治理能力的功能性优势,具有保障乡村治理中人民主体地位的社会性优势。实践中,一些地方通过选派第一书记、强化党组织建设来引领乡村治理,显示出良好成效。党建引领乡村治理实践路径在于强化组织建设实现党建引领政治优势,构建党政复合治理体系实现党建引领功能优势,发挥党组织资源链
期刊
数字病理在信息管理、远程咨询、专家会诊、读片交流和实践教学等方面的应用,都依赖于清晰无损的玻片扫描图像。玻片扫描成像系统技术是数字病理创新发展的关键性技术,但是玻片扫描成像系统在将玻片数字化的过程中会因为离焦等问题,导致局部图像模糊,影响后续判读。因此,需要在病理玻片数字化之后,对全玻片扫描图像进行清晰度评价,找出其中模糊的局部图像块。由于主观评价方法费时费力;有参考评价方法因难以获得参考图像而受
学位
在物联网实现万物互联的同时,海量数据的涌入给核心数据网络造成了巨大的压力,而且随着智能监控、自动驾驶等低延迟应用场景的出现,将数据传输到远端云服务中心会造成极大的传输延迟,无法满足实时性的需求。边缘计算作为云计算的扩展,通过任务卸载将部分任务转移至边缘执行,减少流向云中心数据量的同时降低了数据的传输延迟。而边缘设备性能不一、资源有限,如何合理进行任务卸载调度是一个重要的研究方向。现有的边缘任务卸载
学位
近年来,图计算因其在解决实际问题中的广泛适用性而受到广泛关注。广度优先搜索算法是很多图分析算法,例如单一起点最短路径问题和中心度算法的基石。而在加速特定算法的运行速度,提高运行的能量效率方面,现场可编程逻辑门阵列(Fieldprogrammable Gate Array,FPGA)相比于CPU和GPU更有潜力。因此,在FPGA上加速广度优先搜索算法具有重要现实和学术意义。当前FPGA上的广度优先搜
学位
近年来,计算机应用技术蓬勃发展,但不同类型的计算机应用对内存的需求大不相同。当前主流的两种异构内存系统只能满足特定类型应用的内存需求。平行结构的DRAM-NVM异构内存架构可以充分利用NVM的容量,适合对延迟不敏感、对主存容量敏感的应用,如大数据相关应用;层次结构的DRAM-NVM异构内存架构可以缓存频繁访问的数据,适合对延迟敏感、对主存容量不敏感的应用,如互联网相关应用。基于RISC-Ⅴ的可重构
学位