论文部分内容阅读
结直肠癌是世界范围内肿瘤相关死亡的主要原因之一,已严重威胁人们的生命健康,造成巨大的疾病负担。因此,为临床医生提供用于结直肠癌预后分析和治疗方案辅助制定的工具具有重要意义。数据驱动的预后预测模型被认为是提高结直肠癌预后预测准确性的重要工具。此外,模型的泛化能力,即利用训练数据学习获得的预后模型在面向更多医疗机构真实临床数据的应用中均能获得良好的预测效果,是预后模型在临床实践中应用的前提。然而,当前的预后模型研究停留于模型开发阶段,缺少模型的泛化能力验证与临床应用。因此,基于真实临床数据和机器学习方法,建立一个更精准的结直肠癌预后预测模型,提高预后模型的泛化能力和临床使用价值,使其能在更多医疗机构中应用并得到良好的效果,具有重要意义。本论文验证了结直肠癌预后预测因子的时间依赖和非线性效应,提出了基于深度学习的半监督多任务生存分析方法,有效提高了预后模型的准确性,并利用半监督逻辑回归方法来提高风险预测模型的泛化能力,促进预后预测模型在临床实践中的应用。论文主要创新点包括:提出了针对时间依赖和非线性效应的非转移性结直肠癌预后模型,比忽略时间依赖和非线性效应的模型更准确地预测了非转移性结直肠癌患者的预后风险,为临床医生预后分析和治疗方案选择提供决策支持工具。提出了 一种基于深度学习的半监督多任务生存分析方法,将生存分析问题转化为多时序点生存概率预测的半监督学习问题组成的多任务学习模型。提出利用半监督损失和排序损失处理数据删失和生存概率非递增趋势。同时,实现预后因子的重要性评估及其对生存结局影响的可视化。为临床复杂结构化数据预后生存分析提供了基于深度学习的有效方法。提出了基于半监督学习的预后模型泛化能力提升方法。充分利用无标签数据,基于半监督逻辑回归方法建立非转移性结直肠癌预后风险预测模型,并从判别能力、校准能力、泛化能力、可解释性和临床实用性等五个方面与监督学习方法比较,扩展了当前对不同模型泛化能力的认识,为临床预测模型的建立提供了参考。利用外部数据验证了该方法的有效性,为面向多中心真实临床数据构建具有应用价值的预后模型提供技术支撑。