论文部分内容阅读
临床路径是对病人诊疗过程标准化、规范化的重要管理工具,可以有效提升预期疗效、控制医疗费用。然而,当前的临床路径主要由人工制定,不仅耗时耗力,而且制定的路径在辅助指导诊疗规划时,难以应对个性化需求,阻碍了临床路径的推广与应用。随着医疗数据的快速累积,数据驱动的临床路径分析研究得到广泛关注,但是医疗数据高维、稀疏、噪声大的特点,使得医疗数据的特征学习成为这些研究中必不可少的环节。由于不同的分析任务需要不同的数据特征,本文针对临床路径分析中“往回看”的临床路径挖掘任务,以及“往前看”的临床路径个性化规划任务,分别展开了医疗数据特征学习问题的研究。论文的主要成果和创新点包括:(1)临床路径挖掘的目标是从历史数据中发现具有概括性和时序性的多数人的诊疗过程模型。由于临床路径的按天管理的特性,如何提取出每一天的核心特征,对于临床路径挖掘的效果至关重要。本文从临床实践出发,提出了基于主题模型的特征学习方法,将每个诊疗日映射为主题特征,通过引入主题分配约束、主题关联限制和本体先验知识,有效提升了所发现的主题的质量,为基于主题的临床路径挖掘奠定了基础。(2)临床路径个性化规划是基于病人当前诊疗信息去规划将来可能的事件,其基础是构建准确的预测模型。越能准确、完整反映出当前丰富信息的特征,越能提升预测的效果,进而服务于这类规划任务。本文提出了基于深度学习的特征学习方法,构建了诊断、诊疗日和诊疗项目三类分布式表征,利用临床路径中三者之间的不同关系,建立起自监督学习网络。方法将绝对时序的概念引入LSTM网络结构,能够更好捕获数据中的时序信息以用于这些表征的学习。在真实大规模医疗数据集上,与多个基准算法的实验评测验证了所提算法的有效性。(3)深度学习作为一个“黑盒”模型,其输出往往难以理解和推理,这在医疗领域中是难以被接受的。本文针对所提出的基于深度学习的特征学习方法,进行了可解释性方面的优化,一方面提出了基于双向LSTM网络的两层注意力模型,可以准确定位对模型输出起核心作用的诊疗日及诊疗日表征维度,另一方面提出了利用主题模型将表征维度主题化的方法,使得表征维度更易理解,从而提升了整个深度学习方法的可解释性。