论文部分内容阅读
随着我国社会的发展,终末期肾脏病成为了我国及全球范围内严重危害人类健康、加重经济负担的公共卫生问题之一,并且目前最主要的治疗手段是血液透析。生存分析是统计科学的重要分支,在医学及其他相关研究中都有广泛的应用,但是传统的主要分析模型——Cox模型假设事件风险是关于患者属性间线性组合的指数,并且通常需要人工对属性进行增删,这样的假设在真实世界中可能过于理想和简单:1)属性间可能存在非线性关系;2)人工增删属性需要医学经验;3)属性间并非总是相互独立,结果导致预测的事件风险率不高。本文便着手解决这个重要问题,提出利用深度神经网络来自动识别患者属性间的复杂关系,从而拟合出更符合实际需求的模型,提高预测准确率。本文详细分析了传统模型的理论不足,结合深度学习的技术特性,利用其自动学习数据属性的特性,让属性间的复杂关系得到体现,尝试构建改进的深度模型,一方面省去传统人工选择重要属性、根据先验经验添加交互作用属性项的繁琐步骤,另一方面拓展线性假设为非线性假设,从而使得模型更符合实际并且模型的适用面更广。在构建多层网络过程中,层数、神经元数通过网格搜索调至最优,并运用训练前规范化、正则化、Dropout等技术来提高模型效果并防止过拟合。为了验证模型的实际效果,本文使用来自医院肾内科血液净化室的维持性血液透析病人真实数据集,分别在经过预处理之后的数据集上进行传统模型和深度模型的训练预测。实验结果表明,数据量较少时,传统模型预测精度较高,深度模型预测精度偏低,而数据量足够多时,传统模型预测准确率低并且模型易失效,深度模型则能保持较好的效果,平均准确率提高将近20个百分点,充分体现了深度模型的优越性。高准确率的预测对提高维持性血液透析病人的生存质量至关重要,而深度模型能比对不同属性差异患者之间的事件风险率高低,医护人员可以更容易识别出关键因素进而给患者提供效果更好的治疗选择。另一方面方法的改进思想不仅仅可以只用于解决热点医学领域问题,还可以推广应用于众多领域的生存分析和可靠性分析。