论文部分内容阅读
本文基于卵巢癌真实数据集,构建了预后因素评价和生存率预测方法。根据协变量为多水平分类变量的特点,我们运用了回归分类树(CART)和Cox模型相结合的CART-COX方法,并且将这种方法与基于Cox模型的直接回归法和两步回归法(朱炜,2005)进行了比较分析。
卵巢肿瘤是女性生殖器常见的三大恶性肿瘤之一,死亡率居妇科恶性肿瘤首位。因卵巢癌早期无症状,发病隐匿,且缺乏有效的诊断方法,诊断时多为晚期,生存率较低。为提高患者生存率,医生们做了许多努力和尝试,特别是提高和改善患者预后。影响卵巢癌预后的因素很多,在疾病进展过程中,多种因素共同影响患者预后。如何根据患者的不同情况,综合判断患者预后状况,预测生存率是迫切需要解决的问题。本文采用的数据集是从全国七家医院搜集的879例卵巢癌患者临床随访数据。数据集包括存活期以及年龄、原发灶大小、病理类型、临床分期、淋巴是否转移、病理分级、手术残余灶大小、化疗方法、化疗方案、CA125等风险因素。这些风险因素多为多类别的分类变量,在做回归分析时往往需要引入哑变量。当分类变量个数和水平较多时,需要引入的哑变量数目与样本量相比较会很大。如果直接做回归,它们之间的共线性会导致模型参数估计失真甚至反序等诸多问题,这也是我们在解决实际问题中遇到的最大困难。针对该问题,我们尝试了两步回归法和CART-COX方法。基于卵巢癌临床随访数据,我们把CART-COX方法与基于Cox模型的直接回归法和两步回归法做比较。结果表明,从拟合及预测的总体效果看,CART-COX方法比两步回归法和直接回归都更占优势。最后,为方便医生使用,我们给出了生存率表。