决策树模型在预测乳腺癌5年生存状况研究中的应用

来源 :吉林大学 | 被引量 : 0次 | 上传用户:zeroorhero
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
目的:通过构建决策树(Decision Tree,DT)模型对女性乳腺癌5年内生存状况进行预测,为临床医生预测乳腺癌患者的预后和调整个体化的随访策略提供参考。方法:本研究对2010年1月至2014年10月确诊的405例乳腺癌患者的生存状况进行了随访,确定了患者自确诊乳腺癌后5年内的生存状况(生存或死亡),并记录了与乳腺癌预后可能相关的17种因素。通过多种模型筛选,最后选择DT的回归树算法(Classification and Regression Tree,CART)构建了预测模型,在参数调整后,对这405例患者进行了10折交叉验证(cross validation,CV)的训练及测试。最后通过受试者特征(Receiver Operating Characteristic Curve,ROC)曲线、Precision–Recall(PR)曲线、学习曲线、校正曲线对模型性能进行了评估。结果:经过计算,决策树模型在十倍交叉验证中获得了理想的结果:平均召回率=0.91,标准差=0.05。而预测结果验证了结果和模型的稳定性:召回率=0.88,准确率=0.92,F1值=0.86,真阳性率(True Positive rate,TPR)=0.88。ROC的曲线下面积(Area under curve,AUC)达到0.91,PR曲线中平均AUC为0.882。学习曲线表明该模型呈过度拟合状态。校准曲线则表明该模型主要表现过度自信即低估了死亡风险。在这17项特征中,病理分期,分子分型,肿瘤大小,HER-2等因素在我们的预测过程中显示出明显的相关性和重要性。结论:研究表明,我们的决策树模型在预测女性乳腺癌患者5年内生存状况方面具有一定的准确性和稳定性,尤其保证了高度死亡风险患者的召回率,这一结果可以对临床医生预测患者的预后和调整个体化随访策略提供一定的参考。
其他文献
朝医学的历史,是挖掘整理医古籍,学术不断发展,不断提高的历史。1.朝医基础研究进展;目前朝医基础研究是全方位的。朝医文献研究,已构筑了朝医学的基本体系。实验研究与传统
本文从草原生态破坏、牲畜品质下降和牧民贫富分化三个层面分析了草场承包带来的困境,介绍了巴音图嘎嘎查通过草场整合建设家庭牧场的改革试点情况,评析了家庭牧场形式整合草
【目的】旨在研究从山东种鸡场弱雏中分离致病性菌株的生物学分类,及调查分离菌株携带的耐药基因和病原菌耐药流行情况。本实验鉴定了一株致病性弗格森埃希氏菌,并调查了该菌
《联合国海洋法公约》第74条和第83条作出了临时安排的规定。临时安排是海洋划界前的过渡性措施,具有临时性和实际性的特点。同时,临时安排不影响专属经济区和大陆架最后界限
受垃圾填埋场污染的浅层含水层的治理与修复是滨海平原区地下水管理的一项具有挑战性的课题。为了解决这个课题,本研究以天津市某非正规垃圾填埋场地为研究区,通过传统的以资源调查为目的的物探技术,运用高密度电阻率方法判断滨海平原区垃圾填埋场天然地层的稳定性和连续性,并确定渗漏通道的大小和位置,为后续的数值模拟分析提供地质基础资料。研究使用数值地下水建模软件(Visual Modflow 2011.1),建立
2011年12月22日至25日,大型外宣纪录片《大国和谐》在中央电视台中文国际频道黄金时段播出,播出后旋即引起了国内外观众的关注和热议。  “让我看懂中国”  来自美国的留学生格林说:“《大国和谐》拍得很有意思,让我们感到中国和世界其实已经无法分开,也明白了中国不是一夜暴富的。”网友“单飞跃”在微博中评价:“《大国和谐》中那种盲目的自大感和崛起欲似乎有些衰减和收敛,多了全球化与市场化的观察视角,不