论文部分内容阅读
目的构建和验证潜在的临床因素和长链非编码RNA(long non-coding RNA,lnc RNA)的整合模型,并评估该模型在肾透明细胞癌中的预测价值,为预测肾透明细胞癌在白种人患者中的总体存活率提供理论依据。方法从癌症基因组图谱数据库中下载了459名肾透明细胞癌白种人患者的转录组数据、微小RNA表达数据和相应的临床因素数据。将383名符合纳入排除标准的受试者以2:1的比例随机分配到训练模型组(n=255)和模型测试组(n=128)中。使用训练模型组数据构建肾透明细胞癌的lnc RNA风险评分预后模型,并使用模型测试组数据对构建的风险评分预后模型进行验证。在训练模型组数据中,通过单因素Cox回归、LASSO回归和多因素Cox回归分析构建了风险评分预后模型。随后,将有预后意义的临床变量与风险评分预后模型相结合,构建整合模型,以更好地预测肾透明细胞癌的预后。模型的预后评估能力通过一致性指数及其95%置信区间以及1年、3年、5年、10年的时依受试者工作特征曲线下面积及其95%置信区间、列线图和相应的校准曲线来评价;使用该模型是否可使患者受益通过决策曲线来评价。随后,将训练模型组数据构建的预后模型在模型测试组数据和整个数据集数据内进行验证。为更好探讨预后模型中lnc RNA的功能,绘制了竞争性内源性RNA网络。根据网络中的靶基因进行了基因本体功能注释和通路富集分析并构建了蛋白质相互作用网络。根据蛋白质相互作用网络,综合12种算法进一步筛选出了排名前十位的核心基因,并利用UALCAN在线网站对核心基因的表达值进行了分析。结果1.在训练模型组数据中,筛选出了12个lnc RNA作为肾透明细胞癌白种人患者的预后相关生物标志物,其中有五个(AC008556.1、AC012404.1、AC092296.1、AC099684.2和SPINT1-AS1)是保护性因素(风险比<1),另外七个(AC108752.1、AC131097.1、AL606519.1、FOXP4-AS1、LINC00261、LINC02446和LINC02475)是危险性因素(风险比>1)。AC012404.1、AC092296.1、AC099684.2、AC108752.1、AC131097.1、AL606519.1和LINC02475是七个新发现的预后相关候选生物标志物。2.风险评分、年龄和肿瘤淋巴结转移(Tumor Node Metastasis,TNM)分期都是肾透明细胞癌患者的独立预后因素,根据这些因素构建了整合风险评分、年龄和TNM分期的预后模型。该模型的预测性能评估结果显示:在训练模型组、模型测试组和整个数据集数据的一致性指数及其95%置信区间分别为0.863(0.830-0.896)、0.863(0.814-0.912)和0.841(0.812-0.870);在训练模型组、模型测试组和整个数据集数据的5年时依受试者工作特征曲线下面积及其95%置信区间分别为0.923(0.879-0.967)、0.861(0.777-0.945)和0.879(0.834-0.924)。校准曲线显示了预后列线图的预测结果与实际结果之间的一致性较好。3年和5年的决策曲线均表明临床上应用该模型可使患者获益。3.竞争性内源性RNA网络中包含50个靶基因;基因本体功能注释得到59条功能信息;通路富集分析得到四条通路;蛋白质相互作用网络中有29个结点之间存在连线。4.筛选出了排名前十位的核心基因(VEGFA、GATA4、DDIT4、NOG、CAV1、CCND1、LOX、PRDM1、NTRK2和BMP6)。结论1.整合风险评分、年龄和肿瘤TNM分期的新的预后模型可以作为潜在的准确预后工具来评估肾透明细胞癌白种人患者的生存情况。2.AC012404.1、AC092296.1、AC099684.2、AC108752.1、AC131097.1、AL606519.1和LINC02475是七个新发现的预后相关候选生物标志物,有待实验的进一步研究。