论文部分内容阅读
第一部分肺腺癌转移相关lncRNAs标志物的筛选及预后评估模型的构建目的:局部复发和转移是肺癌患者死亡的主要原因,肿瘤转移相关长链非编码RNA(long non-coding RNAs,lncRNAs)分子与肺癌患者的复发预后密切相关。本研究旨在通过分析癌症基因组图谱(The Cancer Genome Atlas,TCGA)数据库,筛选与肺腺癌转移和无复发生存时间(relapse-free survival,RFS)密切相关的lncRNAs分子标志物,继而构建患者复发预后评估模型,同时结合体外实验,初步验证模型分子在肿瘤细胞侵袭迁移中的作用。方法:1.肺腺癌转移相关lncRNAs分子标志物的初步筛选。分析TCGA数据库(https://cancergenome.nih.gov/)中347例肺腺癌患者的lncRNAs表达数据和相关临床数据,使用R语言edgeR包对肿瘤转移组(n=158)和非转移组(n=189)的lncRNAs进行差异表达分析,按照筛选标准(adjusted p value,FDR<0.05;|logFC|>1),初步筛选出与肺腺癌转移相关的lncRNAs分子。2.肺腺癌预后lncRNA panel的构建。将347例肺腺癌患者随机分为训练集(n=231)和验证集(n=116)。在训练集中,上述肿瘤转移相关的lncRNAs分子全部纳入单因素Cox 比例风险回归模型,分析lncRNAs表达与患者RFS的相关性,选出P值小于0.05的lncRNAs,后者纳入逐步多因素Cox 比例风险回归模型,根据回归系数对每个lncRNA分子进行加权,建立预测肺腺癌患者复发的lncRNA panel公式。应用Kaplan-Meier生存分析和时间依赖性ROC曲线评估lncRNA panel的预后价值。3.1ncRNA panel的验证。在验证集和总样本集(包括全部受试者)中,我们使用从训练集中得到的lncRNA panel公式计算出肺腺癌复发的风险值,再根据训练集中得到的最佳临界值将患者分为高风险组和低风险组两组。应用Kaplan-Meier生存分析和时间依赖性ROC曲线检测lncRNA panel在验证集和总样本集中的预后价值。4.检测lncRNA panel预测预后的独立性。在总样本集中进行单因素、多因素Cox比例风险回归模型分析和Kaplan-Meier分层生存分析,检测lncRNA panel预测肺腺癌患者预后的独立性。5.比较lncRNA panel、TNM分期及联合模型对肺腺癌患者的预后预测能力。进一步将lncRNA panel与具有独立预后作用的TNM分期结合构建联合模型,并通过时间依赖性ROC曲线比较lncRNA panel、联合模型和TNM分期对肺腺癌预后的预测能力。6.研究lncRNA panel分子在肺腺癌转移中的作用。培养肺腺癌细胞系,通过lncRNAs过表达/干扰及体外迁移和侵袭实验,分析关键lncRNAs分子对肺腺癌细胞侵袭和迁移能力的影响。结果:1.LncRNAs差异表达分析结果显示,肺腺癌患者转移组和非转移组间差异表达的lncRNAs为735个,可作为用于肺腺癌患者预后评估的候选标志物。2.在训练集中,将候选lncRNAs分子全部纳入单因素Cox 比例风险回归模型,获得43个P值小于0.05的lncRNAs,进一步进行多因素Cox比例风险回归模型逐步分析,建立包含6个lncRNAs分子的肺腺癌预后lncRNA panel公式:Riskscore=(0.191404×LINC02323)+(0.256783×ZNF649.AS1)+(0.502202×HNF4A.AS 1)+(-0.319007×LINC01819)+(-0.306173 ×FAM222A.AS 1)+(-0.304856 ×LINC00672)。取Riskscore的平均值为lncRNA panel预测预后的最佳临界值,根据该临界值分为高风险组(n=119)和低风险组(n=112)。Kaplan-Meier生存分析显示,高风险组患者的RFS显著低于低风险组患者(log-rank test,P<0.001);时间依赖性ROC曲线分析结果显示lncRNA panel预测患者复发的3年ROC曲线下面积(area under ROC curve,AUC)为 0.6970(95%CI:0.6102-0.7821),5 年 AUC为 0.6981(95%CI:0.5866-0.8089)。3.在验证集中,Kaplan-Meier生存分析结果显示,高风险组的RFS显著低于低风险组(log-rank test,P<0.001);分别以3年和5年为截点进行时间依赖性ROC曲线分析结果显示,lncRNA panel预测复发的3年AUC为0.7620(95%CI:0.5884-0.9459),5 年 AUC 为 0.8421(95%CI:0.6534-0.9957)。总样本集中所得结果与验证集一致:Kaplan-Meier生存分析显示高风险组患者的RFS显著低于低风险组患者(log-rank test,P<0.001);分别以3年和5年为截点进行时间依赖性ROC曲线分析,结果显示lncRNA panel预测复发的3年AUC为0.7059(95%CI:0.6322-0.7801),5 年 AUC 为 0.7307(95%CI:0.6368-0.8217)。4.在总样本集中,单因素和多因素Cox 比例风险回归模型显示,TNM分期和lncRNA panel为肺腺癌患者的独立预后因素。Kaplan-Meier分层生存分析结果显示,lncRNA panel在早期组(TNM Ⅰ期+Ⅱ期)、原发肿瘤状态(T1+T2)组和区域淋巴结状态(N)组的高风险组患者的RFS显著低于低风险患者(log-rank test,P<0.05)。5.lncRNA panel与TNM分期对肺腺癌患者预后预测能力的比较:以3年为截点时,总样本集 lncRNA panel 的 AUC 为 0.7059(95%CI:0.6322-0.7801),TNM分期的 AUC 为 0.6678(95%CI:0.5769-0.7613),lncRNA panel 对肺腺癌预后的预测能力显著优于TNM分期(P<0.05);以5年为截点时,总样本集lncRNA panel的 AUC 为 0.7307(95%CI:0.6368-0.8217),TNM 分期的 AUC 为 0.6111(95%CI:0.5044-0.7229),lncRNA panel对肺腺癌预后的预测能力显著优于TNM分期(P<0.05)。将lncRNA panel与TNM分期系统相结合构建预测肺腺癌复发的联合模型,以3年为截点时,联合模型在总样本集中的AUC为0.7474(95%CI:0.6745-0.8198);以5年为时间截点时,AUC为0.7670(95%CI:0.6723-0.8564)。联合模型与TNM分期比较,预测能力显著优于TNM分期(P均<0.05),联合模型与单独lncRNA panel的预测能力比较,无显著性差异(P均>0.05)。6.Transwell迁移和侵袭实验结果显示,lncRNA panel中的6个分子对肺腺癌细胞的迁移及侵袭能力均有影响,以LINC02323促进肺腺癌细胞迁移和侵袭的作用最为明显。结论:1.本研究通过分析TCGA数据库,首次系统筛选了与肺腺癌转移密切相关的lncRNAs标志物,进一步结合分子预后分析,构建了由6个lncRNAs分子构成的lncRNA panel,后者作为肺腺癌复发预测模型,是独立预后因素,其预测效能显著优于传统的TNM分期系统,具有重要临床应用价值。2.该lncRNA panel中的6个分子与肿瘤转移及患者预后密切相关,提示其可作为转移癌的潜在治疗靶点。第二部分LINC02323参与肺腺癌转移的相关分子机制研究目的:基于第一部分肺腺癌转移相关lncRNAs标志物的筛选及其预后模型构建的研究,我们进一步对模型分子进行功能解析,重点探讨LINC02323在转化生长因子β(transforming growth factor-β,TGF-β)调控的肺腺癌细胞上皮间充质转化(epithelial-mesenchymal transition,EMT)中的分子生物学作用机制。方法:1.分析LINC02323表达的临床价值。运用starBase v2.0分析软件,分析LINC02323在不同肿瘤组织中的表达水平,运用Kaplan-Meier生存分析TCGA数据库中肺腺癌LINC02323的表达水平与肺腺癌患者预后的相关性。2.观察LINC02323表达对肺腺癌细胞生物学行为的影响。采用逆转录-实时荧光定量PCR(reverse transcription quantitative real-time polymerase chain reaction,RT-qPCR)实验检测LINC02323在肺腺癌细胞系中的表达情况,并根据其在不同细胞系中表达水平的高低,分别采用LINC02323干扰或过表达的方式进行干预;采用核质分离实验检测LINC02323在细胞中的分布情况;采用噻唑蓝比色法(MTT)实验检测LINC02323对肺腺癌细胞增殖能力的影响;采用Transwell小室实验检测LINC02323对肺腺癌细胞迁移和侵袭能力的影响。3.研究LINC02323在TGF-β调控的肺腺癌细胞EMT中的分子生物学作用机制。采用TGF-β刺激的方式,诱导肺腺癌细胞EMT的发生,分别通过RT-qPCR或Western blot检测EMT标志物及LINC02323的表达;对相应细胞进行LINC02323干扰或过表达,通过RT-qPCR、Western blot方法检测LINC02323在TGF-β调控的肺腺癌细胞EMT中的作用;采用starBase v2.0和miRDB软件分别预测与LINC02323相互作用的microRNAs及下游靶基因,LINC02323及相关microRNAs在TCGA转录组表达谱数据中的关系进行Spearman相关性分析,通过双荧光素酶报告实验和RT-qPCR方法验证;设置拯救实验,通过干预关键分子表达、RT-qPCR、Western blot、Transwell 等方法,进一步阐明 LINC02323 作为 ceRNA在肺腺癌细胞EMT及转移中的作用机制。结果:1.StarBase v2.0软件分析结果显示,LINC02323在肺腺癌、肺鳞状细胞癌、膀胱移行细胞癌、胰腺癌、肝细胞癌、肾乳头状细胞癌、结肠癌和胆管癌等多种肿瘤组织中的表达水平显著高于正常组织(P均<0.05);Kaplan-Meier生存分析显示,LINC02323高表达与肺腺癌患者的不良预后相关,高风险组患者和低风险组患者的 RFS 存在显著差异(log-rank test,P<0.001)。2.核质分离实验结果显示,LINC02323在细胞质和细胞核中都有分布,分布比例分别是44.49%和55.51%;MTT实验结果显示,与对照组相比,LINC02323干扰和过表达后,肺腺癌细胞增殖活力没有显著变化(P均>0.05);Transwell小室实验结果显示,与对照组相比,干扰和过表达LINC02323后,肺腺癌细胞的迁移及侵袭能力有显著变化(P均<0.05)。3.RT-qPCR和Western blot结果显示,TGF-β可以诱导肺腺癌细胞发生EMT过程,同时上调LINC02323的表达;LINC02323在肺腺癌细胞中干扰或过表达后,显著影响了 TGF-β诱导的EMT过程;生信预测结果表明,LINC02323与miR-1343-3p之间存在靶向结合位点,miR-1343-3p可直接结合转化生长因子β受体 I(transforming growth factor-β receptor 1,TGFBR1)基因 3’-UTR;TCGA 转录组表达谱数据分析结果显示,LINC02323与miR-1343-3p在肺腺癌组织中的表达呈负相关(P<0.05);双荧光素酶报告系统和RT-qPCR实验验证了 LINC02323可以与miR-1343-3p靶向结合,miR-1343-3p可以和TGFBR1基因3’-UTR靶向结合;通过拯救实验,发现抑制miR-1343-3p可以拯救下调LINC02323对肺腺癌细胞EMT、迁移和侵袭的影响,即LINC02323可以作为ceRNA,通过“海绵样作用”竞争结合miR-1343-3p,间接调节TGFBR1的表达,促进肺腺癌细胞EMT的发生及其转移能力的提高。结论:1.本研究首次发现,LINC02323在包括肺腺癌在内的多种肿瘤组织中高表达,与肺腺癌不良预后密切相关,提示其可能发挥重要的促癌功能。2.LINC02323通过调节肺腺癌细胞中的miR-1343-3p-TGFBR1轴参与TGF-β调控的肿瘤细胞EMT过程,说明该分子是肺腺癌侵袭转移过程中的关键分子,可作为抗肿瘤转移治疗的潜在靶点。