论文部分内容阅读
背景:乳腺癌是一种严重危害女性身心健康和生命安全的全球性高发恶性肿瘤,其早期的诊治可以显著地提高患者的生存率。目前乳腺癌的检测与诊断手段仍主要是影像、超声和组织病理活检技术,但是,这些技术均存在着明显的局限性。另外,靶向治疗的临床应用近年来虽然也有了明显进展,可是由于乳腺癌的发病机制并未完全阐明,其诊疗和预后效果仍不理想。外泌体是近年来强势兴起,在多种体液中存在的、包含有较多稳定的、可反映细胞来源和疾病特征标记物的待检成分。新发现,其可作为载体,携带多种内容物在细胞外间质内和体液中定向运输,直接或间接作用于肿瘤的侵袭、转移和复发等病理生理过程。LncRNA的本质是不具有编码能力的大分子RNA,它的表达则具有组织和疾病特异性,已被证实在肿瘤发病中能够发挥重要的调控作用。于是对外泌体和lncRNA的相关研究,目前成为肿瘤领域生物标记物研究的热点。目的:本研究拟通过对乳腺癌相关受试者血浆样本中外泌体大分子RNA的检测,对TCGA数据库中乳腺癌相关组织标本转录组数据的深度挖掘,以及两者的联合分析,发现与乳腺癌病变相关的候选lncRNAs;继而运用生物信息学分析方法,发掘它们潜在的诊断价值与调控机制。材料与方法:(1)采集20例乳腺癌和20例乳腺良性肿瘤患者10 m L抗凝外周血,提取各自标本血浆外泌体中的RNA,进行大分子RNA测序分析,得到lncRNA的表达谱;(2)利用数据库信息挖掘和R语言从TCGA下载和分析乳腺癌组织样本的lncRNA和mRNA测序数据;(3)利用加权基因共表达网络分析,筛选有意义的差异表达lncRNAs和mRNAs;(4)模块的功能分析;(5)对选择出的功能模块中的lncRNAs进行诊断能力评价和生存分析。结果:(1)对乳腺癌相关受试者血浆外泌体的大分子RNA进行高通量基因测序分析。与乳腺良性肿瘤患者的样本相比,从乳腺癌患者样本中共筛选出差异表达的lncRNA155个(其中72个上调,83个下调)和mRNA 2450个(其中1619个上调,831个下调)。值得关注的是大部分的lncRNAs未曾被报道过,其生物学功能则有待于进一步的挖掘;(2)从TCGA数据库中筛选出待分析的866例乳腺癌相关组织样本表达谱数据集,鉴定出差异表达的lncRNA 4879个(其中2883个上调,1996个下调)和mRNA 5304个(其中:3226个上调,2078个下调),尤其发现之中有41个lncRNAs在外泌体中也呈现差异表达;(3)利用加权基因共表达网络分析,识别了19个模块,其中的蓝绿色模块、黄色模块、紫色模块、蓝色模块和棕色模块与乳腺癌的临床分期显著性相关,这5个模块内共包含28个候选lncRNAs;(4)模块的功能分析还揭示了蓝绿色模块主要是与癌症转录的失调、过氧化物酶增殖体激活受体(PPARs),以及PI3K-AKT信号通路的作用相关;黄色模块是与细胞信号传导及胞间作用有关;紫色模块是与蛋白质消化、吸收调控过程相关,还涉及细胞外基质受体的相互作用;蓝色模块可能与细胞周期调控、DNA复制和损伤修复相关;棕色模块可能参与嘧啶核苷酸的代谢过程;(5)对这几个模块内28个候选lncRNAs进行了乳腺癌ROC诊断价值的曲线绘制,以及患者的生存分析,其中8个lncRNAs的ROC曲线的AUC面积>80%,说明它们各自已经可以很好的区分乳腺癌与正常样本,有辅助诊断潜能。另外,有2个lncRNAs在低表达时体现出不良的预后结局,提示它们可能可以作为乳腺癌患者预后的生物标记物。结论:本研究通过对乳腺癌和良性乳腺肿瘤患者血浆外泌体表达谱数据以及TCGA中的乳腺癌组织表达谱数据进行联合分析,从而鉴定了28个与乳腺癌病变相关的中候选lncRNAs。从功能角度的分析,揭示了它们与乳腺癌的发病,以及癌细胞的增殖和迁移有关。并发现LINC01340、AL355974.2、AC009414.2、AC135584.1、HOXA-AS3、MBNL1-AS1、MIR222HG和KCNJ2-AS1这8个lncRNAs具有较好的诊断潜能;而AC124798.1和AL355974.2这2个lncRNAs则可能可以作为乳腺癌预后的分子标记物。另外,还有一大批未知功能的、但与乳腺癌发生发展密切相关的lncRNAs有待于我们去挖掘它们的生理与病理意义,以及在乳腺癌病程中的分子调控作用。