论文部分内容阅读
研究背景:骨肉瘤(osteosarcoma,OS)是一种原发于骨骼的恶性肿瘤,全世界的发病率约3/100万。骨肉瘤的发病率有两个高峰,第一个高峰是儿童及青少年,发病率约2-5/100万,第二高峰为50岁以上老年人,发病率约1.5-5/100万。骨肉瘤的临床症状多表现为关节疼痛、活动受限、局部肿胀,少数病例可发生病理性骨折,肺转移是最常见的远隔脏器转移部位,其次为骨转移。手术治疗及联合化疗是目前治疗骨肉瘤最主要的手段,而对于复发性骨肉瘤及发生肺转移的患者总体五年生存率约为20%。目前抗PD-1抗体已在临床进行尝试应用,其远期疗效及对复发性骨肉瘤及发生肺转移的患者治疗效果仍需进行长期观察。因此,迫切需要寻找新的治疗靶点。近年来,越来越多的研究发现转录因子的突变与肿瘤的发生发展密切相关。已有研究表明转录因子RAD21在多种肿瘤中过表达,包括上皮来源的恶性肿瘤如口腔癌、膀胱癌、肺癌、乳腺癌、宫颈癌、肝癌等。同时也与间叶来源的肿瘤及血液系统疾病的发生发展密切相关。RAD21的过表达与胃癌的侵袭转移和不良预后有关,以及降低了胃癌对奥沙利铂药物的敏感性,有望成为肿瘤治疗的有效靶点。目前已有文献报道RAD21受其上游基因的调控参与骨肉瘤的发生发展,RAD21的扩增可能与骨肉瘤患者预后不良相关,但是,他们并未对转录因子RAD21在骨肉瘤中的表达模式及其相关分子机制进行研究。并且RAD21作为转录因子在骨肉瘤中可能调控的靶基因尚未见报道,利用集成计算生物学技术挖掘芯片序列数据来研究RAD21的分子机制也未见报道。研究目的:通过筛查骨肉瘤相关的芯片及测序数据,筛选出可能在骨肉瘤中有重要作用的转录因子RAD21,从多个角度评估RAD21在骨肉瘤中表达的临床意义及探讨RAD21在骨肉瘤中的潜在分子机制,为后续体内外实验提供循证证据。研究方法:(1)收集临床骨肉瘤组织样本的内部RNA测序(in-house RNA-seq)数据,综合公共数据库(Gene expression omnibus,GEO)、Array Express、SRA、和Oncomine获取骨肉瘤样本及非肿瘤对照样本的微阵列数据,使用R4.0.3软件的limma包处理基因芯片获得骨肉瘤差异表达基因(Differentially Expressed Genes,DEGs);(2)利用Animal TFDB数据库鉴定转录因子,通过文献调研选定转录因子RAD21进行后续的研究;(3)获取RAD21m RNA表达谱数据,应用SPSS22.0、STATA12.0、R4.0.3、Perl、Graghpad8.0等工具,计算标准化均数差(SMD)、综合受试者操作特征曲线(s ROC曲线),应用在线数据库Biomedical Informatics Institute分析RAD21表达与骨肉瘤患者预后的关系。评估RAD21对骨肉瘤患者诊断、预后评估的临床价值;(4)筛选RAD21共表达基因及通过Cistrome Data Browser(http://cistrome.org/db/#/)获取RAD21下游靶基因,二者与骨肉瘤上调的DEGs取交集得到潜在靶基因,通过对潜在靶基因做基因本体论(gene ontology,GO)和基因与基因组的京都百科全书(kyoyo encyclopedia of genes and genomes,KEGG)通路分析,探讨RAD21在骨肉瘤中的潜在的分子机制。用String(https://string-db.org/)及Cytoscape3.7.0构建这些潜在靶基因的蛋白质相互作用(protein-protein interaction,PPI)网络并可视化,使用MCODE算法确定与RAD21蛋白质紧密连接邻域的潜在靶基因。用Cistrome Data Browser反向验证与RAD21结合的下游靶基因。研究结果:(1)通过挖掘GEO、Array Express、SRA、和Oncomine数据库,共纳入13组微阵列数据(共包含316例骨肉瘤样本及67例非骨肉瘤对照样本),limma包处理所有基因芯片及内部RNA测序数据,共得到4725个上调的DEGs,4952个下调的DEGs;(2)选取大于3个数据集中出现的上调差异基因(109个)计算SMD,获得80个在骨肉瘤中显著上调的基因。在Animal TFDB数据库中查询高表达的80个基因,最终获得18个转录因子,分别是SHOX2、ZNF462、HMGB3、HOXB9、HOXD10、MYBL2、ATAD2、BCL9、BRCA2、CDK1、CENPF、PRAME、RAD21、TRIP13、TTF2、ILF2、MAD2L2和NOL11。对这18个转录因子进行文献调研,最终选定转录因子RAD21做后续的研究。(3)在骨肉瘤内部(in-house)RNA测序数据中,发现RAD21在骨肉瘤组织中的表达与邻近组织未见明显差异(14.2615±0.11155 vs 13.5037±0.97119,P=0.2505),由于样本量太少,未能发现明显的统计学差异。综合所有高通量数据及RNA内部测序数据,结果提示169例骨肉瘤样本中的RAD21 m RNA表达水平较56例非肿瘤样本显著上调(标准化均数差(SMD)=1.00,95%可信区间(CI):(0.29;1.71,P<0.05))。综合受试者操作特征曲线(s ROC曲线)下面积(AUC)为0.80,敏感度为0.72,特异度为0.77,诊断比值比为8.87。此外,RAD21高表达的骨肉瘤患者较低表达患者有着更差的无病生存期(DFS)(HR=4.0916,P=0.0391)。(4)经Pearson相关性分析获得大于2个数据集出现的共表达基因(2547个)以及经Cistrome DB网站获取的得分为1分以上的RAD21预测靶基因(13533个),两者和大于2个数据集出现的DEGs(657个)取交集得到221个交集基因,即为差异表达的RAD21共表达靶基因,这些潜在靶基因主要集中在细胞周期、DNA复制、碱基切除修复等通路上。为了探索221个潜在靶基因的相互作用关系,我们构建了蛋白相互作用网络(PPI),得到12个与RAD21联系最紧密的潜在靶基因,将这12个基因输入cistrome DB网站中,得到3个(CENPK,CHEK1,SMC4)转录起始位点与RAD21转录峰重叠的靶基因,其中RAD21与CENPK和CHEK1的表达水平呈强正相关,提示RAD21可能正调控这两个基因的转录。研究结论:骨肉瘤中RAD21 m RNA表达水平较非肿瘤对照样本显著增高,RAD21表达上调可能是骨肉瘤患者不良预后的因素。此外,RAD21及其潜在靶基因可能在骨肉瘤发生机制的细胞周期、DNA复制、碱基切除修复通路中发挥重要的调控作用,CENPK和CHEK1可能为其调控的下游主要靶基因,为后续体内外实验提供循证证据。