论文部分内容阅读
前列腺癌是男性中常见的肿瘤疾病。针对局限性前列腺癌,一般疗法是根治性前列腺切除术或者放射疗法,有时还会辅以激素疗法。经过治疗,大部分病人病情得到缓解,但一部分病人前列腺癌仍会复发。随着对前列腺癌研究的深入,人们对前列腺癌复发的机制提出了几种解释:比如间质到上皮转化、雄激素信号通路的再活化以及抑制转移的基因缺失。同时,越来越多的复发预测因子被鉴定出来,比如雄激素受体剪切突变、TMPRSS2:EGR基因融合以及长的非编码RNA等等。尽管这些预测因子大大改善了对前列腺癌复发的预测效果,但距离真正地了解前列腺复发以及准确预测、避免前列腺癌复发还有很长一段路要走。所以,这里我们利用转录组测序以及外显子组捕获测序分析复发与未复发前列腺癌在分子水平的差异,进一步根据找到的差异推测前列腺癌复发的原因以及鉴定更多用来预测前列腺癌复发的分子标记,从而大大改善前列腺癌的预后,为不同水平的病人提供更合适的治疗方法。在第一部分,我们利用GEO数据库里有关前列腺癌复发样本与未复发样本的转录组测序数据进行了三种分析:可变剪切分析,差异共表达分析以及单核苷酸突变分析。通过可变剪切分析,我们在复发组样本MYC基因上找到一个特异的可变剪切事件,该可变剪切会导致NM002467转录本发生移码突变,最终会影响蛋白质的结构以及功能,进而对MYC蛋白质参与的一系列重要的生命活动产生重大影响,包括肿瘤的发生发展。同时,还筛选到10个差异共表达基因集,这些基因集内的基因在未复发组样本中表达之间呈显著正相关,但在复发组样本中,正相关关系则大大减弱,甚至变成负相关。这种表达相关性的改变,可能暗示了组内某种调控关系的改变,也许这种调控关系的改变正是肿瘤复发进程中的一部分。通过DCGL软件,我们还筛选到几个最重要的、对复发组和未复发组之间调控关系改变影响最大的调控因子COUP-TF1、HNF-4alpha2、PPARA、MAFK、NFE2、GCGR,并由此推断这些调控因子通过对靶基因表达调控的改变促进了前列腺癌的复发。另外,我们还分别在复发组和未复发组找到2411和2971个特异的外显子突变,其中分别有101个和119个突变已经收录在dbsnp138数据库。通过对其中的移码突变以及终止获得突变所在的基因进行功能聚类和通路分析,发现复发组受这种突变影响的基因主要聚集在细胞周期、胞外基质受体相互作用、黏着斑、泛素介导的蛋白质水解以及癌症通路这些与癌症发生发展密切相关的通路里。通过深入分析这些突变或许能为我们探索前列腺癌复发机制提供突破口。在第二部分里,通过对30个复发病人以及44个未复发前列腺癌病人的前列腺癌组织进行外显子捕获测序,并从四个方面对它们进行分析,最终,我们得到以下结果:通过单核苷酸突变检测,我们分别在复发组和未复发组筛选到24个(18个非同义突变和6个同义突变)和31个(21个非同义突变、6个同义突变、1个终止缺失和3个终止获得)特异的高频外显子突变位点,并在大量样本中对一些位点进行了验证。通过随机森林算法,我们筛选到50个可用于区分复发病人与未复发病人的最优突变位点,并且通过交叉验证算法得出由这些突变位点构建的随机森林模型预测复发/未复发的错误率低至5%。同时通过mutsig软件我们分别在复发组和未复发组筛选到191个和189个显著突变基因,且这些基因主要分布在MAPK3活性、肌动蛋白丝、视黄酸受体信号路径的负调控、应对高氧、Notch信号通路以及慢性骨髓性白血病通路,暗示这些通路可能与前列腺癌的发生发展密切相关。最后通过拷贝数突变的检测,我们在复发组筛选到21个特异性缺失区域和190个特异性扩增区域,通过Cisgenome软件定位,发现这些区域主要分布在1号(p3,q3)、2号(q3)、3号(p2,q2)、8号(q2)和12号染色体(q1,q2),尤其是8号染色体,具体来说就是8号染色体长臂2区(q2)。而其中涉及的基因主要参与癌症通路(JUP, EPAS1, TP53, MDM2, NOS2, FGF12, TPR, STAT1, CTNNA2)以及α干扰素信号传导通路(IRF9,STAT1, STAT2)。最终通过对前列腺癌复发与未复发样本进行转录组测序数据分析以及外显子组捕获测序数据分析,我们找到了很多复发组特有的突变,包括可变剪切、单核苷酸突变以及拷贝数变异,这些突变所在基因参与了重要的生物学过程,包括与癌症有关的活动。另外,还筛选了50个最优突变构建随机森林分类模型,预测准确率高于90%。不过,这些突变与前列腺癌复发之间的具体关系以及分类模型的准确性还需要进一步验证。