论文部分内容阅读
环形RNA(circ RNA)是细胞内一类非常特别的RNA,它来自外显子异常剪切,即一个来自下游的剪切片段和来自上游的剪切片段非常规地结合成为环形。不同于线性RNA的是,circ RNA是通过共价结合形成的环形RNA,并且这种环形相比其线性结构更加稳定。在经典的RNA测序中,由于环形RNA的末端结合在了一起,导致环形RNA缺少经典RNA测序的重要特征分子“尾巴结构”,因此这些环形RNA在过去的测序中并未引起普遍关注。但是新兴的生物信息学方法的发展以及深度测序技术的大量应用让更多的研究都聚焦在环形RNA上。已有研究显示环形RNA与基因转录后调控有密切联系,关于环形RNA更多的功能仍有待探索。因此环形RNA的鉴别对于理解复杂基因表达中的调控以及细胞功能的分子机制都有着极其重要的意义。在这篇论文里,重点是研究神经母细胞瘤的环形RNA鉴别以及相关生物统计分析。具体工作如下:我们对目前学术界流行的高通量测序技术和相关比对工具进行了全面深入的比较和分析,开发了一种生物信息学的计算方法来识别人类神经母细胞瘤中的环形RNA。选取神经母细胞瘤的四类细胞系CHLA、COG、SK-N-BE以及SMS的高通量RNA-seq测序结果作为数据处理对象。利用已注释的人类外显子边界序列构建“错序外显子-外显子连接数据库”。我们通过Bowtie2二代测序数据分析工具,将RNA-seq双端数据分别与ENSEMBL人类hg19全基因组参考序列以及“错序外显子-外显子连接数据库”进行两次比对。实验测序结果以及生物信息处理方法带来的误差可能会使得结果集中存在假阳性的环形转录本。因此我们利用统计学理论并使用使用R语言编程对候选数据集进行假阳性(FDR)控制。利用候选数据集中读片段分别构建空分布和待检验分布,将FDR控制在阈值以下。并对结果进行去冗余筛选与整理,我们对神经母细胞瘤的14个样本的环形RNA做了相关鉴定。最后,对找到的环形RNA作相关生物统计分析。我们发现,药物对于染色体上环形RNA的数量有显著影响,而对于母基因上环形RNA变体的数量影响不大;基因上环形RNA亚型的剪接位点大多数与基因的剪接位点是一致的。此外我们对能够转录出环形RNA的基因做了GO分析,探究形成环的基因参与形成的蛋白质在相关生物过程,分子功能以及细胞组件中的作用。