论文部分内容阅读
环形RNA(circular RNA,circRNA)是一类丰富、稳定、保守的非编码RNA分子,与线性RNA不同,它不具有5’末端帽子和3’末端ploy(A)尾巴,并以共价键形成封闭环状结构。研究表明非经典的RNA剪接模式使得外显子反向首尾连接形成环状RNA。这类RNA分子在不同的物种中具有进化保守性、稳定性,细胞及不同发育阶段表达特异性,且具有基因表达调控功能。这些特点使其成为RNA领域的研究热点。首先,本文整理并注释了公共来源和本课题组检测的人类环形RNA数据集,利用生物统计学方法对数据集进行分析,发现环形RNA的表达具有细胞特异性且与多种疾病存在重要联系。根据收集的环形RNA数据集提取其基本信息,然后利用基因注释提取与之相关的基因组内容,滤除假阳性、冗余数据。最终获得了7804个基因、共转录出32,914条人类外显子来源的环形RNA数据集,同时完成了环形RNA的基因组注释。接着利用生物统计学方法对环形RNA的基因组特征及细胞特异性表达进行了研究,发现环形RNA较多分布在1、2号染色体上,且普遍包含2~3个反向剪接外显子。环形RNA的转录过程更倾向于由一定长度的外显子反向剪接。另外可变环化现象在基因组中普遍存在,而且在不同细胞系间呈现出表达特异性。最后本文对转录环形RNA较多的基因进行了富集分析,发现作为基因转录产物的环形RNA参与了多个重要的生物学途径,且与多种人类表型和疾病存在着紧密联系。其次,本文基于核糖体进入位点(IRES)二级结构的相似性识别了环形RNA内部的IRES结构,并预测了环形RNA序列中的开放阅读框(ORF),对其蛋白质编码潜能进行了评估。预测有6608个环形RNA同时包含IRES和ORF,具有编码蛋白潜能,约占环形RNA的20.08%。最后,对环形RNA数据集及其基因组特征、编码蛋白潜能等分析结果进行整理,构建了人类环形RNA分子数据库circRNADb,为该领域内进一步深入研究环形RNA奠定了基础。