论文部分内容阅读
环状RNA(circular RNA)是一类通过共价连接形成单链闭环结构的非编码RNA。它产生于细胞核内的反向剪接事件,之后被输运出细胞核并在细胞质中富集。环状RNA在多种生物的各种组织中广泛表达,但目前大部分环状RNA的功能尚不明确。尽管如此,环状RNA表达的组织特异性与时间特异性暗示着它们在不同生物过程中发挥重要作用。本论文对环状RNA的动态表达进行了深入研究,开发了从测序数据估计环状RNA表达量的工具,通过大鼠Body Map数据探索了环状RNA的动态表达模式及其与相关生物功能之间的关联,并从临床应用的角度研究了外周血中环状RNA作为疾病诊断标志物的可能性。论文的主要研究内容包括:(1)建立了一种更加精确稳定的环状RNA定量方法,并开发了相应的生物信息学工具。环状RNA动态表达研究的第一步就是要在生物样本中确定环状RNA的表达量。现有的生物信息学工具直接使用测序数据比对结果中支持反向剪接事件的测序读段(reads)数目来表示环状RNA的表达水平,它们的结果在精确度上有所欠缺。基于模型的转录本定量方法已经在线性RNA上证明了自身定量结果的精确性。这些方法却由于不能识别环状RNA,而不能用于环状RNA的定量。本论文提出一种基于模型的转录本定量框架来估计环状RNA相对表达水平的新方法。为了能够让现有基于模型的方法识别环状RNA,我们将环状RNA的转录本序列转换成伪线性转录本序列,然后在定量阶段将其作为线性RNA序列看待。来自环状RNA的读段会被定位到相应的伪线性转录本上,从而可以确定原环状RNA的表达水平。在模拟数据集上的一系列实验结果表明:新方法可以有效的得到线性RNA与环状RNA的精确估计;新方法可以更加准确的描述同基因中环状转录本与线性转录本相对表达水平之间的比例;线性RNA的定量准确性也因为新方法考虑了转录组数据中原本被忽视的环状RNA得到提高。真实的去核糖体建库的RNA-seq数据显示:与现有的几种环状RNA分析工具(CIRI,KNIFE,circ RNA_finder)相比,新方法预测出的环状RNA表达量与q RT-PCR的定量结果有着更强的相关性,证明了新方法得到的结果比现有的定量工具更准确;新方法在重复样本的实验数据中得到的定量结果有最小的标准差,说明了我们的方法比常规的基于读段计数的方法具有更好的稳定性。(2)分析了11种大鼠组织在4个不同发育阶段的环状RNA动态表达模式,并进一步探索了环状RNA的特异性表达与大鼠的生理功能之间的关联性。首先,我们在大鼠Body Map RNA-seq数据集上使用新建立的定量方法对大鼠11个组织在4个不同发育时间阶段的环状转录本与线性转录本的表达水平进行了系统的分析,从头建立了完整的大鼠全转录组表达谱。经比较发现,大鼠的环状RNA序列比对应的线性RNA更加保守,并具有更高的组织特异性。通过对大鼠环状RNA表达的时空特异性与相关生物功能的关联性研究发现,大鼠组织中特异表达的环状RNA与该组织所行使的生物学功能有很强的相关性。另外,在环状RNA表达的时间特异性方面,睾丸中环状RNA的表达水平随着时间变化剧烈:首先是随着性成熟进展的快速累积,然后是伴随着衰老的急剧衰减。睾丸中表达水平随时间波动的环状RNA的功能与精子生成过程密切相关。同时,时空特异表达的环状RNA的表达水平变化和所对应的同源线性RNA的表达没有相关性。这暗示着环状RNA可能在类似精子生成之类的生理过程中行使着独立于线性RNA的生物学功能。(3)探讨了将人类外周血单个核细胞(PBMC)中环状RNA用于肺结核早期诊断上的可能性。活动性肺结核的早期诊断在临床上具有重要意义,因此从外周血中寻找肺结核的诊断标志物具有重要的临床应用价值。由于环状RNA的动态表达具有重要的生物学功能,我们假设环状RNA的表达变化能够反应疾病的状态。论文探索了人类外周血单个核细胞中的环状RNA表达变化作为肺结核诊断标志物的可能性。人类外周血中不同组分的RNA-seq数据分析发现,环状RNA在外周血各主要成分(全血,红细胞,血小板,单个核细胞)中表达量丰富。同时,肺结核病人和正常对照的外周血单个核细胞中环状RNA表达有明显差异。进一步基于KEGG通路分析其中差异表达的环状RNA可能的功能,发现肺结核病人样本中的数个与肺结核的产生与发展相关的通路。这些通路上的环状RNA表达量发生了上调,并且与同基因的线性RNA相比不成比例。最后,从这些环状RNA中选择了七个环状RNA来建立肺结核诊断分子标志物,利用分子标志物中的环状RNA的表达水平在不同样本上的差异来区分肺结核病人与健康人群。我们在验证组样本中使用q RT-PCR测定了该组环状RNA分子标记物的表达量,并计算了肺结核指数(TB index)来诊断活动性肺结核,得到了较好的区分效果(AUC值=0.946)。上述结果说明,人类PBMC中的环状RNA表达可以作为活动性肺结核诊断的分子标志物,将有助于对该疾病的防控。综上,本论文建立了一种利用现有转录本定量框架进行环状RNA表达预测的方法,能够显著提升环状RNA定量的准确性与稳定性。在此基础上,论文研究了大鼠中环状RNA的动态表达模式与生理功能之间的关联,结果表明环状RNA的动态表达与组织所行使的生物学功能密切相关,并且这一关联性独立于所对应的线性RNA的表达。最后,通过肺结核病人和对应的正常对照的PBMC中环状RNA的表达的研究,论文发现人类PBMC中环状RNA的差异表达有可能作为疾病诊断的标志物,为环状RNA的后续应用研究打下了基础。