通过反向重叠区域的特征预测和重构全长环形RNA

来源 :中国科学院大学 | 被引量 : 0次 | 上传用户:snowin11
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
由于二代测序技术的不断发展,基于二代测序技术的RNA-seq大大加速了转录组学的研究。通过海量的转录组测序数据,生物体内不同组织,不同发育时期的转录本被逐渐解读。在现在,转录组的重构工作已有成熟的流程与软件进行处理,丰度较高的转录本如mRNA的表达规律和可变剪切信息都可以方便地获得。而随着测序深度的增加,低表达量的转录本开始进入人们的视野,其中环形RNA就是其中之一。由于环形RNA的表达量非常低,并且由于特殊的反向剪切连接结构会导致不完全映射,所以在以前通常会因为无法被映射软件识别而被认为是测序错误或者背景噪音而被忽略。随着测序深度的增加,研究发现环形RNA是可以在生物体内稳定存在的一种转录本,并且某些环形RNA有着与microRNA结合的能力,这说明环形RNA可能不只是线性转录本剪切的中间产物,可能拥有某些的功能。所以环形RNA的预测是研究转录本中环形RNA的第一步。  环形RNA的最大特征是其具有反向剪切位点,所以目前预测环形RNA的软件都是基于这一特点来预测一条读段是否来自于环形RNA。这个方法的优点在于对于高通量短读长的测序数据,环形RNA发生反向剪切的位置可以被迅速确定。而缺点在于这些软件通常只能预测到反向剪切位点,而无法获得环形RNA内部的序列,这样的方法不利于我们对环形RNA的功能进行预测,也无法得知环形RNA内部发生的可变剪切事件以及功能域。为此,CIRI-AS算法通过将拥有同一个反向剪切位点的读段进行聚类,通过找到读段上的剪切事件来重构环形RNA的全貌。这种方法从一定程度上预测出了环形RNA的全长,但是依然无法直接证明环形RNA的结构是否正确。因此,需要一款新的算法来找出最直接的证据证明环形RNA的全长序列的正确性。  CIRI-RO算法是一款致力于寻找全长环形RNA的算法,这个算法通过寻找一对读段的上的5末端反向重叠区,来判断这一对读段是否来自于被反转录一周以上的环形RNA,通过映射信息验证的一对读段则被认为是跨过环形RNA分子全长的读段,那么这就是证明环形RNA分子内部结构的直接证据。通过模拟数据的测试与其他基于反向剪切位点的算法进行比较,我们发现CIRI-RO算法拥有很高的灵敏度以及很低的假阳性率,但是对真实数据有一定的要求,例如样品中需要含有全长的环形RNA,并且库长和读长都要相对大。从结果来看,CIRI-RO更偏向于找到长度短,表达量低的全长环形RNA分子,而CIRI-AS倾向于更好地预测长度较长,表达量较高的环形RNA分子。CIRI-RO算法虽然拥有一定的局限性,但是这个算法是目前唯一可以找到覆盖环形RNA全长读段的软件,这些被找到的读段都是可以直接证明环形RNA的内部结构的证据。  由于CIRI-RO算法与CIRI-AS算法都可以输出支持某个环形RNA的所有读段的映射情况。为了方便用户的使用,并更直观地了解环形RNA内部结构以及发生的可变剪切,我们开发了一款专门可视化这两款算法输出结果的软件。通过可视化的环形RNA内部结构、可变剪切事件以及所有读段的映射情况都可以直观呈现,并且可以将两款算法的结果进行结合输出,补齐某些因为覆盖度低而无法被完整覆盖的环形RNA。这款可视化软件的开发大大简化了对环形RNA内部结构的分析,提高了CIRI系列软件的用户体验。
其他文献
在众多无线通信技术当中,ZigBee技术以其低功耗、低成本、实时性好等优势在无线传感网络及物联网等领域中得到了广泛的应用。在ZigBee技术的应用过程中,保证ZigBee网络节点中射
本研究基于MODIS-NDVI数据、植被类型数据及气象数据,利用像元二分模型,估算了西藏地区2005~2014年生长季期间的植被覆盖度,并对其时空变化特征进行了分析;借助趋势分析法分析了1
黑硅薄膜是近年由哈佛大学EricMazur教授发明的一种新型的光电材料。黑硅在可见光至长波红外波段都具有无频谱特征的高吸收特性。黑硅制备的二极管在可见光波段具有比常规二
多药耐药(multidrug resistance,MDR)是指有机体同时对大量结构不同的细胞毒药物的交叉抗性,在肿瘤治疗中是降低化疗药效的主要原因。多药耐药的作用机理复杂,其中疏水药物的外
新民市靠山屯村种苗繁育基地位于新民市新农村乡靠山屯村,成立于2013年4月,注册资金1200万元,种苗繁育基地面积2200亩,我社以寒富苹果苗、葡萄苗繁育为主,已有30年的葡萄苗木
“动中通”(COTM—communication on the move)系统,即实现运动中无间断通信的系统,能在载体运动过程中实时、不间断地对其提供大量的语音、数据、动态图像等信息。“动中通”系
在远距离探测和高分辨率应用需求的推动下,碲镉汞(HgCdTe,MCT)红外焦平面(infraredfocalplanearrays,IRFPAs)探测器像元密度不断提高,致使像元之间的空间串音也越来越大,严重影响
能源和水资源对人类生存和社会发展至关重要,对于城市而言,能源和水资源缺乏常常成为发展的短板。同时,能源和水资源之间关系非常密切,但长期以来传统的分离式资源管理忽视了这种
当今社会信息化与科技发展日新月异,视频监控也在朝着智能化的方向在发展。视频监控应用于众多领域如交通、安防、军事以及航天航空等,智能视频监控更是成为全球研究的热点之一
本文旨在分析巴赫B小调前奏曲和赋格第24首BWV 893,并且着重讨论了在表演中的两个不同元素:奏法和触键.本文作者将分析比对三位表演者丹尼尔·巴伦博伊姆、弗里德里希·古尔