RNA-seq数据分析和minimal intron最优长度维持机制的研究

来源 :中国科学院北京基因组研究所 | 被引量 : 0次 | 上传用户:liu8521
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
由于二代测序技术的发展,不但大大降低了测序成本,而且还极大地提高了测序的通量。现在我们能以低成本,高通量获取基因组数据。更重要的是,二代测序技术应用到转录组的分析,使我们能获得细胞的精确的转录表达谱,这是以前的方法所不能比拟的。通过测序的方法计算基因表达量,通常要依赖覆盖度,不同的模型假设会得到不同的表达量。因此对二代测序产生的测序片段(reads)在基因上的分布性质的研究对计算基因表达量有重要的意义。在论文中,我们对reads的碱基成分,错误率以及其随基因序列GC含量变化的分布性质进行了考察。通过我分析发现reads的错误率在尾端显著增大,而且reads在基因中的分布,有在高GC含量区域丰度较高,而低GC含量区域丰度较低的规律。人类基因组计划开展以来,越来越多物种的基因组被测序出来。通过对基因组上基因结构的分析,人们发现多细胞真核生物的内含子(intron)的数量随长度分布呈现峰的特性,有的有双峰,有的只有单峰,但是在长度50-150bp(basepair)之间普遍都存在峰。峰值对应的长度是这部分内含子的最优长度,我们把峰值附近这部分内含子称作小内含子(minimal intron).通过我们之前的研究,发现这些小内含子具有重要的生物学意义,它们在基因中的位置在物种间极其保守,而且大都位于看家基因中,另外它们还决定了可变剪接的方式。可见,这个峰的维持对真核生物具有极其重要的意义。但维持最优长度峰的机制是什么还不得而知。在之前我们尝试应用内含子中的插入删除(Indel)的性质对峰的存在进行解释,但是由于测序数据的缺乏,只是大致观察到小内含子在最优长度两边的插入删除偏好性显著不同,大于最优长度的小内含子中删除(deletion)占主导,相反则插入(insertion)占主导。现在随着“千人基因组计划”数据的公布,我们重新分析了重测序的179个人(非洲人,欧洲人和亚洲人)来更加深入的研究小内含子峰的维持机制。通过对不同人群的Indel分析,我们都发现所有内含子中的插入删除数量随长度的增加逐渐减少,而且在各长度上删除的数量始终大于插入的数量。通过分析插入删除周围10bp的A&T碱基成分,我们发现随插入删除长度的增加,A&T组分的波动不断增大,波动的范围也不断扩宽。通过对小内含子中插入删除的频率进行分析,发现插入删除随着频率的增大明显的表现出维持最优长度的性质。最后我们对含有小内含子的基因和所有的基因进行了功能的富集性分析,并比较不同功能的基因的平均插入删除频率。
其他文献
随着人类航天活动的日益频繁,碎片逐年增加,空间环境逐步恶化,在轨航天器的正常运行受到了严重的威胁。航天部门需要加强对航天器的防护,减缓碎片碰撞航天器的风险。空间碎片超高
量子纠缠在量子信息领域扮演着重要的角色,而对量子纠缠的描述也是多种多样。2004年,Kauffman与Lomonaco提出了辫子算子可作为量子计算中的通用量子门,而辫子算子的一种表示
1998年,两个科学组独立地通过Ia型超新星(简写为SN Ia)观测发现宇宙加速,之后开启了宇宙学的新纪元。为了解释宇宙的加速膨胀,出现了两种主流方向:暗能量宇宙学和修改引力。观测方
黑暗链霉菌是重要的氨基糖苷类抗生素——安普霉素和妥布霉素的产生菌,为不断提高其发酵单位,采用常规育种手段进行选育,获得了高产菌株。为进一步提高产生菌的质量,拟采用现代基
目的:分析运用中医学“筋骨并重”理论指导的主-被动锻炼方式与无痛原则下的主动锻炼对肱骨髁间骨折术后肘关节功能康复的不同影响,并根据此临床研究为更好的治疗肱骨髁间骨折,恢复肘关节功能提供参考。方法:将2016年10月至2018年3月在山东省中医院骨科治疗并完成随访的52例肱骨髁间骨折患者按入院次序采用随机数字表法分为两组:治疗组和对照组,每组26例。所有患者均在术前简单支具制动患肢、使用活血消肿药,
随着公路交通行业的迅速发展,我国公路已经进入大规模养护期,沥青路面回收旧料(RAP)的再生利用已经成为我国发展绿色交通业的重要方式之一,RAP由于受多种因素影响而存在较大变异性,其中RAP级配对于再生混合料性能影响显著,在铣刨过程中矿料受铣刨特性的影响导致RAP级配细化,进而影响再生混合料性能的稳定性。因此有必要对铣刨过程的RAP变异性进行研究,采用针对性方法降低其变异性,对提高RAP利用率、指导
过氧化氢是重要的精细化工产品,广泛应用于造纸、消毒、环保、医药、电子及食品等领域。目前,全球98%的过氧化氢都是采用蒽醌法生产,在该方法中,蒽醌先通过催化加氢反应生成蒽氢醌,然后蒽氢醌在氧气中氧化生成过氧化氢和蒽醌。蒽醌加氢是蒽醌法生产过氧化氢的关键步骤,催化材料的性能对该反应起到重要作用,因此研究高活性和高稳定性的蒽醌加氢催化剂具有重要意义。Pd基催化剂是最广泛研究的蒽醌加氢催化材料,为了提高其
学位
“孤儿作品”是指在著作权保护期内,著作权人身份信息难以确定,或者身份明确但经过勤勉查找仍无法与之联系的作品。这一概念范畴以著作权人为出发点,涵盖“身份信息不明”和
RecQ解旋酶家族中的一员—RecQL4,因其缺失易导致肿瘤、个体发育不全、早衰等多种症状而为研究人员所重视。RecQL4缺失直接与三种罕见的常染色体隐性疾病的发生相关联,提示了