基于“三+二”测序的小鼠早期胚胎转录组构建

来源 :军事科学院 | 被引量 : 0次 | 上传用户:yrrej86
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
本文的目的是证明与传统的二代短读长测序技术相比,使用三代长读长测序与二代短读长测序技术的结合在小鼠早期胚胎转录组学研究方面的优势。基于这种优势识别先前未被注释的基因、同源异构体、可变剪接以及等位基因特异的转录本和可变剪接,生成一个更加全面的小鼠早期胚胎高分辨率的转录组注释。同时探索新注释的资源在早期胚胎各个阶段的动态变化,研究这种变化背后相关的功能元件与调控机理,为深入的探究小鼠早期胚胎发育机制奠定基础。我们收集了小鼠早期胚胎七个阶段(精子、卵母、1细胞、2细胞、4细胞、8细胞和囊胚)的样本,并分别使用二代和三代测序技术对其进行了RNA-seq测序,随后对这两个数据集进行了生物信息学分析。我们利用Pac Bio平台的Iso-seq3流程在三代测序数据上识别了全长转录本,并且使用Cuffcompare与GENCODE注释进行比较,得到先前未被注释的新基因和同源异构体。随后使用blastp和hummer将新识别蛋白编码转录本与数据库进行比对,对其进行同源性分析,并使用big Wig Average Over Bed计算新识别的非编码转录本的phylo P和phast Cons分数。使用salmon等工具完成了二代测序数据对长读长转录本的定量。同时我们使用PCR扩增和Sanger测序对新识别的基因和转录本进行了实验验证。我们使用SUPPA2在分别两个数据集上识别了可变剪接事件和差异可变剪接事件。借助SNPsplit和GMAP以及STAR等工具识别了等位基因特异的转录本。利用大量生物信息学工具和我们自己编写的python和R脚本的组合,完成了小鼠早期胚胎二代与三代转录组测序数据的分析。我们使用二代测序(Illunima)与三代测序(Pac Bio)技术的结合揭示了小鼠早期胚胎转录组的复杂性与新颖性,在先前未被注释的区域识别了2280个新转录本,并且在注释基因区域识别了6289个新的同源异构体。随后使用二代测序数据分别对注释的和新识别的全长转录本进行定量,同时也描绘了全长转录本在七个阶段的动态表达趋势,我们发现注释的和新识别的全长转录本都在早期胚胎中大量表达,且具有相似的表达规律。通过对新识别的蛋白编码的转录本进行同源性分析发现绝大部分的转录本能在数据库中找到其对应的同源产物。我们还对新识别的非编码的转录本进行了保守性分析,结果表明大量的转录本在物种间具有高度的保守性。接着利用已发表的H3K4me3(histone H3 lysine 4 trimethylation)数据和CAGE(cap analysis of gene expression)数据对新识别的转录本进行了验证,进一步得到了高置信度的转录本的数据集。我们还比较了仅使用二代数据和二代数据结合三代数据在识别新转录本方面的潜力和转录本定量方面的差异,结果表明,二代数据加三代数据的结果明显优于仅使用二代数据。并且由于三代数据的测序深度低于二代数据,二代数据也能识别出一部分三代数据所不能识别的转录本。随后利用二代与三代测序数据识别了可变剪接与差异可变剪接事件,结果显示,与二代测序技术相比,三代测序数据能够识别更高比例的未被注释的新可变剪接事件。接着探讨了可变剪接与差异可变剪接在早期胚胎各个阶段的动态变化,发现七种类型的可变剪接与差异可变剪接事件的变化都非常剧烈,从而使得转录本也急剧变化。我们识别出一个属于Kdm4dl基因的新同源异构体,和一个命名为XLOC_004958的新的非编码基因,借助实验的方法发现Kdm4dl的新同源异构体具有改良的m RNA阅读框,并且Kdm4dl或XLOC_004958的缺失会导致囊胚发育异常。通过比较二代测序数据与三代测序数据识别的等位基因特异的转录本,发现在七个阶段中有50-94%的等位基因特异的转录本仅能被三代数据识别而不能被二代数据识别。我们也在等位基因特异的转录本的基础上识别了等位基因特异的可变剪接事件和差异可变剪接事件,平均每个阶段能鉴别出230个等位基因特异的可变剪接事件和26个差异可变剪接事件。我们的分析证明,与仅使用二代测序数据相比,三代测序结合二代测序能够识别更多的新转录本、可变剪接事件以及等位基因特异的转录本和可变剪接,且其能更加精准的对转录组进行定量。利用三代测序结合二代测序的优势,我们提供了一个包含等位基因特异的转录本和剪接事件在内的高分辨率、更高精度的转录组,为更深入探究小鼠早期胚胎发育机制奠定了基础。此外,早期胚胎的转录组存在剧烈的动态变化,这一现象能为后续深入研究早期胚胎调控机理提供潜在的方向。
其他文献
缺硒是发生克山病的重要原因,缺硒也被认为是发生大骨节病的重要原因。大骨节病是一种地方性、多发性、变形性骨关节病。它主要发生于青少年,严重地影响骨发育和日后劳动生活能力。过量的硒可引起中毒。表现为头发变干变脆、易脱落,指甲变脆、有白斑及纵纹、易脱落,皮肤损伤及神经系统异常,严重者死亡。
期刊
目的京族是我国唯一的海洋少数民族,其文化兼具海洋性和民族性。将文化基因视作民族文化最小的遗传单位,构建文化基因图谱并转化为旅游纪念品创意设计之素材,建立旅游纪念品的评价模型。方法在文化基因理论的基础上提出文化基因复制法、文化基因植入法、文化基因共生法和文化基因变异法进行当地旅游纪念品的系列化创意设计,从而完成由文化基因图谱绘制到文化基因转译的过程。采用层次分析法建立评价指标权重,结合模糊综合评价法
1.钼是多种酶的重要构成要素,参与人体内铁的利用,可以预防贫血,促进发育,并能帮助碳水化合物和脂肪的代谢。2.钼可以维持心肌能量代谢。人体缺乏钼时会引起生长发育迟缓、体重下降、毛发脱落、动脉硬化、结缔组织变性及皮肤病。3.钼对于维持动脉的弹性,预防心血管疾病,预防克山病都有很大作用。4.钼会影响胰岛素调节功能,可用以维护人体免疫系统,调节甲状腺功能。
期刊
生命的基本单位就是细胞。所有的生命形式,基本上都是以细胞为基础的。细胞是组成人体形态和功能的基本单位,每个细胞也是一个小小的王国,它是更小生物分子的集合体,核酸、蛋白质、多糖、脂类等有机大分子以一定数量和严格的方式,组成
期刊
目的:验证百邦牌MD-9000A高电位治疗仪对失眠症状的临床治疗价值。方法:选择35例符合治疗要求的失眠患者,经过2个疗程以上的治疗,采用睡眠质量量表进行评价。结果:治疗前后睡眠的“很差”和“不好”的改善情况:总体睡眠质量88.6%(31/35)→8.6% (3/35)、睡眠持续性80.0%(28/35)→17.1%(6/35)、睡眠效率71.4%(25,35)→14.3%(5/35)、
会议
目的:观察高电位治疗仪对失眠患者的影响,寻求新的改善睡眠的理疗方法。方法:采用无锡迈德生物反馈技术有限责任公司生产的百帮牌MD-9000A型高电位治疗仪治疗32例失眠患者,每次30分钟,每日1次,10次为一疗程,连续治疗2个疗程共20次。治疗期间不能服用安眠药物和接受其他对安眠有作用的理疗。治疗前、后均采用阿森斯(Athens,AIS)失眠量表、匹兹堡睡眠质量指数(Pittsburgh sl
会议
日本动漫在中国传播的同时,日式"萌"也被中国二次元群体所接纳。在日本宅文化中对"萌"的定义虽然因人而异,但其中有一共通点,那就是"对角色所产生的异性爱的爱意或者是恋爱感情"。由于中国二次元群体的分化、对"萌"接触途径以及日本动漫态度的区别,使得"萌"在中国二次元群体中的传播出现了分层现象:一种是追求原封不动的"日漫党",一种是倾向融入体验的"国漫党"。而其中"国漫党"对"萌"的体验式理解,使得"萌
中国有色矿业集团赞比亚穆利亚希复杂混合铜矿中铜氧化率为80%左右,结合率为40%左右,处理难度极大,现场采用单一的酸法浸出工艺,当原矿磨矿细度-0.074mm占80%,浸出温度65℃,浸出时间4h时,铜浸出率为78%左右。目前现场工艺存在的问题是铜浸出率不高,加热成本过大,导致经济效益差,铜资源回收利用率低。论文以该矿石为研究对象,针对现场存在的问题,在尽量利用现场条件的基础上,通过改变工艺流程,
2019年国务院印发《交通强国建设纲要》,明确从2021年到本世纪中叶,我国将分两个阶段推进交通强国建设。到2035年,基本建成交通强国,形成三张交通网、两个交通圈。通过大数据技术实现交通的智能化乃至智慧化已经成为智慧城市到数字中国发展的重要实现路径之一。
期刊
深度强化学习凭借着强化学习的决策能力和深度学习的感知能力,实现了从输入到输出的端对端的学习方式,对于解决复杂的无人设备控制问题有着天然的优势。目前,越来越多的无人设备的控制问题解决方案,开始从传统控制方法转向深度强化学习的方法,但是使用深度强化学习解决连续控制任务面临着“维数灾难”问题。连续控制任务如机械臂、仿真机器人、无人机等智能无人设备存在着复杂的运动控制,同时机械控制存在的摩擦力,关节扭动的