三代混合测序长扩增子技术流程改良及软件开发

来源 :云南大学 | 被引量 : 0次 | 上传用户:bluedogdog
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
三代测序凭借其超长读长、高通量、无GC偏移成为基因组从头组装、转录组全长测序、结构变异、拷贝数变异、甲基化研究的新利器。其中,Pacific Biosciences(Pac Bio)公司开发的单分子实时测序技术(Single Molecular Real-Time,SMRT)采用边合成边测序的技术,读长可达几kb甚至至几十kb。然而Pac Bio公司的单分子实时测序技术单次测序的错误率非常高,对于如何提高SMRT测序的准确率一直是一个需要解决的关键问题,目前Pac Bio公司推出的最新测序系统sequel和sequelⅡ主要通过提高测序酶活性,同时构建10 kb左右的测序文库以提高测序的覆盖率,通过独特的“套马索”(SMRTbell)结构将测序下机的子序列做循环一致性处理(CCS),进而获得准确率较高的序列,这些准确率较高的序列也被称为High-Fidelity reads(Hi Fi-reads)。纵使Hi Fi-reads覆盖度达到了28×,但精确度仍只有99.8%,难以满足对精确度要求高的数据分析。本研究拟结合NGS多标记混合技术和Pac Bio SMRT测序技术优势,将Illumina二代测序96组双端barcode序列结合到动物mt DNA PCR通用引物上,改良三代混合测序分子实验流程,同时开发混合测序数据分析软件,最终实现线粒体基因组高通量混合测序,提高混合样本数量的同时,降低单个样本测序成本。基于此思路,本研究以线粒体为研究对象,混合了79只藏獒、7只岩羊、一只雪豹共87个个体,最终成功构建了长分别为~8.6 kb和~8.8 kb的带有标签序列的mt DNA长扩增子混合测序文库,获得763,518条目的片段大小的子序列,平均测序深度为4,338×,经循环一致性处理后得到约6万条目标大小的Hi Fi-reads,平均每个样品的每个片段约有340条。本课题开发的分析软件包(HQGr)将不同物种的不同片段进行了拆分,获得每个样品的F1片段平均测序深度为183×,F3片段平均测序深度为148×,最终获得的High Quality Reads(HQ-reads)准确率高达QV50。本研究改良的流程和开发的分析软件包为小型基因组测序,如线粒体、叶绿体及细菌的基因组,高重组区段候选基因测序提供了一套良好的测序方案及分析流程。
其他文献
本文针对两类神经网络的概周期解问题研究,首先研究了具有变时滞的四元数值神经网络的Bapp-概周期解的存在性以及全局指数同步;其次,分析了具有混合变时滞的分数阶克利福德值神经网络的伪概周期解的存在性及其有限时间稳定;最后,分别给出了一个数值例子来验证关于两类神经网络结论的可行性和有效性.在论文中,我们利用压缩映射原理得到了具有变时滞的四元数值神经网络的Bapp-概周期解存在的充分条件,并证明了具有混
学位
差分进化算法(DE)是一种有效的随机搜索优化算法,它通过继承和发展现存优化算法的优点,具有控制参数少且设置简单,收敛速度快,优化结果鲁棒性好等众多长处。然而对于较为复杂的单目标多峰优化问题,差分进化算法容易收敛的太早并停滞于局部最优解。针对这些问题,论文通过提出的基于转向变异的策略来改进三种差分进化算法,并使用CEC2020单目标边界受限的数值优化基准集作为评价标准,然后将改进后的三种差分进化算法
学位
分子在非共价键的作用下,形成稳定的分子聚集体的过程,称为分子自组装,且常见于生物大分子中。液晶是自组装体系的杰出代表,由于其独特的有序性和流动性,其独特的结构可以实现对多种外部刺激的响应,所以液晶分子常被用于传感器、显示器和生命科学等其他领域。胶束是化合物在溶液中形成的组装体,由于其具有良好的亲水性,作为药物载体有着重要的意义。此外,其具有靶向作用、减少药物的副作用,增加药物溶解性等方面有着非常多
学位
如今,随着边缘计算技术的普及,为了向附近的用户提供高度可访问的服务和计算资源,通常会将边缘服务器部署在基站和其他类型的设备上。但是,由于边缘服务器的存储空间有限,为可能发生故障的服务在边缘服务器上进行冗余备份就变得尤为困难。因此,边缘计算环境中服务的自适应机制将成为故障服务组件修复的重要手段。其中,边缘服务器内寻找可替换服务是确保系统弹性、执行自适应机制的有效技术之一。本文以边缘计算中服务的自适应
学位
水温作为水环境中重要的水文要素,对水生态系统有极其重要的影响。研究表明,筑坝蓄水后导致库区和坝下河道水温不同于原有天然河道水温结构,水库水温出现垂向分层以及低温水下泄现象,且在梯级水电开发模式下,水温变化过程在时间和空间上得到累积,产生水温累积影响。本研究系统收集了澜沧江中游功果桥-小湾梯级开发河段的水温变化数据,基于地形、水文、气象、水温等数据,构建了澜沧江中游梯级水库CE-QUAL-W2水温模
学位
近年来,模糊测试是学术界和工业界的研究热点之一,是一种用于检测软件错误和查找安全漏洞的技术。Squirrel是一个用于测试数据库管理系统的模糊测试框架,它通过保留语法的变异(Syntax-Preserving Mutation)和语义指导的实例化(Semantics-Guided Instantiation),大大提高了生成的测试用例的语法有效性和语义有效性。Squirrel可以有效地发现数据库管
学位
静电纺丝纳米纤维具有比表面积和长径比高、形态和结构调控性强、连续性好、机械性能优异、在应用中容易组装和加工等特点,可广泛应用于智能材料、环境保护与治理、能源转化与存储、生物医学和催化等领域。由于静电纺丝纳米纤维的高比表面积及其纤维垫的高孔隙率有助于整合并放大聚合物的智能特性,因此,开发高性能和多功能的智能纳米纤维已经成为研究热点。动态共价聚合物因其独特的刺激响应性、自修复性、形状记忆性、可完全回收
学位
随着社会经济的发展,农村居民“住有所居”的民生问题已基本得到解决。然而,受制于管理缺位、建房知识匮乏、观念技术落后等现实因素,农村住宅质量亟待提升。在农村地区,有限的住宅建设费用是探讨如何改进工程质量的重要前提。农村住宅的质量评价及质量-成本优化问题的研究,有助于及时总结农村住宅建设过程中的典型经验,明晰农宅质量评价标准,同时也能为实现经济优质农宅的建设目标提供理论支持。本文通过对现有研究的梳理和
学位
<正>目的报道一株国内较少见的同时产SIM-1、SHV-1和CTX-M-14型β-内酰胺酶的肺炎克雷伯菌。方法采用VITEK-2全自动微生物鉴定及药敏系统测定临床常用抗生素的抗菌活性。采用改良Hodge试验和厄他培南-EDTA协同试验,进行菌株产碳青霉烯酶和金属β-内酰胺酶的表型筛查。采用PCR方法检测碳青霉烯酶及其他β-内酰胺酶的基因型。结果临床分离的肺炎克雷伯菌对亚胺培南等几乎所有临床常用的β
会议
近年来,移动网络中移动计算的模式在5G通信和物联网快速发展的推动下逐渐发生了从集中式的云计算向分布式的移动边缘计算(Mobile Edge Computing,MEC)的变化。MEC将计算、存储资源以及网络控制能力放置到移动网络的边缘,即用户接入层一侧,因此资源受限的移动设备可以利用MEC来启用计算密集以及延迟敏感的应用程序。MEC作为一种有着巨大发展潜力的新兴技术,可以在减少移动设备的能耗的同时
学位