高通量测序数据误差分析方法研究

来源 :哈尔滨工程大学 | 被引量 : 0次 | 上传用户:xndrz1985
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
DNA高通量测序技术的诞生是分子生物学研究的一次技术性的变革,它的低成本,速度快,通量高等特点使它迅速的替代了传统的测序技术。随着测序技术的不断发展,高通量测序技术不断的走向成熟,并且广泛的应用于生物学、医学等众多领域。高通量测序技术的应用越来越广泛,其测序的精确度也就越来越受到人们的关注,因为无论哪一个应用到测序技术的领域,对测序数据的精确性的要求都很高。如果测序环节出现了较多的测序误差,将会影响到对后续工作的分析与处理,甚至使后续工作无法进行。由此看来对高通量测序数据误差的分析显得非常重要。  高通量DNA测序技术的特点是直接对靶核苷酸序列进行测序,相比与传统测序技术,它使得获取基因信息的准确度在很大程度得到了提高。要想获得某些基因的信息,首先要把这些测序序列利用与参考基因组序列比对的方式找到它们的位置,为后续分析做准备。由于被测对象的DNA序列存在个体差异以及测序过程中存在测序误差,在将短读数序列测序结果映射(比对)到参考基因组的过程中,存在测序数据无法映射的问题,并导致测序数据无法使用。  本文针对短读数高通量测序数据进行分析,由于来自不同测序平台的不同,产生测序误差的规律有所不同。本文设计的方法有别于传统的分析方法,改进了无法有针对性的对具体数据进行分析的不足,本文针对具体数据,分析其特有的测序误差产生规律,通过利用贝叶斯理论估计其特有的测序误差模式,将其作为匹配映射的参考,进而提高其测序数据的匹配映射成功率。实验表明:每个测序读数中,越往后的位置,发生测序错误的概率越高;不同测序位置上发生不同种类测序错误的概率有所不同,而上述规律是随着测序平台的不同,实验环境的不同而变化的。经过实验的验证,本文设计的方法成功的挽救了部分没有成功映射到基因组测序数据,并且通过利用挽救的数据和可靠数据映射区域的重叠性验证,证明了本设计的有效性,从而达到了提高测序数据的映射率,进而提高了测序数据的利用率的效果。
其他文献
在现场仪表和工业设备领域,应用嵌入式网络技术是工业控制网络的一个发展趋势,利用Linux 构建嵌入式系统是近年来出现的一种设计方案。嵌入式Linux 系统研究的目的在于利用Li
基于云模型在处理随机与模糊现象方面的优良特征,本文通过查阅国内外资料,深入研究了云模型理论以及免疫检测理论,并把云模型理论引入到免疫检测算法中。对逆向云生成算法进
随着网络技术的迅速发展,网络已经成为了人们获得信息的重要来源,并已开创了一个以计算机网络为基础的信息时代,从而也促进了传统虚拟现实技术在网络上得以实现。网络不仅突破了
随着计算机技术的发展,分布式人工智能中多智能体系统(MAS:Multi-agent System)的理论及应用研究已经成为人工智能研究的热点。机器人足球系统为这一领域的研究提供了合适的工
随着社会的快速发展,一些潜在的矛盾冲突也伴随出现,异常声音逐渐引起人们的思索和重视。传统安防迫切要求视频监控引入对异常声音的判别,以提高智能性。长久以来,异常声音的
本文了描述了一种二次生成的嵌入式系统级调试工具SignalTap的工作原理和其特点,它可以在特定的FPGA器件以系统运行的速度观察到内部所有的节点,但是它只能用在特定公司生产
嵌入式技术是工业控制发展的新方向之一,随着Internet 技术飞速发展,网络传送信息具有快速、方便、广泛等诸多特点,结合网络与嵌入式系统的种种优势,将嵌入式系统接入Interne
学位
人类正在进入信息时代,跨入网络化社会,以计算机、通讯和信息技术为支撑的网络日益成为联结整个社会的纽带。这种前所未有的科技革命,已经开始并将继续深刻地影响和改变人们
数字视频压缩编码技术是多媒体通信的关键技术,目前有关视频压缩的国际标准已基本上满足了中高码率的需求,并且进入了实用化阶段,而现有的传输和存储能力对低比特率的窄带通