高速缓存参数无关DNA短序列精确比对算法

来源 :哈尔滨工业大学 | 被引量 : 0次 | 上传用户:pdswzjhxr
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着新一代测序技术的广泛应用,产生海量测序数据,为后续的序列分析带来了巨大的挑战。序列比对作为序列分析的前期处理步骤,它的性能直接影响着整个序列分析效率。对于序列比对可以分成以下三种形式:精确比对;固定错误范围内的模糊比对;插入删除比对。本文主要研究基于海量数据的精确比对,研究的重点在于如何在减少比对次数,提高序列的比对速度。本文中我们对参考基因和测序数据建立哈希索引。建立索引主要是将所有前k个碱基相同的序列片段存储到一起,从而达到快速定位比对数据的目的。在海量数据的序列比对中,在前k个碱基相同的情况下,参考基因和测序序列还是会含有大量需要比对的序列。这将导致大量比对次数的产生,为了减少比对次数本文对比对数据进行排序。本文根据比对数据的特点提出了高速缓存参数的比对算法,从而提高比对速度。同时为了更加充分利用现代普通计算机的资源,我们开发了多线程的并行比对程序提高程序速度。最后为了充分利用各种排序算法的优势,本文对不同的比对方法在不同数据量下进行了测试,找到了适合于不同数据量的比对方法,在小数据量时我们使用不排序的高速缓存参数无关比对方法,在中等数据量条件下我们使用基于普通快速排序的比对方法,在大规模数据时我们使用基于高速缓存参数无关的快速排序比对方法。此外我们将本文实现的比对程序和其他比对程序进行比较,通过对比发现本系统在大规模数据比对上优势明显。
其他文献
信息化弹药是未来弹药发展的必然趋势。本文简述了信息化弹药的概念,分析了信息化弹药的特点;介绍了末敏弹技术研究进展,概括了对信息化弹药发展的启示;通过总结国内外信息化弹药
刘某于2008年12月31日进入A公司从事仓库保管员工作,双方约定刘某丁资为每月1500元。2010年1月1日,刘某以A公司不签订劳动合同为由书面通知A公司解除劳动关系,并向仲裁委申诉,要
本文分析了慕课的本质及内涵,对'教材'的变迁作了简要回顾,在此基础上,对编辑的角色定位提出了一些思考和建议。
在第二届漳州市优秀青年教师选拔赛上.笔者听到了这么两节课:第一节数学《乘法的初步认识》.教者在这节课准备了丰富的礼物和漫天的掌声.每回答一个简单的问题.都得到老师热情的奖
20世纪80年代,在大众的价值判断中,手工艺是最不受人待见的土气和落后的代表,人们崇尚的是工业产品以及体现其形态特征的现代感。那时我正在研究学院形态的陶艺、漆艺、金工及木作创作,真切地感受到了手工艺不被艺术家与大众认可,以致孤立无援、岌岌可危的困境。  进入新世纪以来,手工艺逐渐抬头。随着现代化进程的推进,更加典型充分的工业文明环境反而让人们转身体会与思考植根于心底的中国传统文化,并日益深切地感受
报纸
针对瞬态电磁场辐照多导体电缆问题,首先介绍了一种用于计算架空及埋地线缆瞬态响应的高效时域宏模型。该模型基于传输线理论,利用广义特征线法和SPICE求解器中集成的模拟行
将新型环流式旋风分离器用于超细颗粒的分级,根据分离器有内筒的特点,在其内筒加装角度为20度导流板,来分化粗细颗粒的流动特性,用于分级。试验证明,在不同风速的情况下,具有
■裁判要旨$$原告主张的施救费严重超出了河北省物价局等部门联合出台的《关于规范道路车辆救援服务收费有关问题的通知》冀价经费〔2013〕26号中规定道路车辆救援服务收费标
报纸
<正>1.研究目的:随着人类社会经济发展和科技进步,肥胖症患病率与日俱增。运动对减肥、控体重和保持健康所产生的正面效益已不言而喻。然而,不乏存在着许多减肥失败的现象,这其
会议
提出了一种优化设计激光器谐振腔参数的新方法.应用遗传算法,以最大输出激光功率为目标函数,对典型CO2激光器谐振腔和放电管参数进行了优化,给出了谐振腔的3个优化参数:放电