基于最小完美哈希函数的K-mer计数算法

来源 :中国电子科学研究院学报 | 被引量 : 0次 | 上传用户:h462r5134dg
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在DNA序列中对长度为k的子序列K-mer进行计数是生物信息学分析的关键环节,为解决传统K-mer计数中出现的耗时长、内存占用量大的问题,文中提出一种基于最小完美哈希函数的K-mer计数算法。该算法能够无哈希冲突地将K-mer映射到尽可能最小的整数范围内,对最小完美哈希表的查询在常数时间内完成,能够高效处理动态变化的大规模数据集。在处理大肠杆菌基因序列时,本文算法MPH-KMC相对jellyfish2算法,耗时缩短3倍,内存消耗缩小11倍。
其他文献
随着新农村建设的不断深入推进,农村交通设施逐渐完善,农村公路工程项目越来越多,在农村公路项目施工过程中,必须要考虑安全性因素,文章对农村公路设计中的线形设计问题进行
总结我科2008年1月—6月,69例在经皮肾镜下超声气压弹道碎石清石术(EMS)的围术期护理,认为充分的术前准备、精细的手术操作以及手术后严密的观察和优质的护理,是保证手术成功的重
目的总结复杂阑尾炎的治疗体会。方法对临床25例特殊阑尾炎患者采取不同的手术方式。结果25例患者诊断及治疗均相对特殊,采取不同的手术方式,术后虽出现多种并发症,但最终均愈合
油气勘探需要对勘探地区的油气结构进行了解,弄清楚油气能源是否位于地震带上等因素,这些都是油气安全开采的最基本的保障。文章主要分析了油气勘探新技术的应用,旨在为今后
聚丙烯共混物流变学的研究对聚丙烯合成、加工及发泡等具有重要的意义,综述了目前聚丙烯共混物流变学方面的研究现状,重点讨论了聚丙烯共混物流变学研究动态,并对聚丙烯基复
建筑工程造价管理贯穿于投资决策、项目设计、招投标、建设施工和项目竣工的各个环节,文章结合作者的实际工作实践,仅从建筑工程造价结算审核角度对工程造价管理进行分析和探讨
目的观察三七通舒胶囊联合甲磺酸倍他司汀治疗椎-基底动脉供血不足性眩晕的临床疗效。方法 80例椎-基底动脉供血不足性眩晕患者分为2组各40例,对照组使用甲磺酸倍他司汀治疗,
为满足高职高专人才培养模式改革的需要,根据不同专业的学习要求,一切从提高教学实效出发,对《病原生物与免疫学》课程的教学资源与手段进行协调整合,增强专业针对性,组合多样式教
甲状腺功能亢进症(甲亢)是一种常见的内分泌疾病,内科治疗以口服抗甲状腺药物为主,其最常见最严重的副作用是白细胞减少,最终导致严重感染,甚至死亡[1]。我科于2010年8月—2011
随着云计算的发展,存储资源管理技术作为云计算的基础,成为国内外学者研究的热点。部分企业和机构,提出了一些针对自身云计算应用的存储资源管理模型,并实现了相应的存储管理