【摘 要】
:
在DNA序列中对长度为k的子序列K-mer进行计数是生物信息学分析的关键环节,为解决传统K-mer计数中出现的耗时长、内存占用量大的问题,文中提出一种基于最小完美哈希函数的K-me
【机 构】
:
东北大学秦皇岛分校,中国工业互联网研究院
【基金项目】
:
国家自然科学基金(61772124)
论文部分内容阅读
在DNA序列中对长度为k的子序列K-mer进行计数是生物信息学分析的关键环节,为解决传统K-mer计数中出现的耗时长、内存占用量大的问题,文中提出一种基于最小完美哈希函数的K-mer计数算法。该算法能够无哈希冲突地将K-mer映射到尽可能最小的整数范围内,对最小完美哈希表的查询在常数时间内完成,能够高效处理动态变化的大规模数据集。在处理大肠杆菌基因序列时,本文算法MPH-KMC相对jellyfish2算法,耗时缩短3倍,内存消耗缩小11倍。
其他文献
随着新农村建设的不断深入推进,农村交通设施逐渐完善,农村公路工程项目越来越多,在农村公路项目施工过程中,必须要考虑安全性因素,文章对农村公路设计中的线形设计问题进行
总结我科2008年1月—6月,69例在经皮肾镜下超声气压弹道碎石清石术(EMS)的围术期护理,认为充分的术前准备、精细的手术操作以及手术后严密的观察和优质的护理,是保证手术成功的重
目的总结复杂阑尾炎的治疗体会。方法对临床25例特殊阑尾炎患者采取不同的手术方式。结果25例患者诊断及治疗均相对特殊,采取不同的手术方式,术后虽出现多种并发症,但最终均愈合
油气勘探需要对勘探地区的油气结构进行了解,弄清楚油气能源是否位于地震带上等因素,这些都是油气安全开采的最基本的保障。文章主要分析了油气勘探新技术的应用,旨在为今后
聚丙烯共混物流变学的研究对聚丙烯合成、加工及发泡等具有重要的意义,综述了目前聚丙烯共混物流变学方面的研究现状,重点讨论了聚丙烯共混物流变学研究动态,并对聚丙烯基复
建筑工程造价管理贯穿于投资决策、项目设计、招投标、建设施工和项目竣工的各个环节,文章结合作者的实际工作实践,仅从建筑工程造价结算审核角度对工程造价管理进行分析和探讨
目的观察三七通舒胶囊联合甲磺酸倍他司汀治疗椎-基底动脉供血不足性眩晕的临床疗效。方法 80例椎-基底动脉供血不足性眩晕患者分为2组各40例,对照组使用甲磺酸倍他司汀治疗,
为满足高职高专人才培养模式改革的需要,根据不同专业的学习要求,一切从提高教学实效出发,对《病原生物与免疫学》课程的教学资源与手段进行协调整合,增强专业针对性,组合多样式教
甲状腺功能亢进症(甲亢)是一种常见的内分泌疾病,内科治疗以口服抗甲状腺药物为主,其最常见最严重的副作用是白细胞减少,最终导致严重感染,甚至死亡[1]。我科于2010年8月—2011
随着云计算的发展,存储资源管理技术作为云计算的基础,成为国内外学者研究的热点。部分企业和机构,提出了一些针对自身云计算应用的存储资源管理模型,并实现了相应的存储管理