【摘 要】
:
生物信息工程中常见的全基因测序和重序分析等应用通常需要大量的运算和对大量的数据进行分析.在传统单机上运行,这需要几个星期时间才能完成一个分析,非常耗时.因此,Hadoop
【机 构】
:
510631,华南师范大学 广东 广州
论文部分内容阅读
生物信息工程中常见的全基因测序和重序分析等应用通常需要大量的运算和对大量的数据进行分析.在传统单机上运行,这需要几个星期时间才能完成一个分析,非常耗时.因此,Hadoop的MapReduce分布式计算平台就为这类大数据分析运算提供了强有力的支持.当前生物信息学应用都需要管理大量数据和大量计算,主要是应用并行计算.第一个特点是流媒体大数据集的计算,而第二个则需要一个相对较小的数据集的多遍计算策略.这些算法的分析与广泛复杂的应用有关,例如结构基因组学和全基因组关联研究.在这门学科中,MapReduce是一种特别通用并且可以并行计算的技术.在这里报告其应用,使用它的开源实现Hadoop,涉及到两个相关的算法:BLAST和GSEA.
其他文献
雷达生命探测仪作为生命救援领域的一个重要装备,在地震灾害、塌方事故等紧急救援任务中得到了广泛的应用.本文介绍了典型雷达生命探测仪的系统设计,分析了国内外雷达生命探
学校普遍采用的身份认证技术缺乏足够的认证强度,易于遭受不法用户的攻击,由于统一身份认证服务能够实现集中认证目标,其关键意义也就愈发突显出来,并且还能基于身份以及集中
该文从挂篮荷载计算、施工流程、支座及临时固结施工、挂篮安装及试验、合拢段施工、模板制作安装、钢筋安装、混凝土的浇筑及养生、测量监控等方面人手,介绍了S226海滨大桥
在信息技术环境下,互联网已经成为推动经济发展的重要因素,对于化工行业而言,与互联网的融合将有利于实现行业的高效化、开放式发展格局,促进行业可持续发展.化工产品与公众
该文从挂篮荷载计算、施工流程、支座及临时固结施工、挂篮安装及试验、合拢段施工、模板制作安装、钢筋安装、混凝土的浇筑及养生、测量监控等方面人手,介绍了S226海滨大桥
随着装备了G1000系统的飞机在国内民航飞行员培训中的广泛应用,各飞机运行单位越来越重视对G1000系统存储数据的开发利用.本文作者以案例的形式,详细阐述了G1000系统存储数据
在雷达调试和实验中,需要对雷达数据进行录取并分析.由于相控阵雷达数据量巨大,需要结合数据库技术实现对雷达数据的录取.
大数据技术作为信息技术发展的最新产物,在政府审计工作中有着非常不错的应用价值.文章基于此,首先分析了大数据技术的内涵及其对于政府审计工作所具有的三点价值,然后就如何