基于Hadoop的海量数据TCP报文重组技术

来源 :计算机工程 | 被引量 : 0次 | 上传用户:aijieyeyi559
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
当前基于单机系统的传输控制协议(TCP)报文重组工具随着数据量的增大,运行效率越来越低,难以满足大数据时代的需求。为此,提出一种基于Hadoop的海量数据TCP报文重组系统。利用Hadoop分布式文件系统(HDFS)以及MapReduce并行处理框架,对TCP报文重组中的数据读取和结果输出步骤进行并行化处理。采用M apReduce辅助排序技术实现海量TCP数据流的分类。测试结果表明,与基于单机系统的报文重组工具相比,基于Hadoop的报文重组系统工作效率更高,并且当数据量达到100 GB时,运行效率可提
其他文献
习近平总书记指出:“我们的干部要上进,我们的党要上进,我们的国家要上进,我们的民族要上进,就必须大兴学习之风,坚持学习、学习、再学习。”这一论述指出了加强对党员干部的学习实
"地球上生命的历史即生物与它们的环境互相作用的历史."不论是山清水秀的内地风光,还是了无人烟的荒漠高原,都是生命发展中相互作用的印记.