论文部分内容阅读
“我有太多的数据要分析”业务分析人员常常这样抱怨。今天,对于非常大容量数据集的定义是由十年之前人们对于大数据集的定义演变而来的,这非常具有戏剧性。十几年前,几个GB的数据都被看作是大数据集,几十个GB的则被认为是巨大数据集。那时候,有一些人就致力于改善一些技术,以帮助人们以合理的速度来分析GB级的数据。