论文部分内容阅读
Hive是Hadoop的常用基础构架,在实际的工作使用的频率很高。Hive类似于MySQL之类的数据库,其在Hadoop生态圈中实际上扮演的是数据仓库的角色,提供了数据管理和查询功能。利用Hive提供的相关工具,可以进行数据提取转化加载等操作。其实现了存储、查询和分析存储在Hadoop中的大规模数据的机制。