Hadoop是个很流行的分布式计算解决方案,Hive是基于Hadoop构建的一套数据仓库分析系统,它提供了丰富的SQL查询方式来分析存储在Hadoop分布式文件系统中的数据:可以将结构化的数据文件映射为一张数据库表,并提供完整的SQL查询功能;可以将SQL语句转换为MapReduce任务运行,通过自己的SQL查询分析需要的内容,这套SQL简称Hive SQL,使不熟悉mapreduce的用户可以很方便地利用SQL语言‘查询、汇总和分析数据。
下载Hadoop: http://www.apache.org/dyn/closer.cgi/hadoop/core/
下载Hive:http://www.apache.org/dyn/closer.cgi/hive/
评论区(0)