Apache Spark是专为大规模数据处理而设计的快速通用计算引擎。
Hadoop是个很流行的分布式计算解决方案,Hive构建在基于静态批处理的Hadoop 之上,是基于hadoop的数据仓库工具。在本教程中,您将学会如何利用Hive进行大数据集的批处理。
GreenPlum采用了MPP(大规模并行处理),是一个由多个独立的数据库服务组合成关系型数据库集群。在本教程中,您将学会如何使用GreenPlum分析数据库。