Impala是用于处理Hadoop集群大数据的MPP查询引擎。
Presto支持PB量级的数据运算处理,是大规模并行处理模型。
Apache Kylin是一个开源的、分布式的分析型数据仓库,能在亚秒内查询巨大的表。
Apache Druid是一个高性能的、支持OLAP多维实时分析的数据处理系统。
Kettle是端对端的数据集成平台,可对多种数据源进行抽取、加载、转换等数据处理操作。
Talend是一种ETL工具,用户不需要掌握专业的ETL知识,仅仅通过Web界面和简单的组件拖拽就可实现数据处理。
DataX 是阿里开源的一个异构数据源离线同步工具。在本教程,您将学习到DataX的各种插件,快速上手数据同步工作。