本教程将介绍Apache Kylin与Apache Superset的集成,以及如何进行集成。
简介
Apache Superset可视化平台是一个现代化的企业级商业智能Web应用程序。Superset的整个后端是基于Python开发的,用到了Flask,Pandas,SqlAlchemy。可以与Kylin Python Client集成。
Apache Superset可视化功能
- 丰富的数据可视化集
- 易于使用的界面,用于探索和可视化数据
- 创建和共享仪表板
- 与主要身份验证提供程序(数据库,OpenID,LDAP,通过 Flask AppBuilder 的 OAuth 和 REMOTE_USER)集成的企业级身份验证
- 一种可扩展的,高粒度的安全/权限模型,对于可以访问个人特征和数据集的用户允许使用复杂的规则
- 一个简单的语义层,允许用户通过定义哪些字段应显示在哪个下拉列表以及哪些聚合和功能度量标准可供用户使用来控制数据源在 UI 中的显示方式
- 通过 SQLAlchemy 与大多数 SQL 的 RDBMS 集成
集成的好处
Apache Kylin 和 Apache Superset平台都是以为其用户提供更快和可交互式的分析的目的而构建。由于预先计算的 Kylin Cube,在 PB 级数据集上这两个开源项目的结合可以将这个目标变为现实。
集成的步骤
- 安装 Apache Kylin
- 成功的 build cube
- 安装 Apache Superset 可视化平台并进行初始化
- 在 Apache Superset 中连接 Apache Kylin
- 配置一个新的数据源
- 测试及查询
其它功能
Apache Superset可视化平台也支持导出 CSV, 共享, 以及查看 SQL 查询。
评论区(0)