Kylin 用Docker运行Kylin


为了让用户方便的试用Kylin,以及方便开发者在修改了源码后进行验证及调试。Kylin提供了Kylin的docker镜像。该镜像中,Kylin依赖的各个服务均已正确的安装及部署,包括:

  • JDK1.8
  • Hadoop2.8.5
  • Hive1.2.1
  • Spark2.4.7
  • Kafka1.1.1
  • MySQL5.1.73
  • Zookeeper3.4.6

1 快速试用Kylin

我们已将面向用户的Kylin镜像上传至docker仓库,用户无需在本地构建镜像,直接执行以下命令从docker仓库pull镜像:

dockerpullapachekylin/apache-kylin-standalone:4.0.0

pull成功后,执行以下命令启动容器:

dockerrun-d\
-m8G\
-p7070:7070\
-p8088:8088\
-p50070:50070\
-p8032:8032\
-p8042:8042\
-p2181:2181\
apachekylin/apache-kylin-standalone:4.0.0

在容器启动时,会自动启动以下服务:

  • NameNode,DataNode
  • ResourceManager,NodeManager
  • Kylin

并自动运行$KYLIN_HOME/bin/sample.sh。

容器启动后,我们可以通过“dockerexec-it<container_id>bash”命令进入容器内。当然,由于我们已经将容器内指定端口映射到本机端口,我们可以直接在本机浏览器中打开各个服务的页面,如:

容器资源建议

为了让Kylin能够顺畅的构建Cube,我们为YarnNodeManager配置的内存资源为6G,加上各服务占用的内存,请保证容器的内存不少于8G,以免因为内存不足导致出错。

为容器设置资源方法请参考:

关于如何定制修改Dockerimage,请参阅Git代码库的kylin/docker。