CDH集成Kylin
- 下载地址:下载CDH5版本Kylin
一、安装启动
1. 上传并解压下载的tar包
tar -zxvf apache-kylin-2.6.4-bin-cdh57.tar.gz -C /opt/cdh-5.15.2
mv apache-kylin-2.6.4-bin-cdh57 kylin-2.6.4
2. 配置环境变量
- 注意:Spark作为Kylin启动的一项环境检查,无论是否使用Spark作为Kylin的构建引擎,都需要集群安装Spark
sudo vim /etc/profile
#
# SPARK_HOME
export SPARK_HOME=/opt/cdh-5.15.2/cloudera/parcels/SPARK2/lib/spark2
export PATH=$PATH:$SPARK_HOME/sbin
#
# KYLIN_HOME
export KYLIN_HOME=/opt/cdh-5.15.2/kylin-2.6.4
export PATH=$PATH:KYLIN_HOME/bin
#
# 重加载文件生效
source /etc/profile
3. 修改配置文件
vim $KYLIN_HOME/conf/kylin.properties
#
# 修改:
kylin.server.cluster-servers=192.168.1.120:7070
# 增加:
kylin.job.jar=$KYLIN_HOME/lib/kylin-job-2.6.3.jar
kylin.coprocessor.local.jar=$KYLIN_HOME/lib/kylin-coprocessor-2.6.3.jar
kylin.job.yarn.app.rest.check.status.url=http://192.168.1.57:8088/ws/v1/cluster/apps/{job_id}?anonymous=true
- 配置文件中有详细说明,此处不一一列举
4. 执行环境检查
sudo -u hdfs $KYLIN_HOME/bin/check-env.sh
- CDH集群会为组件创建独立的用户,此处如使用错误用户会报HDFS权限错误,解决方法即将用户添加到supergroup组中,具体方法在CentOS7离线安装CDH5.15中已写明,此处不再赘述
5. 启动服务
$KYLIN_HOME/bin/kylin.sh start
$KYLIN_HOME/bin/kylin.sh sop
- 没有
restart
二、登录Web页面
- 地址:http://host:7070/kylin
- 默认用户
- 管理:ADMIN / KYLIN
- 建模:MODELER / MODELER
- 分析:ANALYST / ANALYST
- 用户需要在Web页面登陆一次后才能正常使用,自定义用户后续会写
三、其他配置
(一)配置Impala为下压查询引擎
1. 修改kylin.properties
kylin.query.pushdown.runner-class-name=org.apache.kylin.query.adhoc.PushDownRunnerJdbcImpl
kylin.query.pushdown.jdbc.url=jdbc:impala://host:21050/default
kylin.query.pushdown.jdbc.driver=com.cloudera.impala.jdbc41.Driver
# 如未配置用户认证,用户可用任意有hdfs权限的系统用户
kylin.query.pushdown.jdbc.username=hadoop
# kylin.query.pushdown.jdbc.password=
kylin.query.pushdown.jdbc.pool-max-total=150
kylin.query.pushdown.jdbc.pool-max-idle=100
kylin.query.pushdown.jdbc.pool-min-idle=50
2. 上传Impala的JDBC驱动
- 下载地址:下载Impala的JDBC
- 解压下载的zip包,上传
ImpalaJDBC41.jar
到$KYLIN_HOME/lib下,重启Kylin
(二)配置Presto为下压查询引擎
1. 修改kylin.properties
kylin.query.pushdown.runner-class-name=org.apache.kylin.query.adhoc.PushDownRunnerJdbcImpl
kylin.query.pushdown.jdbc.url=jdbc:presto://coordinator-host:port/hive
kylin.query.pushdown.jdbc.driver=com.facebook.presto.jdbc.PrestoDriver
# 如未配置用户认证,用户可用任意有hdfs权限的系统用户
kylin.query.pushdown.jdbc.username=hadoop
# kylin.query.pushdown.jdbc.password=
kylin.query.pushdown.jdbc.pool-max-total=150
kylin.query.pushdown.jdbc.pool-max-idle=100
kylin.query.pushdown.jdbc.pool-min-idle=50
2. 上传Impala的JDBC驱动
- 下载地址:下载Presto的JDBC
- 上传
presto-jdbc-0.228.jar
到$KYLIN_HOME/lib下,重启Kylin
(三)修改压缩算法
- Kylin默认使用Snappy压缩,可通过配置文件修改为lzo、gzip、lz4、none
- 修改为lzo压缩
vim conf/kylin.properties
#
kylin.storage.hbase.compression-codec=lzo
- 需要集群支持LZO压缩,方法在CentOS7离线安装CDH5.15中已写明,此处不再赘述
四、注意事项
(一)HDFS权限报错
- 解决办法:将Kylin的启动账户添加到supergroup组中,具体操作见CentOS7离线安装CDH5.15
(二)关于下压查询
- Impala-2.12不支持date类型,在使用Impala为下压查询引擎时,时间字段不要使用date类型
- Presto查询使用的varchar类型与Kylin不兼容,在使用Presto为下压查询引擎时,建议使用string作为字符串类型
来源:CSDN
作者:IORILYCY
链接:https://blog.csdn.net/dqwanghe00/article/details/103656419