使用独立的HBase集群部署Apache Kylin
介绍 ApacheKylin主要使用HBase来存储多维数据集数据。HBase集群的性能直接影响着Kylin的查询性能。在常见的场景中,HBase与mr/hive一起部署在一个HDFS集群上,这使得所使用的资源受到限制,mr作业会影响HBase的性能。这些问题可以通过独立的HBase集群来解决,ApacheKylin目前支持这种部署模式。 环境要求 要启用独立的HBase群集支持,请首先检查基本环境: 部署主集群和HBase集群,确保两个集群都正常工作 确保Kylin服务器可以使用具有完全限定路径的HDFS shell访问两个集群。 确保Kylin服务器可以将mr作业提交到主集群,并且可以使用hive shell访问数据仓库,确保hadoop和hive的配置指向主集群。 确保Kylin服务器可以使用hbase shell访问hbase集群,确保hbase的配置指向hbase集群。 确保主集群上的作业可以直接访问HBase集群 配置 更新kylin.properties中的config kylin.hbase.cluster.fs,其值为hbase cluster的名称节点地址,如hdfs://hbase-cluster-nn01.example.com:8020 请注意,该值应与hbase主节点上root.dir的namenode地址保持一致,以确保批量加载到hbase中。