Hadoop - 实时查询Drill
1.概述 在现实业务当中,存在这样的业务场景,需要实时去查询HDFS上的相关存储数据,普通的查询(如:Hive查询),时延较高。那么,是否存在时延较小的查询组件。在业界目前较为成熟的有Cloudera的Impala,Apache的Drill,Hortonworks的Stinger。本篇博客主要为大家介绍Drill,其他两种方式大家可以自行下去补充。 2.Drill Architecture 2.1 Cilent 使用Drill,可以通过以下方式进入到Drill当中,内容如下所示: Drill shell:使用客户端命令去操作 Drill Web Console:Web UI界面去操作相关内容 ODBC/JDBC:使用驱动接口操作 C++ API:C++的API接口 2.2 Drill Query Execution 执行流程如下图所示: 2.3 Core Modules 核心模块图,如下所示: 至于详细的文字描述,这里就不多做赘述了。大家看图若是有疑惑的地方,可以去官方网站,查看详细的文档描述。[ 官方文档 ] 3.Drill使用 介绍完Drill的架构流程,下面我们可以去使用Drill去做相关查询操作。安装Drill的过程比较简单,这里就不多做详细的赘述了。首先,去Apache的官网下载Drill的安装包,这里笔者所使用的本版是drill-1.2.0