如何配置Kettle集群运行环境
Kettle是一款开源的ETL工具,以其高效和可扩展性而闻名于业内。其高效的一个重要原因就是其多线程和集群功能。 Kettle的多线程采用的是一种流水线并发的机制,我们在另外的文章中专门有介绍。这里主要介绍的是kettle . Kettle 是一款开源的 ETL 工具,以其高效和可扩展性而闻名于业内。其高效的一个重要原因就是其多线程和集群功能。 Kettle 的多线程采用的是一种流水线并发的机制,我们在另外的文章中专门有介绍。这里主要介绍的是kettle的集群。 集群允许转换以及转换中的步骤在多个服务器上并发执行。 在使用 kettle 集群时,首先需要定义的是 Cluster schema 。所谓的 Cluster schema 就是一系列的子服务器的集合。在一个集群中,它包含一个主服务器( Master )和多个 从属服务器 服务器 (slave) 。如下图所示: 子服务器( Slave servers )允许你在远程服务器上执行转换。建立一个子服务器需要你在远程服务器上建立一个叫做“ Carte ”的 web 服务器,该服务器可以从 Spoon( 远程或者集群执行 ) 或者转换任务中接受输入。 在以后的描述中,如果我们提到的是子服务器,则包括集群中的主服务器和从属服务器;否则我们会以主服务器和从属服务器来进行特别指定。 选项 描述 服务器名称 子服务器的名称 主机名称或 IP