Kettle简介
Kettle是一款国外开源的ETL工具,纯java编写,可以在Window、Linux、Unix上运行, 数据抽取高效稳定。Kettle 中文名称叫水壶,该项目的主程序员MATT 希望把各种数据放到一个壶里,然后以一种指定的格式流出。Kettle这个ETL工具集,它允许你管理来自不同数据库的数据,通过提供一个图形化的用户环境来描述你想做什么,而不是你想怎么做。Kettle中有两种脚本文件,transformation和job,transformation完成针对数据的基础转换,job则完成整个工作流的控制。
1、Kettle的下载与安装(本文使用kettle版本为pdi-ce-7.1.0.0-12)点击下载地址官方网站
2、下载kettle压缩包,因kettle为绿色软件,解压缩到任意本地路径即可。然后打开Spoon.bat,如图所示:
因为,运行spoon在不同的平台上运行spoon所支持的脚本:
Spoon.bat:在Windows平台上运行spoon;
Spoon.sh:在Linux、AppleOSX、Solaris平台上运行Spoon。
3、初步启动和使用可能出现的问题总结
因为是纯java编写要安装jdk配置环境变量
如果启动还报错 ERROR:could not create the java virtual machine!
不是Java虚拟出了问题,修改一下spoon.bat里内存配置:
if "%PENTAHO_DI_JAVA_OPTIONS%"=="" set PENTAHO_DI_JAVA_OPTIONS="-Xms1024m" "-Xmx2048m" "-XX:MaxPermSize=256m"
改为:
if "%PENTAHO_DI_JAVA_OPTIONS%"=="" set PENTAHO_DI_JAVA_OPTIONS="-Xms512m" "-Xmx1024m" "-XX:MaxPermSize=256m"
若要连接mysql数据库,需要下载mysql驱动包 不然就会报下面这种错误
Driver class’sun.jdbc.odbc.JdbcOdbcDriver’ could not be found,make sure the sun.jdbc.odbc.JdbcOdbcDriver
意思就是没有找到你的mysql驱动包,所以我们要下载该jar包
下载地址:https://dev.mysql.com/downloads/connector/j/
或者点击直接下载里面包含MySQL和Oracle驱动包
如下图点击直接下载
下载好后,解压该文件将文件夹中的mysql-connector-java-5.1.46-bin.jar文件复制到kettle所安装的E:\kettle-pdi-ce-7.1.0.0-12\data-integration\lib下即可。
4、新建转换
5、新建作业job
来源:CSDN
作者:未曾远去
链接:https://blog.csdn.net/qq_36135335/article/details/86538688