ETL环境搭建
介绍
kettle 是纯 java 开发,开源的 ETL工具,用于数据库间的数据迁移 。可以在 Linux、windows、unix 中运行。有图形界面,也有命令脚本还可以二次开发。
kettle 的官网是 https://community.hitachivantara.com/docs/DOC-1009855,github 地址是 https://github.com/pentaho/pentaho-kettle。
安装
这边以 windows 下的配置为例,linux 下配置类似。
jdk 安装及配置环境变量
由于 kettle 是基于 java 的,因此需要安装 java 环境,并配置 JAVA_HOME 环境变量。
建议安装 JDK1.8 及以上,7.0以后版本的 kettle 不支持低版本 JDK。
下载 kettle
从 官网 下载 kettle ,解压到本地即可。
下载相应的数据库驱动
由于 kettle 需要连接数据库,因此需要下载对应的数据库驱动。
例如 MySQL 数据库需要下载 mysql-connector-java.jar,oracle 数据库需要下载 ojdbc.jar。下载完成后,将 jar 放入 kettle 解压后路径的 lib 文件夹中即可。
注意:本文基于 pdi-ce-7.0.0.0-25 版本进行介绍,低版本可能有区别。
启动
双击 Spoon.bat 就能启动 kettle 。