Kettle简易入门

来自小能手俱乐部
跳到导航 跳到搜索

Kettle安装完成后打开,下面介绍Kettle简单的任务搭建。

表输入输出

创建转换ktr

在系统左上角New File图标上选择新建转换

Spoon.png

生成缩略图出错:无法找到文件

在新建好的ktr文件窗口里,双击空白内容,弹出转换属性,根据需要在转换名称处填写转换名字。

生成缩略图出错:无法找到文件

之后保存,选择希望保存的文件地址,保存后文件后缀为.ktr。

创建数据库连接

在新建好的转换文件打开界面,左侧窗口中,选择主对象树栏下的DB连接,右击选择新建。

生成缩略图出错:无法找到文件

在弹出的窗口中,按照自身数据库类别和链接,进行配置,当前按照本地mysql数据库配置。

生成缩略图出错:无法找到文件

表输入

在左侧栏中选择核心对象->输入->表输入,将相应图标拖拽到操作界面。

生成缩略图出错:无法找到文件

双击表输入后,在弹出的窗口中进行相应的配置,最后可以点击预览查看是否有查询的数据,最后点击确定即可。

生成缩略图出错:无法找到文件

表输出

在左侧栏中选择核心对象->输出->表输出

生成缩略图出错:无法找到文件

将组件拖拽到操作窗口中,并在点击表输入后按住shift点击表输出,将两个控件脸上。

生成缩略图出错:无法找到文件

双击表输出进行参数配置。目标表选择数据要入的表明,在数据库字段中填写两个表要对应的字段名。

生成缩略图出错:无法找到文件

运行

最后点击运行,则完成了Kettle数据转换任务的初级操作。

生成缩略图出错:无法找到文件

文件数据输入输出

文本输入输出

在左侧控件栏中,input组中选择text file input控件,控件为通过文件进行输入

生成缩略图出错:无法找到文件

通过将控件拖拽到操作界面

Textinput2.png

双击控件,输入相关配置

生成缩略图出错:无法找到文件

Step name:输入当前组件名字

点击Browse按钮,选择输入的文档,再店家Add按钮,即将文件添加到selected files列表中。

生成缩略图出错:无法找到文件

点击选择content界面,对文件和内容参数进行配置:

filetype选择文件格式

Separator输入字段的分隔符

Enclosure输入字段的封闭符

Escape输入字段换行符,不输入则默认为当前行结束即为换行

Header表示第一行为标题,不进入流程,若文件第一行不是标题,则不勾选即可

Format 默认为DOS即可,在window和linux都可使用

Encoding按照目标系统的编码格式选择即可

生成缩略图出错:无法找到文件

点击Fields编辑框,对文本字段进行录入,可以通过点击Get Fields按钮系统判断文件字段。

最后点击OK即可,此时文本输入控件以及完成,下面来看文本输出控件。

在output组中选择Text file output控件

生成缩略图出错:无法找到文件

将控件拖拽到操作台,并与输入相连接

生成缩略图出错:无法找到文件

双击控件,对控件进行配置

生成缩略图出错:无法找到文件

Step name输入当前控件名称

Filename 中输入希望生成的文件名称和地址

Extension为文件后缀

其他参数不重要

生成缩略图出错:无法找到文件

选择Content栏

Append为当前行的换行栏,不输入默认行输入结束就换行

Separator为字段的分隔符

Enclosure为字段的封闭符

生成缩略图出错:无法找到文件

选择Fields栏,输入字段信息,也可以通过GetFields按钮系统判断。点击OK,此时文本输出控件也配置完成。

excel输入输出

与文本的输入输出相似,此处就只介绍一下会使用到的相关参数配置。首先在input组和output组中选择控件。

生成缩略图出错:无法找到文件

在input中,配置需要填写

生成缩略图出错:无法找到文件

Add按钮和Browse按钮为新曾excel文件,方式如同文本输入

生成缩略图出错:无法找到文件

在Sheets框中,为选择Excel的sheet页,不填写则默认第一个

生成缩略图出错:无法找到文件

Fields框中,填写所需识别的字段信息,点击Get fields from header row按钮可以使Kettle识别文件内的字段。点击OK按钮则完成Excel输入的配置。

Excel输出配置如下:

生成缩略图出错:无法找到文件

filename为需要保存的文件名和地址,Extension为生成文件的后缀。

生成缩略图出错:无法找到文件

字段按照流中字段配置即可,也可以按GetFields按钮系统判断,最后点击OK即完成。

总结

以上几种输入输出皆为常用的控件,可以随需求搭配使用,保证输入输出字段可以对应上即可。