Kettle转换步骤
跳到导航
跳到搜索
概述
转换步骤分类:
1. 增加新的列
2. 字符串处理
3. 行列变换
4. 排序/排重/字段选择
5. 其他转换步骤
增加新的列
增加常量列
增加一列常量的列
生成缩略图出错:无法找到文件
其它增加列的操作大同小异,不一一赘述,只介绍计算器
- 增加常量列
- 增加序列列
- 增加分组序列列
- 增加校验列
- 增加XML列
- 计算器
计算器
可以进行数值运算、日期运算等...
生成缩略图出错:无法找到文件
字符串处理
字符串拆分
生成缩略图出错:无法找到文件
1.同Java的indexOf,左闭右开的形式
2.将一个字段拆分为多个字段,注意配置拆分后接收的字段
生成缩略图出错:无法找到文件
3.拆分成多行
类似上面,不过拆分成多行是这样的结果:
字符串合并
字符串替换
值映射:对数值进行映射,例如经典的性别1 0映射为男 女:
生成缩略图出错:无法找到文件
正则匹配:
生成缩略图出错:无法找到文件
字符串其它转换
字符串操作:
可以进行字符串转义(例如> 转义为 >)、保留/去除字符串里的数字、移除特殊字符、补充长度
行列变换
图示如下:(也叫正规化-列转行-宽表变窄表/ 反正规化-行转列-窄表变宽表)
生成缩略图出错:无法找到文件
示例如下:
生成缩略图出错:无法找到文件
窄表变宽表的配置:注意理解分组字段的含义
生成缩略图出错:无法找到文件
排序/去重/字段选择
1.排序
2.排重
Unique Row: 需要事先排序:
Unique Row(Hash): 不排序,速度快,占内存。