查看“Kettle转换步骤”的源代码
←
Kettle转换步骤
跳到导航
跳到搜索
因为以下原因,您没有权限编辑本页:
您请求的操作仅限属于该用户组的用户执行:
用户
您可以查看和复制此页面的源代码。
== 概述 == 转换步骤分类: 1. 增加新的列 2. 字符串处理 3. 行列变换 4. 排序/排重/字段选择 5. 其他转换步骤 == 增加新的列 == === 增加常量列 === 增加一列常量的列 [[文件:Ct5-1.png|无框|701x701像素]] 其它增加列的操作大同小异,不一一赘述,只介绍计算器 * 增加常量列 * 增加序列列 * 增加分组序列列 * 增加校验列 * 增加XML列 * 计算器 === 计算器 === 可以进行数值运算、日期运算等... [[文件:Ct5-2.png|无框|579x579像素]] == 字符串处理 == === 字符串拆分 === [[文件:Ct5-3.png|无框|574x574像素]] 1.同Java的indexOf,左闭右开的形式 2.将一个字段拆分为多个字段,注意配置拆分后接收的字段 [[文件:Ct5-4.png|无框|690x690像素]] 3.拆分成多行 类似上面,不过拆分成多行是这样的结果: [[文件:Ct5-5.png|无框]] === 字符串合并 === [[文件:Ct5-6.png|无框|718x718像素]] === 字符串替换 === [[文件:Ct5-7.png|无框|652x652像素]] 值映射:对数值进行映射,例如经典的性别1 0映射为男 女: [[文件:Ct5-8.png|无框|570x570像素]] 正则匹配: [[文件:Ct5-9.png|无框|866x866像素]] === 字符串其它转换 === [[文件:Ct5-10.png|无框|623x623像素]] 字符串操作: [[文件:Ct5-11.png|无框]] 可以进行字符串转义(例如> 转义为 >)、保留/去除字符串里的数字、移除特殊字符、补充长度 == 行列变换 == 图示如下:(也叫正规化-列转行-宽表变窄表/ 反正规化-行转列-窄表变宽表) [[文件:Ct5-12.png|无框|536x536像素]] 示例如下: [[文件:Ct5-13.png|无框|657x657像素]] 窄表变宽表的配置:注意理解分组字段的含义 [[文件:Ct5-14.png|无框|744x744像素]] == 排序/去重/字段选择 == 1.排序 [[文件:Ct5-15.png|无框]] 2.排重 Unique Row: 需要事先排序: [[文件:Ct5-16.png|无框|445x445像素]] Unique Row(Hash): 不排序,速度快,占内存。
返回至“
Kettle转换步骤
”。
导航菜单
个人工具
登录
名字空间
页面
讨论
变体
视图
阅读
查看源代码
查看历史
更多
搜索
导航
-==扬==-
-==帆==-
-==起==-
-==航==-
最近更改
随机页面
MediaWiki帮助
工具
链入页面
相关更改
特殊页面
页面信息