Kettle 字符串替换


任务描述

字符串替换与值映射非常类似,不同之处在于字符串替换的字段值是字符串,值映射的字段可以是多种数据类型。

由于在“学籍信息.xls”文件中,学籍数据用“H”或“J”表示,需要使用【字符串替换】组件,分别还原其对应的值“户籍生”和“借读生”。

实现思路

  • 建立【字符串替换】转换工程。
  • 设置【字符串替换】组件参数。
  • 预览结果数据。

操作过程

1)建立字符串替换转换工程

使用Ctrl+N快捷键,创建【字符串替换】转换工程。接着创建【Excel输入】组件,设置参数,导入“学籍信息.xls”文件。

在【字符串替换】转换工程中,单击【核心对象】选项卡,展开【转换】对象,选中【字符串替换】组件,并拖拽至右边工作区中。由【Excle输入】组件指向【字符串替换】组件,建立节点连接,如图所示。

kettle,kettle字符串替换,字符串操作,kettle字符串替换组件

2)设置参数

双击【字符串替换】组件,弹出【字符串替换】对话框,如图所示。

kettle,kettle字符串替换,字符串操作,kettle字符串替换组件

【字符串替换】组件的参数包含组件的基础参数和【字段】表参数,有关参数说明如表所示。

参数名称

说明

基础参数

步骤名称

表示【字符串替换组件名称】,在单个转换工程中,名称必须唯一。默认值是【字符串替换】组件名称。

字段

表示对将要进行字符串替换的字段参数,使用一个【字段】表对字段参数进行设置,有关参数说明如下所示。

输入流字段

表示要进行字符串替换的输入流字段。默认值为空。

输出流字段

表示进行字符串替换后的输出流字段,为空时覆盖原来要进行替换的输入流字段,默认值为空。

使用正则表达式

表示是否使用正则表达式,选项有:Y、N。默认值为空。

搜索

表示是否搜索此次字符串的匹配值,默认值为空。

使用…替换

表示要替换匹配值的字符串数据,默认值为空。

设置为空串?

表示是否设置空字符串,选项有:Y、N。默认值为空。

使用字段值替换

表示使用一个字段值替换字符串,默认值为空。

整个单词匹配

表示是否要整个单词都匹配,选项有:Y、N,默认值为空。

大小写敏感

表示是否区分大小写,选项有:Y、N,默认值为空。

In Unicode

表示是否设置Unicode,选项有:Y、N,默认值为空。

在【字符串替换】对话框中,设置参数,对输入数据中“学籍”字段中数据“H”和“J”,分别使用“户籍生”和“借读生”进行替换,步骤如下:

1)确认组件名称。【步骤名称】保留默认值,设置为“字符串替换”。

2)确定字段参数。对【字段】表的参数进行设置。此时完成【字符串替换】组件参数的设置,如图所示。

kettle,kettle字符串替换,字符串操作,kettle字符串替换组件

3)预览结果数据

在【字符串替换】转换工程中,单击【字符串替换】组件,预览字符串替换后的数据,如图所示。

kettle,kettle字符串替换,字符串操作,kettle字符串替换组件