Mars‘s docMars‘s doc
🏠主页
  • 🍻Activiti

    • 01-核心API
    • 02-监听
    • 03-数据库表介绍
    • 04-常见问题
  • 📊JasperReport

    • 01-JaspersoftStudio工具使用
    • 02-JasperReport集成
    • 03-JasperReport常见问题
  • 🎬JavaScript

    • 01-Node
    • 02-VuePress
    • 03-Vue组件高度宽度
    • 04-显示器和屏幕高度
    • 05-页面地址
    • 06-归纳总结
  • 🍵Java

    • 01-Java8特性
    • 02-多线程
    • 03-Jar包
    • 04-Util
    • 05-validation注解
    • 06-反编译
    • 07-try-with-resource
    • 08-ThreadLocal内存泄漏
    • 09-Jvm
    • 10-Excel
    • 11-Lombook
    • 12-条件注解
    • 13-WebMvcConfigurationSupport
    • 14-WebMvcConfigurer
    • 15-分布式锁
    • 16-Caffeine
    • 17-DynamicDatasource
    • 18-MybatisPlus
    • 19-Swagger
    • 20-BeanPostProcessor
    • 21-Bean初始化
    • 22-ConfigurableApplicationContext
    • 23-常用注解
    • 24-ApplicationListener
    • 25-JavaDoc
    • 26-Spring-Cache
    • 27-StopWatch耗时统计
    • 28-Word
    • 29-Druid
    • 30-OpenFeign
    • 31-反射相关
    • 32-Fastjson
    • 33-Yaml
  • 💻Linux

    • 01-Linux常用命令
    • 02-Linux脚本汇总
    • 03-Yum源
    • 04-Debian
    • 05-Ubuntu
  • 🐋Docker

    • 01-Docker常用命令
    • 02-Dockerfile
    • 03-Swarm
    • 04-Stack
    • 05-Docker常见问题
    • 06-DockerCompose
    • 07-Docker应用用汇总
    • 08-Kasm
    • 09-Rustdesk
  • 🌐Nginx

    • 01-Nginx
  • 📈数据库

    • 01-Mysql
    • 02-Clickhouse
    • 03-Doris
    • 04-DRDS
  • 📉Kettle

    • 01-入门
    • 02-js脚本
    • 03-优化
    • 04-连接组件
    • 05-参数
    • 06-工具
    • 07-日志
    • 08-流程组件
    • 09-输入组件
    • 10-输出组件
    • 11-转换组件
    • 12-驱动
  • 🎨Git

    • 01-Git使用
  • 📝Maven

    • 01-Maven使用
    • 02-Maven配置
  • 🎯Jenkins

    • 01-Jenkins部署
    • 02-Jenkisn常见问题
  • 01-设计模式之禅
  • 02-领域驱动设计
  • 03-JavaScript高级程序设计
  • 🍓树莓派

    • 01-RaspBerry
  • 📘Markdown

    • 01-Markdown语法
    • 02-Markdown表情
    • 03-Markdown代码块语言对照
  • 📇其他

    • 01-HTML XML 转义
    • 02-GitHub
    • 03-Idea
    • 04-Nmon
    • 05-Windows
    • 06-WinSw
GitHub
🏠主页
  • 🍻Activiti

    • 01-核心API
    • 02-监听
    • 03-数据库表介绍
    • 04-常见问题
  • 📊JasperReport

    • 01-JaspersoftStudio工具使用
    • 02-JasperReport集成
    • 03-JasperReport常见问题
  • 🎬JavaScript

    • 01-Node
    • 02-VuePress
    • 03-Vue组件高度宽度
    • 04-显示器和屏幕高度
    • 05-页面地址
    • 06-归纳总结
  • 🍵Java

    • 01-Java8特性
    • 02-多线程
    • 03-Jar包
    • 04-Util
    • 05-validation注解
    • 06-反编译
    • 07-try-with-resource
    • 08-ThreadLocal内存泄漏
    • 09-Jvm
    • 10-Excel
    • 11-Lombook
    • 12-条件注解
    • 13-WebMvcConfigurationSupport
    • 14-WebMvcConfigurer
    • 15-分布式锁
    • 16-Caffeine
    • 17-DynamicDatasource
    • 18-MybatisPlus
    • 19-Swagger
    • 20-BeanPostProcessor
    • 21-Bean初始化
    • 22-ConfigurableApplicationContext
    • 23-常用注解
    • 24-ApplicationListener
    • 25-JavaDoc
    • 26-Spring-Cache
    • 27-StopWatch耗时统计
    • 28-Word
    • 29-Druid
    • 30-OpenFeign
    • 31-反射相关
    • 32-Fastjson
    • 33-Yaml
  • 💻Linux

    • 01-Linux常用命令
    • 02-Linux脚本汇总
    • 03-Yum源
    • 04-Debian
    • 05-Ubuntu
  • 🐋Docker

    • 01-Docker常用命令
    • 02-Dockerfile
    • 03-Swarm
    • 04-Stack
    • 05-Docker常见问题
    • 06-DockerCompose
    • 07-Docker应用用汇总
    • 08-Kasm
    • 09-Rustdesk
  • 🌐Nginx

    • 01-Nginx
  • 📈数据库

    • 01-Mysql
    • 02-Clickhouse
    • 03-Doris
    • 04-DRDS
  • 📉Kettle

    • 01-入门
    • 02-js脚本
    • 03-优化
    • 04-连接组件
    • 05-参数
    • 06-工具
    • 07-日志
    • 08-流程组件
    • 09-输入组件
    • 10-输出组件
    • 11-转换组件
    • 12-驱动
  • 🎨Git

    • 01-Git使用
  • 📝Maven

    • 01-Maven使用
    • 02-Maven配置
  • 🎯Jenkins

    • 01-Jenkins部署
    • 02-Jenkisn常见问题
  • 01-设计模式之禅
  • 02-领域驱动设计
  • 03-JavaScript高级程序设计
  • 🍓树莓派

    • 01-RaspBerry
  • 📘Markdown

    • 01-Markdown语法
    • 02-Markdown表情
    • 03-Markdown代码块语言对照
  • 📇其他

    • 01-HTML XML 转义
    • 02-GitHub
    • 03-Idea
    • 04-Nmon
    • 05-Windows
    • 06-WinSw
GitHub
  • 🏫技术相关

    • 🍻Activiti

      • 01-核心API
      • 02-监听
      • 03-数据库表介绍
      • 04-常见问题
    • 📊JasperReport

      • 01-JaspersoftStudio工具使用
      • 02-JasperReport集成
      • 03-JasperReport常见问题
    • 🎬JavaScript

      • 01-Node
      • 02-VuePress
      • 03-Vue组件高度宽度
      • 04-显示器和屏幕高度
      • 05-页面地址
      • 06-归纳总结
    • 🍵Java

      • 01-Java8特性
      • 02-多线程
      • 03-Jar包
      • 04-Util
      • 05-validation注解
      • 06-反编译
      • 07-try-with-resource
      • 08-ThreadLocal内存泄漏
      • 09-Jvm
      • 10-Excel
      • 11-Lombook
      • 12-条件注解
      • 13-WebMvcConfigurationSupport
      • 14-WebMvcConfigurer
      • 15-分布式锁
      • 16-Caffeine
      • 17-DynamicDatasource
      • 18-MybatisPlus
      • 19-Swagger
      • 20-BeanPostProcessor
      • 21-Bean初始化
      • 22-ConfigurableApplicationContext
      • 23-常用注解
      • 24-ApplicationListener
      • 25-JavaDoc
      • 26-Spring-Cache
      • 27-StopWatch耗时统计
      • 28-Word
      • 29-Druid
      • 30-OpenFeign
      • 31-反射相关
      • 32-Fastjson
      • 33-Yaml
  • 🏢服务器

    • 💻Linux

      • 01-Linux常用命令
      • 02-Linux脚本汇总
      • 03-Yum源
      • 04-Debian
      • 05-Ubuntu
    • 🐋Docker

      • 01-Docker常用命令
      • 02-Dockerfile
      • 03-Swarm
      • 04-Stack
      • 05-Docker常见问题
      • 06-DockerCompose
      • 07-Docker应用用汇总
      • 08-Kasm
      • 09-Rustdesk
    • 🌐Nginx

      • 01-Nginx
  • 🏩数据相关

    • 📈数据库

      • 01-Mysql
      • 02-Clickhouse
      • 03-Doris
      • 04-DRDS
    • 📉Kettle

      • 01-入门
      • 02-js脚本
      • 03-优化
      • 04-连接组件
      • 05-参数
      • 06-工具
      • 07-日志
      • 08-流程组件
      • 09-输入组件
      • 10-输出组件
      • 11-转换组件
      • 12-驱动
  • 🏬管理工具

    • 🎨Git

      • 01-Git使用
    • 📝Maven

      • 01-Maven使用
      • 02-Maven配置
    • 🎯Jenkins

      • 01-Jenkins部署
      • 02-Jenkisn常见问题
  • 🏯书籍笔记

    • 01-设计模式之禅
    • 02-领域驱动设计
    • 03-JavaScript高级程序设计
  • 🏦其他

    • 🍓树莓派

      • 01-RaspBerry
    • 📘Markdown

      • 01-Markdown语法
      • 02-Markdown表情
      • 03-Markdown代码块语言对照
    • 📇其他

      • 01-HTML XML 转义
      • 02-GitHub
      • 03-Idea
      • 04-Nmon
      • 05-Windows
      • 06-WinSw

Kettle 转换组件

Add XML

组件说明

将数据流按照指定的配置转换为 XML 结构的数据

组件预览

add xml预览

组件详解

内容

选项描述
编码XML 使用的编码,会在 XML 头文件中指定
Output Value数据流内容生成到 XML 的节点名称
根 XML 元素根节点元素名称
omit xml header省略 XML头
omit null value from xml result从 XML 结果中省略空值

字段

选项描述
字段名XML 字段名称
Element name生成的 XML 中原始标签名称
类型数据类型
格式数据格式
长度数据长度
精度设置格式为 Number 类型的数据精度
Currency用来解释如 $10,000.00 的数字。
Decimal进制
数字分组符号数字分组符号
空空
属性属性 (否:字段设置为标签 element ;否:字段设置为属性 attribute )
Attribute parent name父级属性名

组件示例

  1. 转换

add xml示例

  1. 预览

add xml示例

Add a checksum

组件说明

计算输入流中一个或多个字段的校验和(根据配置生成校验码),并将其作为新字段添加到输出中

组件预览

add a checksum预览

组件详解

选项描述
步骤名称名称
类型生成校验码的算法类型
结果类型校验码结果类型
结果字段结果存储的字段名称
Field separator string字段分隔符字符串
Evaluation method评估方法

组件示例

  1. 转换

add a checksum转换

  1. 预览
  • Add a checksum

add a checksum预览

  • Add a checksum2

add a checksum2预览

Closure generator

组件说明

Closure generator(闭包组件),实现对树形结构数据的深度(层次)的统计(统计树形数据从根节点到每一个下级节点有多少层,即深度)

组将预览

closuregenerator预览

组件详解

选项描述
Step Name步骤名称
Parent ID field父节点 id 字段
Child ID field子节点 id 字段
Distance field name深度(层级)字段名称
Root is zero(integer)?根节点是不是数字 0

组件示例

  1. 转换

closuregenerator转换

  1. 预览

closuregenerator预览

Concat fields

组件说明

将数据流中任意字段按照指定拼接符拼接到一个新的目标字段

组件预览

concat fields预览

组件详解

Target Fidld Name目标字段,可以自定义,即拼接后的字段
Length of Target Field目标属性长度,0为不限制
Separator字段拼接的连接符

组件示例

  1. 转换

concat fields转换

  1. 预览

concat fields转换预览

值映射

组件说明

将数据流中指定字段值映射为其他值(可以覆盖、也可以单独设置一个其他值)

组件预览

值映射

组件详解

使用的字段名要转换的字段
目标字段名(空=覆盖)用于存储转换后值的目标字段,不设置时覆盖“使用的字段名”设置的字段值
不匹配时的默认值不符合映射关系时的值(相当于默认值)

组件示例

  1. 转换

值映射转换

  1. 预览

值映射转换预览

列拆分为多行

组件说明

将某一列按照“分隔符”或正则表达式,拆分成多个字段,并把改行数据拆分成多列数据

组件预览

列拆分为多行

组件详解

要拆分的字段要拆分的字段
分隔符用什么符号分割
分隔符时一个正则表达式激活时,分隔符可以使用正则表达式
新字段名拆分后字段值存放的字段

组件示例

  1. 转换

列拆分为多行转换

  1. 预览

列拆分为多行转换预览

列转行

组件说明

将列数据按照关键字+分组+转换条件的方式,转换为行数据,有点像 SQL 的 case when

组件预览

列转行预览

组件详解

列转行预览

关键字段要用哪个字段的值转为一行数据
分组字段用哪个字段区分每一行数据
目标字段转换出来的行数据字段(新的字段名)
数据字段通过哪个字段的值生成行目标字段
关键字段值通过“关键字段值”与“数据字段”的值匹配,匹配(相等)时,该值赋值给目标字段作为行数据显示的目标值

组件示例

  1. 转换

列转行转换

  1. 预览
  • excel 原始值

列转行转换预览

  • 转换结果

列转行转换预览

剪切字符串

组件说明

裁剪字符串,类似 java 的 substring

组件预览

剪切字符串预览

组件详解

输入流字段输入流里面要截取的字段(原始字段)
输出流字段截取后输出流中的字段(目标字段)
起始位置从哪个位置开始截取
结束位置截取到哪个位置

注意: 起始位置是从0开始计算的

组件示例

剪切字符串组件示例

去除重复记录

组件说明

根据设置的字段对数据流中数据去重

注意:需要先对数据流中去重数据排序,否则结果不准

组件预览

去除重复记录组件示例

组件详解

增加计数器到输出?统计重复个数
计数器字段存放重复值个数的字段
字段名称去除重复使用的字段
忽略大小写去除重复使用的字段是否忽略大小写

组件示例

  1. 转换

去除重复记录转换

  1. 预览
  • excel 原始数据

excel 原始数据

  • 按照 id+name 去重

按照 id+name 去重

  • 按照 id 去重

按照 id 去重

  • 按照 name 去重

按照 name 去重

唯一行 (哈希值)

组件说明

通过哈希值去重数据,和“排序记录”+“去除重复记录”效果一样,区别在于实现原理

组件预览

唯一行 (哈希值)预览

组件示例

  1. 转换

唯一行 (哈希值)示例

  1. 预览
  • id + name

id + name预览

  • id

id预览

  • name

name预览

增加常量

没啥可说的,见名知意

增加序列

没啥可说的

注意:它不能单独使用,也不能作为转换的起点

字段选择

组件说明

对数据流中的字段进行处理,包括改名、删除字段、修改字段类型等

组件预览

字段选择预览

组件详解

选择和修改

用来设置要保留字段的配置

字段名称要选择和修改的字段名称
改名成字段改名后的目标名称,如果不希望改名,那么为空。默认值为空
长度字段的长度。默认值为空
精度数字类型字段的浮点数的精确位数。默认值为空

移除

用来设置移除字段的配置

  • 字段名称:要从数据流中移除的字段名

元数据

用于设置字段属性

字段名称改变元数据的字段的名称
改名成字段改名后的目标名称
类型字段类型
长度字段长度
精度数字类型字段的浮点数的精确位数
Binary to Normal?是否将字符串转换为数字数据类型
格式数字或日期格式
Date Format Lenient?表示日期格式解析器是否是严格还是宽松的。选项有是、否。设置为“是”时,只接受严格有效的日期值;设置为“否”时,解析器会尝试把错误日期纠正为正确的日期。默认值为空
Date Locale表示日期地区区域。为空时,以系统上默认日期区域编码设置。默认值为空
Date Time Zone表示日期时区。为空时,以系统上默认日期日期编码设置。默认值为空
Lenient number conversion?表示数字转换是否是宽松的。选项有是、否。设置为“是”时,将解析数字,直到找到一个非数字值,如破折号或斜杠,解析然后停止,不报告错误。当设置为“否”时,如果输入的数字无效,解析器将报告错误。默认值为空
Encoding表示文本文件编码。为空时,以在系统上使用默认编码。从系统上提供的编码列表中选择。默认值为空
分组表示数值分组符号,一般使用“,”英文逗号。默认值为空
货币符号表示货币符号,例如“¥”、“$”、“€”等货币符号。默认值为空

组件示例

Edit this page
Last Updated:
Contributors: wangxiaoquan
Prev
10-输出组件
Next
12-驱动