Kettle 3.2使用说明书
概述
1.Kettle资源库管理
1.1 新建资源库
1.2 更新资源库
1.3 资源库登陆和用户管理
1.4 资源库登录和没有资源库登录的区别
2.菜单栏介绍
2.1 文件
2.2 编辑
2.3 视图
2.4 资源库
2.5 转换
2.6 作业
2.7 向导
2.8 帮助
2.9 变量
2.9.1 变量使用
2.9.2 变量范围
3.工具栏介绍
3.1 转换 Transformation工具栏
3.2 工作 Jobs工具栏
4.主对象树
4.1 转换主对象树
4.1.1 新建转换
4.1.2 转换设置
4.1.3 DB连接
4.1.4 Steps(步骤)
4.1.5 Hops(节点连接)
4.1.6 数据库分区 schems
4.1.7 子服务器
4.1.8 Kettle 集群 schems
4.2 Jobs主对象树
4.2.1 新建 Job
4.2.2 设置 Job 属性
4.2.3 DB 连接
4.2.4 作业项目
4.2.5 子服务器
5. 转换核心对象
5.1 Transform
5.2 Input
5.3 输入
5.3.1 Access Input
5.3.2 CSV file input
5.3.3 Cube 输入 多维立方
5.3.4 Excel 输入
5.3.5 Fixed file input
5.3.6 Generate random value
5.3.7 Get file Names
5.3.8 Get Files Rows Count
5.3.9 Get data from XML
5.3.10 LDAP Input
5.3.11 LDIF Input
5.3.12 Mondrian Input
5.3.13 Property Input
5.3.14 Streaming XML Input
5.3.15 XBase 输入
5.3.16 XML 输入
5.3.17 文本文件输入
5.3.18 生成记录
5.3.19 获取系统信息
5.3.20 表输入
5.4 输出
5.4.1 Access Output
5.4.2 Cube 输出
5.4.3 Excel Output
5.4.4 Properties Output
5.4.5 SQL File Output
5.4.6 XML 输出
5.4.7 删除
5.4.8 插入/更新
5.4.9 文本文件输出
5.4.10 更新
5.4.11 表输出
5.5 查询
5.5.1 Check if a column exists
5.5.2 File Exists
5.5.3 HTTP client
5.5.4 Table exists
5.5.5 Web 服务查询
5.5.6 数据库查询
5.5.7 数据库连接
5.5.8 流查询
5.5.9 调用 DB 存储过程
5.6 转换
5.6.1 Abort
5.6.2 Add XML 增加 XML
5.6.3 Add a checksum 增加检查和
5.6.4 Analytic Query 分析查询
5.6.5 Append Streams
5.6.6 Blocking Step 被冻结的步骤
5.6.7 Clone row
5.6.8 Closure Generator 闭包生成器
5.6.9 Data Validator 数据检测
5.6.10 Delay row 延迟行
5.6.11 Identify last row in a stream 标记流中最后一行
5.6.12 Metadata structure of stream 流中元数据结构
5.6.13 Null if 设置为空值
5.6.14 Row Normaliser 行正规化
5.6.15 Split field to rows 分离行
5.6.16 Switch / case
5.6.17 XSD Validator
5.6.18 XSL Transformation
5.6.19 值映射
5.6.20 分组
5.6.21 去除重复记录
5.6.22 增加常量
5.6.23 增加序列
5.6.24 字段选择
5.6.25 拆分字段
5.6.26 排序记录
5.6.27 空操作
5.6.28 行扁平化
5.6.29 行转列
5.6.30 计算器
5.6.31 过滤记录
5.7 连接
5.7.1 Merge Join
5.7.2 Sorted Merge
5.7.3 XML Join
5.7.4 合并记录
5.7.5 记录关联(笛卡尔输出)
5.8 脚本
5.8.1 Modified Java Script Calue
5.8.2 Regex Evaluation
5.8.3 执行 SQL 脚本
5.9 数据仓库
5.9.1 维度更新/查询
5.9.2 联合更新/查
5.10 映射
5.10.1 映射(子转换)
5.10.2 映射输入规范
5.10.3 映射输出规范
5.11 作业
5.11.1 Get Variables 获得变量
5.11.2 Get files from result
5.11.3 Set Variables 设置变量
5.11.4 Set files in result
5.11.5 从结果获取记录
5.11.6 复制记录到结果
5.12 内联
5.12.1 Injector
5.12.2 Socket reader
5.12.3 Socket writer
5.13 实验
5.14 不推荐的
5.14.1 聚合记录
5.15 Bulk loading
5.16 History
6. 任务 Jobs核心对象
6.1 General
6.1.1 Dummy Job
6.2 通用
6.2.1 START
6.2.2 Dummy Job
6.2.3 中断任务
6.2.4 显示消息对话框
6.2.5 任务(Job)
6.2.6 Ping a host
6.2.7 Success
6.2.8 文本输出
6.2.9 Write to Log
6.3 邮件
6.3.1 Write to Log
6.3.2 Mail
6.4 文件管理
6.4.1 向结果中添加文件名
6.4.2 比较文件夹
6.4.3 拷贝文件
6.4.4 拷贝或移动结果文件名
6.4.5 新建文件夹
6.4.6 新建文件
6.4.7 删除文件
6.4.8 从结果集中删除文件名
6.4.9 删除文件
6.4.10 删除文件夹
6.4.11 文件比较
6.4.12 HTTP
6.4.13 Move FIles
6.4.14 文件解压缩
6.4.15 等待文件
6.4.16 文件打包
6.5 条件
6.5.1 检查文件夹是否为空
6.5.2 检查文件是否存在
6.5.3 检查数据库表中的列是否存在
6.5.4 检查文件存在
6.5.5 检查表是否存在
6.5.6 等待
6.6 脚本
6.6.1 Mail
6.6.2 SQL
6.6.3 SHELL
6.7 批量加载
6.7.1 批量从 Mysql 中加载数据至文件
6.7.2 从文件中向 MS SQL Server 数据库中批量加载
6.7.3 从文件中向 Mysql 数据库中批量加载
6.8 XML
6.8.1 Check if XML File is well formed
6.8.2 DTD Validator
6.8.3 XSD Validator
6.8.4 XSL Transformation
6.9 文件传输
6.9.1 FTP
6.9.2 FTP Delete
6.9.3 Put a file with FTP
6.9.4 Put a file with SFTP
6.9.5 SSH2 Get
6.9.6 SSH2 Put
6.9.7 Secure FTP
6.10 资源库
6.10.1 Check if connected to repository
6.10.2 Export repository to XML file
6.11 实验
6.11.1 Evaluate rows number in a table
6.11.2 MS Access Bulk Load
6.11.3 Set variables
6.11.4 Simple evaluation
6.11.5 Truncate tables
6.11.6 Wait for SQL