Informatica 基础开发
主讲人:黄祝康
日期:2014-2-28
Service
1
目录
n 1.客户端简介
n 2.ETL抽取前准备
n 3.ETL任务设计步骤
n 4.简单实例演示
2
Powcenter -组件总体介绍
n 数据抽取组件
1、Source Qualifier:数据源编辑组件
2、文本文件导入
3、XML文件导入
4、JOIN组件:关联组件
n 数据转换组件
1、Normalizer:行转换列组件
2、Expression组件:表达式组件
3、Aggregator组件:聚合组件
4、Filter组件:过滤组件
5、Router组件:路由组件
6、Sorter组件:排序组件
3
3
Powcenter -组件总体介绍
n 数据转换组件
7、Union组件:联合组件
8、Lookup组件:查找组件
9、Stored Procedure组件:调用存储过程组件
10、Sequence Generator组件:生成序列号组件
11、Input/Output组件:输入/输出组件
n 数据装载组件
1、Update Strategy组件:插入/更新/删除/拒绝组
件
4
4
数据抽取组件-Source Qualifier(一)
n 功能:根据查询SQL从关系表或文本文件查出所要记录;
n 特点:
1、每个数据源后面都会带一个Source Qualifier组件;
关系表源
Source
Qualifier组件
文本文件源
Source
Qualifier组件
5
5
数据抽取组件-Source Qualifier(二)
2、连接同构的源数据,可以连接多个表;异构数据源,需要
使用JOIN组件;
Source Qualifier
组件
6
6
数据抽取组件-Source Qualifier(三)
3、定制SELECT语句来读取源数据,去除重复记录、增
加过滤条件、关联条件等;
7
7
数据抽取组件-Source Qualifier(四)
4、可以在执行数据抽取之前(Pre SQL)或者执行数据
抽取(Post SQL)之后对数据进行处理(可以调用
SQL脚本、调用存储过程);
Pre SQL
Post SQL
8
8