logo资料库

ETL工具比较分析(Informatica/Datastage/sagent).pdf

第1页 / 共4页
第2页 / 共4页
第3页 / 共4页
第4页 / 共4页
资料共4页,全文预览结束
关键功能点 Informatica Ascential DataStage Sagent Data Flow 1. 平台支持 OS平台(HP-UX/AIX/Solaris/Linux/Windows) 2. 基本功能 数据源(ORA/DB2/DB2AS400/IFX/SYB/IQ/TRD/SQL/TXT/XLS/XML) 支持(支持64位的OS) HP-UX/AIX/Solaris/Windows/Compaq Tru 64 数据目标(同上) 多数据源抽取 外部调用(SHELL,bat,exe,dll) 事务处理支持 脚本支持(自定义函数) 自带函数功能 支持SQL的执行 支持存储过程(检测存储过程是否失败) 支持循环执行 全局变量/局部变量的参数 ETL包的版本管理支持 3. 数据转换 字段映射 字段的拆分 记录的拆分 记录的合并 行列变换 多字段的混合运算 跨异构数据库的关联 代码表的转换 字符集的处理 自动完成时间类型的转换 Union Join 条件转换功能 支持 支持 支持 支持 支持 支持 支持 支持 支持 支持(通过传递参数) 支持 支持 支持 支持 支持 支持 支持 支持 支持 支持 支持 支持 7以上版本支持 支持 支持 提供ORA/DB2/IFX/SYB/SQL/TXT/dBase/ODBC的 驱动,XLS和XML可通过建立ODBC提供支持 同上 支持 支持shell、bat、exe,支持dll需要编程,可以 调用db2 api 产品自身没有事务处理机制,可通过数据库的 事务处理机制间接实现 支持 有 支持 需要DataDirect公司提供的驱动,间接支持; 否则,只能调用,不能检测成功与否;7版本后 有单独的store procedure stage 支持 支持 支持(version control) 支持 支持 支持 支持 支持 支持 支持 支持 支持 支持 支持 支持 支持 支持HP-UX/AIX/Solaris/Windows(支持32bit和64bit OS) 支持(Oracle,DB2,AS400,SQL Server,Informix, Sybase,Red Brick,Altibase等可采用Native Connection直连的方式;上述各种数据库以及其他数据 库[例如:Foxpro,Access,mySQL,Excel等]可采用ODBC的 连接方式;TXT[包括定长文本,分隔符文本和2进制文 本] CSV XML XLS直接读取) 支持(同上) 支持 支持调用,而且能够获得调用程序的返回值 支持。可以通过Automation工作流手工定义事务处理机 制,也可利用数据库的事务处理机制实现。 支持(VBScript和C++两种自定义方式) 支持 支持。(可在Design Studio中执行,也可在Automation 中执行) 支持。(可在Design Studio中执行,也可在Automation 中执行) 支持(内置循环迭代模块) 支持 支持 支持 支持 支持 支持 支持(行列双向变换) 支持 支持(不仅数据库,还包括TXT,XML,Excel等各种数 据) 支持 支持(Unicode) 支持 支持(包括异构数据的Union) 支持(包括异构数据的Join) 支持
复杂的条件过滤 数学函数数据转换功能 自定义转换处理函数 映射过程中可以使用SQL和脚本 内部组件重用性 渐变维处理支持策略 支持 支持 支持 支持 支持 支持 支持 支持 支持 支持 支持(包括对正则表达式的支持) 支持 支持 支持 支持 设计手段和产品组合来支持 支持 数据模型的设计和软件产品组合来支持 4. 数据质量 数据清洗 数据质量保证 数据质量监控 数据质量出错分析 5. 异常处理 ETL例外跟踪与监控 ETL例外捕获与处理 出错分析功能 调试功能 日志功能 故障容错与恢复 6. 高级功能 增量抽取支持策略 数据变化捕获 消息队列 实时数据抽取 7. 调度 任务调度计划 基于时间的调度/基于事件的调度 提供调度的API供运维平台调用 并发任务调度 任务的监控 设计手段和产品组合来支持 有单独的产品(QualityStage) 设计手段和产品组合来支持 有单独的产品(QualityStage) 设计手段和产品组合来支持 有单独的产品(QualityStage) 设计手段和产品组合来支持 有单独的产品(QualityStage) 设计手段和产品组合来支持,同时Group 1也提供单独的 产品(http://www.g1.com/Products/Customer-Data- Quality/)专门做数据质量管理 设计手段和产品组合来支持,同时Group 1也提供单独的 产品(http://www.g1.com/Products/Customer-Data- Quality/)专门做数据质量管理 设计手段和产品组合来支持,同时Group 1也提供单独的 产品(http://www.g1.com/Products/Customer-Data- Quality/)专门做数据质量管理 设计手段和产品组合来支持,同时Group 1也提供单独的 产品(http://www.g1.com/Products/Customer-Data- Quality/)专门做数据质量管理 支持 支持 支持 支持 支持 支持 支持 支持 支持 支持 支持 设计手段和产品组合来支持 支持 设计手段和产品组合来支持 能够捕获表结构的变化 设计手段和产品组合来支持 设计手段和产品组合来支持 DataStage TX产品 有 支持 有 支持 支持(支持数据预览) 支持 有语法检查功能 支持 支持,但不能导出成文本,也不能为外部程序 利用 不支持 支持(支持数据预览) 支持 支持(支持数据预览和运行瓶颈的定位) 支持 设计手段和产品组合来支持 设计手段和产品组合来支持 设计手段和产品组合来支持 设计手段和产品组合来支持 设计手段和产品组合来支持 支持 支持(多种时间和事件) 支持 需要用DataStage TX产品 支持,但对于进程附加任务无法监控 支持 支持(包括ETL任务和其他EXE,BAT等任务的监控和返回 值的获得)
支持,但很多时候信息不准确 支持(包括将错误信息发送Email,在指定的计算机上弹 出窗口,发手机短信等功能) 有 没有,通过写脚本间接支持(7版后有针对不同 数据库的load stage) 支持 支持 支持(Oracle,DB2,Sybase,Informix Red Brick, SQL Server和Altibase等数据库) 支持 支持 设计手段和产品组合来支持 错误信息的捕捉 8. 性能要求 专用数据库驱动 大批量数据转移(调用数据库自身功能,load) 进程并发处理 线程并发处理 负载均衡 对CPU、内存的可管理和分配 稳定性 处理速度 大数据量压力测试 9. 元数据接口 支持 支持 支持 支持 支持 PowerCenter支持 支持 在NT平台上不够稳定 较快 8~10G/小时 元数据是否采用RDBMS储存、OS支持情况 采用RDBMS储存,支持多种OS 较好 较好 较好 支持 支持 支持 元数据库备份/恢复 元数据库的迁移 元数据库是否支持平滑升级 元数据交换,与PowerDesigner/Erwin交换 元数据交换,与OLAP、前端工具的交换 数据仓库表的创建与管理 元数据结构的开放程度 易于使用的元数据API接口 元数据标准支持 10.技术架构 产品软件技术架构(J2EE/.NET/XML/Web Services) 产品的API接口 产品的二次扩展能力 11.实施要求 集中的管理控制台 产品易用性 可管理性(易于管理) 实施的效率(快速开发的能力) 实施的工作量 多用户的ETL开发环境 支持 较好 较快 较好 采用RDBMS存储(如果客户没有RDBMS,Sagent内置提供 mySQL),支持多种OS 支持 支持 支持 当前版本只能通过数据库来交换,计划在7.0版本后直接 支持 支持与Microsoft的元数据交换 支持 开放。元数据存储在RDBMS中,由100多张表构成 支持 基于OMG规范的高级封装 支持 支持 支持 支持(Metadata Exchange) 支持 支持与Essbase的数据交换 (Metadata Exchange) 支持 开放 支持 支持(XML格式导出) 支持 支持 MetaStage不能提供api接口 Web Services 支持 较强 支持 易用 版本管理 较低 较大 支持 有 通过C、VB扩展功能 支持 支持(VBScript和C++两种方式) 有 较好 较好 与其它ETL工具相比,较好 对于任务包是互斥访问 支持 非常易用 易于管理 较好 较好 支持
版本升级是否向下平滑兼容 维护的难度,客户移交的难道 12.产品必须避免的关键技术缺陷 13.产品发展 产品的市场优势 产品的竞争策略 产品的发展目标 14.本产品的其它优点 15.本产品的其它缺点 16.本产品的综合评述与建议 兼容 易维护,易移交 保证NT平台的稳定性 拥有1100多各行业的客户 功能点较多、速度较快 数据集成 支持 与其它ETL工具差不多 支持 易于维护和移交 全球客户超过2000家 易于使用,功能丰富,性价比高 简体中文使用界面,支持内存数据库Altibase 当前版本不支持Linux平台,将于7.0版本后开始支持 7前的版本,不能做到job中模块的拷贝,对于 中文支持有时可能会问题 总的来说,无论功能上还是性能上,DataStage 都还是不错的。MetaStage和QualityStage都是 新产品,功能、性能怎样,还有待考证。TX版 的产品在并行上解决了目前使用的EX版的严重 缺陷,但价格可能较贵。
分享到:
收藏