logo资料库

ETL工具Beeload快速入门.pdf

第1页 / 共97页
第2页 / 共97页
第3页 / 共97页
第4页 / 共97页
第5页 / 共97页
第6页 / 共97页
第7页 / 共97页
第8页 / 共97页
资料共97页,剩余部分请下载后查看
Beeload 标准版快速入门 内容涵盖ETL、数据同步、文件同步、邮件通知、工作流、数据分析等常用操作 2018.09 灵蜂纵横 | 北京
1 软件简介 ..................................................................................................................................................................... 2 2 软件安装 ..................................................................................................................................................................... 2 2.1 硬件环境 ............................................................................................................................................................. 2 2.2 软件环境 ............................................................................................................................................................. 2 2.3 下载安装 ............................................................................................................................................................. 2 3 软件使用 ..................................................................................................................................................................... 6 3.1 ETL .......................................................................................................................................................................... 7 3.1.1 数据导入 ..................................................................................................................................................... 7 3.1.2 清洗转换 .................................................................................................................................................. 19 3.1.3 数据导出 .................................................................................................................................................. 35 3.1.4 数据同步 .................................................................................................................................................. 42 3.1.4.1 全量覆盖模式 ................................................................................................................................ 42 3.1.4.2 差异比对模式 ................................................................................................................................ 49 3.1.4.3 时间戳模式 ..................................................................................................................................... 58 3.1.4.4 触发器模式 ..................................................................................................................................... 67 3.2 工作流 ............................................................................................................................................................... 73 3.2.1 协同调度 .................................................................................................................................................. 74 3.2.3 定时调度 .................................................................................................................................................. 81 3.2.4 文件同步 .................................................................................................................................................. 85 3.2.5 邮件通知 .................................................................................................................................................. 88 3.3 数据分析 .......................................................................................................................................................... 91 1
1 软件简介 由北京灵蜂纵横软件有限公司研发的数据整合软件 Beeload, 集数据抽取、清洗、 转换及装载于一体,通过标准化企业各个业务系统产生的数据,向数据分析平台提供 高质量的数据,从而为企业高层基于大数据中心的正确决策分析提供有力保证。 Beeload 除具备常规的 ETL 功能(抽取、清洗、转换及装载)外,另外提供增量数 据同步、文件同步、工作流调度、数据分析、WebService、任务脚本调试等高级功能。 2 软件安装 2.1 硬件环境  Beeload SE 标准配置: CPU Intel(R) Xeon(R) E5405 @ 2.00GHz 内存 8G 硬盘 40G 分辨率 1280*1024 2.2 软件环境 Beeload 可布署于 Windows 和 Linux 系统之上,安装包提供软件运行所需的全 部支持环境,无需额外安装其它软件。 对于 Windows 系列(win7/win8/win10/2008/2012)操作系统,软件提供图形化的 向导安装程序,指导用户轻松完成安装过程。 对于 Linux(Red Hat Enterprise Linux 4)操作系统,只需将软件安装包解压到某 一目录,程序即可正常运行。 2.3 下载安装 登录网站 http://www.livbee.com,进入【下载 】页面,在【灵蜂 数据整合软件 Beeload】栏目下查找【Beeload 标准版】,根据安装环境操作系统位数下载 32 位或 2
64 位 Windows 安装程序。 Beeload 标准版安装程序下载后,双击启动程序,弹出软件安装界面如下图: 点击【下一步】按钮,出现许可协议内容,阅读后选择【我接受此协议】继续安 装过程,选择【下一步】按钮,出现软件注册界面: 3
提示:Beeload 标准版提供授权文件导入安装及分享版安装,授权文件安装针对购买软件授 权用户,由北京灵蜂纵横软件有限公司根据购买用户提交的软件申请单向用户发放授权文件;分 享版无需支付任何费用,用户可直接安装使用软件。 分享版主要针对小规模数据处理场景,单一作业单次全量处理最大记录数 300 万条,增量最 大记录数10 万条,作业重新运行后复位记录数可继续处理数据。分享版最大支持并发作业数为3, 启动作业数多于3 时,后续作业排队等待。 分享版使用期限三个月,到期重新安装软件可继续使用。 点击分享授权按钮 ,弹出接口选择对话框: 提示:本文所有示例以SQL Server、MySQL 及Text 文件作为输入或输出数据接口,建议新 用户安装时选择这三类接口,如下图所示: 选择将要使用的数据接口,点击【确定】按钮,出现软件安装目录界面: 4
提示:建议程序安装到其它磁盘位置,如D 盘或E 盘。 选择【下一步】按钮,出现软件安装进度指示界面,待软件安装结束,出现如下 界面: 选择【完成】按钮关闭安装界面。 5
3 软件使用 提示:本章通过示例讲解 Beeload 常规操作方法,涵盖数据导入、清洗转换、数据导出、数 据同步、文件同步、邮件通知、工作流调度、数据分析等。建议用户在浏览后续内容之前首先安装 数据库测试环境SQL Server(2008/2012)和MySQL(5.6/5.7),然后对照示例在测试环境中完 成以下操作练习。 从 Windows 开始菜单中启动程序【Beeload SE V6.0】,如下图所示: 程序启动后,出现登录对话框如下图: 提示:Beeload 安装后,默认创建两个用户admin 和guest,其密码均为空。 输入正确的用户和密码后,点击【确定】,进入 Beeload SE,如图所示: 6
3.1 ETL 3.1.1 数据导入 选择菜单栏【文件】菜单下的【新建】命令,出现【新建作业】对话框: 在【作业名称】文本框中输入作业名如 etl_test,在【类型】下拉框中选择 ETL 模板, 点击【确定】按钮,打开 ETL 模板设计界面如下图: 鼠标单击【资源箱】中的【扁平文件(源)】 图标,然后移动鼠标到模板某一位置单 击,即可在该位置增加扁平文件(源)接口,对应界面如下: 7
分享到:
收藏