DataWorks 调度配置最佳实战
祎休 MaxCompute 产品运营团队
Agenda
DataWorks :MaxCompute云上数仓开发工具
调度基
本介绍
依赖关系简介
依赖关系实战
调度基本介绍
定义介绍
节点
节点是描述 DataWorks 数据分析和处理过程的基本单元。
比如Shell、ODPS SQL、ODPS MR、PyODPS 等
实例
实例是在前一天23:30的节点快照,统一生成的运行实例。实例会对非天
任务进行拆分,如一小时一次的小时节点将会拆分成具体的24个实例。
调度基本介绍
定义介绍
调度规则
首先满足依赖关系:即上游节点必须完成,才能调度下游节点,其次,判断
定时时间是否已经到了,如果到了,立即执行。如果没有到,等待时间
依赖关系
依赖关系是描述两个或多个节点之间的语义连接关系,其中上游节点的状
态将影响其他下游节点的运行状态,反之则不成立。
调度基本介绍
定义介绍
跨周期依赖
跨周期依赖其实分了跨周期及跨版本两个概念:
跨周期依赖是针对小时任务:即小时任务依赖同一天的上一个周期。
跨版本依赖即跨天依赖:即依赖前一天的任务。
自依赖
自依赖是天然的跨周期跨版本依赖:
针对天任务即依赖昨天的任务。
针对小时任务即依赖上一周期,每天第一个周期依赖昨天最后一个周期。
Agenda
DataWorks :MaxCompute云上数仓开发工具
调度基本介绍
依赖关
系简介
依赖关系配置实战
依赖关系简介
调度属性:冻结
周期实例中的冻结只针对当前实例,且正在运行中的实例,冻结操作无实
际效果,并不会kill掉正在运行的实例。
冻结状态的任务会生成实例,但是不会运行。若需要运行冻结的实例,您
需解冻实例,单击重跑,实例才会开始运行。
依赖关系简介
出错机制
勾选:默认重试3次,每次间隔2分钟。