logo资料库

阿里云大数据ACP题库-修正版.pdf

第1页 / 共203页
第2页 / 共203页
第3页 / 共203页
第4页 / 共203页
第5页 / 共203页
第6页 / 共203页
第7页 / 共203页
第8页 / 共203页
资料共203页,剩余部分请下载后查看
数据同步 1. 24、在 Data IDE 中,当从云数据库 RDS(MySQL)抽取数据时,可配置切分键进行数据分片,提高数据 同步效率,以下关于切分键的说法中正确的有()。(正确答案的数量:2 个)B C a. 可以选择任意字段作为切分键 b. 从云数据库 RDS 导数据到 MaxCompute 配置切分键可以实现并发,提高数据同步速度 c. 推荐使用表的主键作为切分键 d. 配置切分键容易出现数据热点 2. Data IDE 中的数据同步任务只支持全量数据同步。(F) 3. 在 Data IDE 中使用数据同步任务时,可以将某个自定义变量的值写入目标表中,自定义变量采用“变 量名=参数”的格式进行赋值。(T) 4. 在 Data IDE 中配置数据同步任务将云数据库 RDS(MySQL)同步至大数据计算服务(MaxCompute,原 ODPS )中,需要确认在云数据库 RDS 实例的 IP 白名单中是否包含了 Data IDE 的 IP 段,如未包含, 则需要添加。(T) 5. 6. 60、通过阿里云的数据集成服务(Data Integration,原云道 CDP),可以将云数据库 RDS、分布式关 系型数据库 DRDS、分析型数据库(AnalyticDB,原 ADS)中存储的结构化数据同步到大数据计算服务 (MaxCompute,原 ODPS )中去。(T)(本题在多套题中出现,但选择错,可是在在线文档中支持这些 数据类型的导入) 6、Data IDE 的数据通知任务 Task1,将数据从大数据计算服务(MaxCompute,原 ODPS)同 步到云数据库 RDS(MySQL)中,源数据表中存在数据质量问题,加载的时候会有部分出错 纪录,Task1 中已经配置了容错纪录条数,为了保证正确纪录能够保留,在数据加载与控制 中,还需要对 Task1 配置(B)。 a. 源表切分主键 b. 视为脏数据,保留原有数据(insert into) c. 作业速率上限 d. 数据过滤条件 7. 7、在 Data IDE 中,某数据同步任务执行成功,但是发现目标表数据为空。以下说法正确的 有________。(正确答案的数量:2 个)(AD) a. 查看具体运行日志,看日志里具体源表信息,经检查满足抽取条件的数据纪录数为 0 b. 运行任务帐号只有目标表的读权限却没有写权限 c. 查看具体运行日志,看日志里具体源表信息,造成目标表为空的原因是源表不存在 d. 当配置了最大容错条数,即“当出错的纪录数超过”的值,如果源表中满足抽取条数的记录数小于 当前配置的最大容错条数的值,并且所有的纪录全部同步出错,则整个同步任务的状态为执行成功, 目标表数据为空 8. 9. 15、Data IDE 中,配置数据同步任务时,需要先在对应项目空间中配置数据源,即配置源和 目标对应的数据源的信息等。当数据源(B)数据库时,肯定不属于云数据库 RDS 类型。 a. mysql b. oracle c. sqlserver d. postgresql 19、在使用 Data IDE 进行数据同步时,会因为数据质量问题,导致部分记录无法从源表同步 至目标表中去。数据同步任务 Task1 的目标表为云数据库 RDS 中的表,假设数据同步过程中 只会因主键冲突产生错误纪录。以下关于主键冲突配置中说法正确的是(A) a. 当主键冲突配置为“视为脏数据,保留原有数据(insert into)”,则后导入的数据被丢弃, 并被视作脏数据 b. 当主键冲突配置为“替换原有数据(replace into)”时,会使用新数据直接替换原有纪录, 并计入脏数据纪录 c. 无需配置主键冲突处理规则,所有的主键冲突都不会被视为脏数据 d. 无需配置主键冲突处理规则,所有的主键冲突都会被自动视为脏数据 10、在 Data IDE 数据同步任务(云数据库 RDS 数据同步至 MaxCompute)中,需要根据源表 中 的时间戳字段实现数据的增量抽取,用户应该配置(C)选项。 a. 作业速率上限 b. 容错纪录条数 c. 数据过滤条件 d. 源表切分主键
11. 在 Data IDE 中可以使用数据同步任务,将云数据库 RDS(MySQL)数据同步至大数据计算服务 (MaxCompute,原 ODPS)的分区表中,通常会把日期作为目标表的分区键,以方便实现增 量数据加载。现在想把 RDS 中的表 A 中的数据,按照不同的日期导人到 MaxCompute 中表 B 对应的不同分区中(分区字段的格式为 yyyymmdd),如将 20160318 的数据导入到 MaxCompute 表的分区’2016-03-18’中,MaxCompute 的分区可以通过(B)实现。 a. 在 MaxCompute 侧的分区中写入常量值 20160318 即可 b. 在 MaxCompute 侧中使用系统内置参数${bdp.system.bizdate} c. 在 MaxCompute 侧中使用系统内置参数$bizdate d. 在 MaxCompute 侧中使用系统内置参数${bdp.system.cyctime} 12. 23、在使用 Data IDE 进行数据同步时,会因为数据质量问题,导致部分纪录无法从源表同步 至目标表中去。任务 Task1 是从云数据库 RDS(MySQL)表同步至大数据计算服务(MaxCompute, 原 ODPS)表中,可以通过设置以下哪两项进行容错控制?(正确答案的数量:2 个)(AD) a. 设置“当出错的记录数超过”的值,即最大容错纪录条数 b. 设置作业速率上限 c. 设置切分键 d. 设置“错误百分比达到”的值,即最大容错纪录条数占总条数的比例 13. 26、在 Data IDE 数据同步任务中,合理的选择和配置切分键可以提高云数据库 RDS(MySQL) 到大数据计算服务(MaxCompute,原 ODPS)数据同步效率。(T) 14. 在 Data IDE 中使用数据同步任务将云数据库 RDS(MySQL)的用户日志表同步至大数据计算 服务(MaxCompute,原 ODPS)中,其中 RDS 表中的用户访问时间字段为 visit-time(datatime 类型),格式为 YYYY-MM-DD HH:MM: SS,需要将该数据转化并存储在 MaxCompute 对应 string 类型列中,存储的日期格式为 YYYYMMDD,以下做法正确的是(B) a. 在 RDS Mysql 数据同步至 MaxCompute 中,RDS Mysql 侧不支持使用函数 b. 在 数 据 同 步 字 段 配 置 界 面 中 增 加 字 段 ‘DATE-FORMAT(visit_tim , %Y%m%d)’ 并 与 MaxCompute 时间列对应 c. 在 数 据 同 步 字 段 配 置 界 面 中 增 加 字 段 ‘DATE-FORMAT(visit_tim , %Y-%m-%d)’ 并 与 MaxCompute 时间列对应 d. 在 数 据 同 步 字 段 配 置 界 面 中 增 加 字 段 DATE-FORMAT(visit_tim , ‘%Y%m%d’) 并 与 MaxCompute 时间列对应 15. Data IDE 中表 A 的数据是通过按天调度的数据同步任务产生的,表 A 中的分区字段 dt 为 string 类型,填充的是数据产生的日期(格式为“yyyy-mm-dd”),即任务自动调度日期的前一 天,比如 2016 年 4 月 9 日运行调度任务的时候,dt 的值为“2016-04-08”.在配置周期性同步 任务的时候,A 表的 dt 字段需要()才使得任务每次调度运行时自动替换日期。 (C) A. 直接使用系统时间变量${bdp.system.cyctime} B. 引入自定义变量 var,令 var=$[yyyy-mm-dd-1],使用 var 对 dt 进行赋值 C. 直接使用系统时间变量${bdp.system.bizdate} D. 引入自定义变量 var,令 var=$[yyyy-mm-dd],使用 var 对 dt 进行赋值 16. 在 Data IDE 中使用数据同步任务将云数据库 RDS 数据导入大数据计算服务(MaxCompute, 原 ODPS)时,将 MaxCompute 侧数据清理规则配置为导入前保留已有数据,可以有效避免 测试引入脏数据带来的主键冲突问题 (T) 17. 在 Data IDE 中配置数据同步任务,将主键冲突选项配置为“视为脏数据,保留原有数据”时, 数据同步任务进行时,脏数据还是会写入目标表中。 (F) 角色授权 1. Data IDE 中不同角色拥有不同的权限,可以通过角色授权来控制成员的操作权限。角色主要有组织管 理员、项目管理员、开发员、访客等,其中开发角色不具备()权限。(B) a. 新建任务 b. 添加项目成员 c. 上传资源 d. 新建函数
2. 18、Data IDE 中,项目空间 prj1 只能配置一个成员为项目管理员 (F) 3. 16、Data IDE 项目空间的管理员角色拥有项目空间的各种管理权限,以下操作中(BD)必须由拥有项 目管理员角色的成员来完成。(正确答案的数量:2 个)(BD) a. 添加调度资源组 b. 把组织成员添加为项目成员并分配合理的角色 c. 创建 Data IDE 项目空间 d. 添加数据源 4. 17、组织是 Data IDE 的特有概念,组织的基本对象为项目空间,以下说法正确的有(ABC)。(正确答 案的数量:3 个)(ABC) a. 一个帐号可以加入同一个组织的多个项目空间 b. 一个帐号只能加入一个组织 c. 一个组织可以创建多个项目空间 d. 一个项目空间可以属于多个组织 5. 出于业务需要,要把云数据库 RDS 中的某张表的数据同步到大数据计算服务(MaxCompute,原 ODPS) 的某张表中去,希望通过 Data IDE 的同步任务来实现,以下关于实现流程的说法正确的是)(C) A.拥有项目管理员角色的成员先配置 RDS 数据源,然后拥有运维角色的成员创建 MaxCompute 表,再创建、配置数据同步任务 B.拥有开发角色的成员先配置 RDS 数据源,然后创建 MaxCompute 表,再创建、配置数据同 步任务 C. 拥 有 项 目 管 理 员 角 色 的 成 员 先 配 置 RDS 数 据 源 , 然 后 拥 有 开 发 角 色 的 成 员 创 建 MaxCompute 表,再创建、配置数据同步任务 D.拥有开发角色的成员先配置 RDS 数据源,然后拥有运维角色的成员创建 MaxCompute 表, 再创建、配置数据同步任务 6. Data IDE 中组织管理员是指组织的管理者,拥有组织层面的管理权限,以下操作中,(BCD)只能 由组织管理员才能完成(正确答案 3 个)(BCD) A. 添加数据源 B. 添加调度资源组 C. 添加组织成员 D. 创建 Data IDE 项目空间 任务调度 7. Data IDE 中,周期性调度任务的调度规则是:若任务有上游任务则上游任务必须执行成功,且当前时 间点已经等于或超过任务的定时时间,两个条件都满足后当前任务才可以运行;若该任务没有上游任 务,则定时时间满足即可运行。Task2 是按天调度的周期任务,配置定时时间 12:00,依赖属性的上 游任务配置为任务 task1,task1 是按天调度的周期任务,定时时间配置为 0:00,关于 task2 每天调 度情况的说法中正确的是______。(A) a. task1 执行成功后,如果时间没到 12 点,那么等到 12 点 task2 可以运行 b. task1 执行成功 后,task2 会立即运行 c. task1 执行成功后,如果时间超过 12 点,那么 task2 任务已经无法运行 d. task1 任务执行成 功时,时间必须刚好是 12 点 task2 才能运行 8. 在 Data IDE 中配置数据同步任务时,将云数据库 RDS(MySQL)中的数据同步至大数据计算服务 (MaxCompute,原 ODPS )分区表对应的日期分区中,采用数据同步任务周期性的调度向不同分区中 写入数据,把 yyyymmdd 的数据写入对应的 yyyy-mm-dd 分区中,如 20160308 的数据需要写入 MaxCompute 表的’2016-03-08 分区中,MaxCompute 的分区可以通过()实现。(D) a. 在 MaxCompute 侧中使用系统内置参数$bizdate b. 在 MaxCompute 侧中使用变量${datetime},并在节点参数出赋值 datatime=${YYYY/MM/DD} c. 在 MaxCompute 侧的分区中写入常量值 2016-03-18 即可 d. 在 MaxCompute 侧中使用变量${datatime},并在节点参数出赋值 datetime=${YYYY-MM-DD} 9. 在 Data IDE 中,某数据同步任务执行成功,但是发现目标表数据为空。以下说法正确的又()。(正 确答案的数量:2 个)(BD) a. 查看具体运行日志,看日志里具体源表信息,造成目标表为空的原因是源表不存在 b. 查看具体运行日志,看日志里具体源表信息,经检查满足抽取条件的数据记录数为 0 c. 运行任务帐号只有目标表的读权限却没有写权限 d. 当配置了最大容错条数,即“当出错的纪录数超过”的值,如果源表中满足抽取条件的纪录数小于 当前配置的最大容错条数的值,并且所有的纪录全部同步出错,则整个同步任务的状态为执行成功, 目标表数据为空
10. Data IDE 中,事实表 A 需要按天增量更新(配置成任务 task1),事实表 B 需要按天增量更新(配置 成任务 task2),每天事实表 A 中的部分数据信息来自事实表 B 前一天的数据。task1 和 task2 需要如 何配置才能实现上述场景?(C) a. task1 的依赖属性中的上游任务配置为 task2 b. 不需要配置依赖关系,在 task1 中直接使用表 B 生成表 A 即可 c. task1 的跨周期依赖属性设置为“等待自定义任务的上一周期结束”,自定义任务选择 task2 d. task2 的依赖属性中的上游任务配置为 task1 11. Data IDE 中,周期性调度任务是指按配置的时间周期进行自动调度的任务,以下场景中,()不适合 配置成周期性调度任务。(C) a. MaxCompute 中基于商品库存表每隔一小时生成一张库存盘点的汇总表 b. 每隔 5 分钟对 MaxCompute 中的访问日志表进行一次数据清洗 c. 今天市场部经理临时要求分析师基于 MaxCompute 中的用户交易表生成一份昨天有成交纪录的品 牌列表 d. 把云数据库 RDS 中的用户登录记录表每天 0 点 30 分同步到 MaxCompute 表中 13. 34、Data IDE 中,周期性调度任务在配置依赖属性时,上游任务只能是同个项目空间的任务。(F) 14. 35、Data IDE 中,task1 和 task2 都是按天调度的周期性调度任务,task1 设置定时时间为 02:00, task2 设置定时时间为 00:00,task2 依赖属性的上游任务配置为 task1,每天 task2 何时可以运行? (A) a. 只要 task1 执行成功,task2 就马上运行 b. task1 在 2:00 之后才执行成功,则 task2 不再运行 c. task1 执行成功时,时间若已到 2:00,则 task2 可以运行 d. task1 执行成功时,时间没到 2:00,则 task2 不再运行 12. 33、Data IDE 中,调度系统可以根据配置好的任务属性进行自动调度。属性中包含的生效日期是指任 务在有效期内可以进行调度运行,任务 task1 的生效日期为 2016-01-01 至 2016-06-30,以下关于任 务 task1 的说法中正确的有()。(正确答案的数量:2 个)(AD) a. task1 在 2016 年 7 月 1 日当天在调度上无法操作测试 b.task1 在 2016 年 4 月 1 日那天操作补数据时无法补业务日期为 2016 年 1 月 1 日的数据 c. task1 在 2016 年 6 月 30 日当天就不会再自动调度运行 d. task1 如果在 2016 年 1 月 1 日前添加,则 2016 年 1 月 1 日当天才会自动调度运行 15. 36、Data IDE 中,调度任务每次运行前都先将任务实例化,即生成一个实例,调度运行时实际上在执 行相应的实例。任务配置不同的调度周期,自动调度生成的实例个数也就不一样,以下说法正确的是? (正确答案的数量:3 个)(ABD) a. 调度周期配置成按天调度的任务,每天生成一个自动调度实例 b. 调度周期配置成在 00:00 至 23:59 之间按分钟调度,每隔 30 分钟执行一次的任务,每天生成 48 个自动调度实例 c. 调度周期配置为按周调度,每周一调度一次的任务,只有周一才会生成一个自动调度实例,周二 到周日都不会生成实例 d. 调度周期配置成在 00:00 至 23:59 之间按小时调度,每天生成 24 个自行调度实例 16. 37、Data IDE 中,虚拟节点类型是空跑节点,即调度时直接返回成功状态不会真正执行。两个周期调 度任务 task1、task2 之间没有依赖关系,业务上也没有共同上游任务,但是希望可以有一个共同的 父任务进行统筹管理,那么可以创建一个虚拟节点作为 task1 和 task2 的上游任务。(T) 17. 38、Data IDE 中,调度任务每次运行前都先将任务实例化,即生成一个实例,调度运行时实际上在执 行相应的实例。可以通过运维中心的任务运维管理暂停任务自动调度的实例。如果按天调度的周期性 任务 task1 的 2016 年 4 月 9 日自动调度的实例被操作暂停,以下关于 task1 的说法中正确的是___。 (A) a. 仅 2016 年 4 月 9 日的自动调度实例被暂停 b. 2016 年 4 月 8 日的自动调度的实例也会被暂停 c. 所有在 2016 年 4 月 9 日之后生成的自动调度的实例都会被暂停 d. 2016 年 4 月 10 日自动调度的实例也会被暂停 18. 39、Data IDE 中,运维中心的“任务管理视图”以 DAG 图(有向无环图)的方式显示调度任务之间的 依赖关系和运行约束。通过任务管理视图可以查看任务的定义,但不能查看任务的运行状态,以下关 于任务管理视图说法错误的是___________。(C) a. 可以查看任务配置的调度周期粒度 b. 可以查看任务 owner c. 可以查看任务影响的记录条数 d. 可以查看任务描述
批注 [s8]: 考到!!!!! 批注 [K9]: 运行成功状态 未运行状态 运行失败状态 正在运行状态 终止运行手动 等待状态 批注 [K10]: •查看节点运行日志:节点正在运行、成 功、失败等状态时查看任务运行的日志。 •查看节点属性:查看实例属性,包括实例运行的各 种时间信息、运行状态等。 •终止:可以 kill 等待时间、re 等待资源、运行状 态的任务,并将任务置为失败状态。 前置条件:只能终止等待时间、等待资源、运行中状 态的任务。 •重跑并恢复调度:可以重跑某任务,任务执行成功 后可以触发下游未运行状态任务的调度。常用于处理 出错节点和漏跑节点。 前置条件:只能重跑未运行、成功、失败状态的任 务。 •置成功并恢复调度:将当前节点状态改为成功,并 运行下游未运行状态的任务。常用于处理出错节点。 前置条件:只能失败状态的任务能被置成功。 •重跑下游并恢复调度:可以重跑某任务及其下游任 务,需要用户自定义勾选,勾选的任务将被重跑,任 务执行成功后可以触发下游未运行状态任务的调度。 常用于处理数据修复。 前置条件:只能勾选未运行、完成、失败状态的任 务,如果勾选了其他状态的任务,页面会提示“已选 节点中包含不符合运行条件的节点”,并禁止提交运 行。 •暂停:暂停节点当前周期的调度。 19. 40、Data IDE 中,调度任务每次运行前都先将任务实例化,即生成一个实例,调度运行时实际上在执 行相应的实例。在调度的不同阶段,实例会处于不同的状态,包括未运行、运行中、运行成功、运行 失败、等待时间、等待资源等。当实例处于______________状态时不能手工停止。(A) a. 未运行 b. 运行中 c. 等待时间 d. 等待资源 20. 41、Data IDE 中,调度任务每次运行前都先将任务实例化,即生成实例,调度运行时实际上在执行相 应的实例。在调度的不同阶段,实例会处于不同的状态,包括______________。(正确答案的数量:3 个)(BCD) a. 未完成 b. 运行中 c. 未运行 d. 失败 21. 42、Data IDE 中,调度任务每次运行前都先将任务实例化,即生产实例,调度运行时实际上在执行相 应的实例。运维中心的任务运维视图显示的实例是任务自动调度的实例,对这些实例可以进行 _____________。(正确答案的数量:2 个)(BC) a. 补数据 b. 重跑并恢复调度 c. 查看节点运行日志 d. 测试 22. 43、Data IDE 中,调度任务每次运行前都先将任务实例化,即生成实例,调度运行时实际上在执行相 应的实例。按天调度的周期性任务每天生成一个自动调度实例;按 00:00 至 23:59 之间每隔一小时执 行一次的周期性任务,每天生成 24 个自动调度实例。(T) 23. 3、Data IDE 中,调度任务每次运行前都先将任务实例化,即生成一个实例,调度运行时实际上在执 行相应的实例,每个实例带有具体的定时时间。对于按天调度的周期性任务 task1,以下说法下正确 的是_______。(A) a. 每天生成 1 个自动调度实例 b. 使用运维中心补数据时,一天补 10 天的数据,则会生成 10 个自动调度的实例 c. 使用运维中心测试时,会生成一个自动调度的实例 d. 使用运维中心补数据时,会生成一个自动调度的实例 24. 27、Data IDE 的数据同步任务 Task1,将云数据库 RDS(MySQL)的表 Table1 中的数据增量同步至大数 据计算服务(MaxCompute,原 ODPS)的表 Table2 对应的分区中。可以在 MaxCompute 侧配置变量分区 表达式,将对应日期数据写入对应的分区中去。(T) 25. 28、Data IDE 工作流任务支持一次性调度和周期调度两种类型,对于周期性调度可以设置不同时间粒 度的调度周期,以下对任务按月调度的调度周期配置,说法错误的是(C)。 a. 可以配置每月有固定几天需要运行 b. 配置每月 30 日运行,则 2 月份该任务不会运行 c. 无法配置每月 1 日和 15 日运行 d. 无法配置每月最后一天运行 3. 30、资源(Resource)是大数据计算服务(MaxCompute,原 ODPS)的特有概念。用户如果想使用 MaxCompute 的 MapReduce 或自定义函数(UDF)功能,需要依赖资源来完成。Data IDE 中,可以通过数据开发面 板的资源管理上传资源,目前支持的资源类型有(A)。 a. jar、file、archive b. jar、file、python c. jar、archive、python d. file、archive、python 4. 某企业需要一个能够从身份证号中分析得出所属省份的自定义函数,哪种自定义函数适用于这种场景? (B) A. User Defined Splitted Function(用户自定义分组函数) B. User Defined Scalar Function(用户自定义标量函数) C. User Defined Table Valued Function(用户自定义表值函数) D. User Defined Aggregation Function(用户自定义聚组函数)
26. 31、Data IDE 中,通过数据开发面板的任务开发,可以创建节点任务,也可以创建工作流任务,而工 作流任务内部又可以创建工作流节点,关于节点任务和工作流节点的说法中错误的是(A)。 a. 节点任务依赖属性的上游任务可以是工作流任务,也可以是某个工作流节点 b. 节点任务依赖属性的上游任务可以是工作流任务,工作流节点无法单独配置依赖属性 c. 同个工作流的工作流节点之间可以配置依赖关系 d. 节点任务可以配置调度周期,工作流节点不能单独配置调度周期 27. 32、Data IDE 中,周期性调度任务的依赖属性配置决定了任务运行的先后顺序,任务 task1、task2、 task3 都是按天调度的周期性任务,下列关于 3 个任务说法正确的有?(正确答案的数量:2 个)AD a. 若 task1 执行时需要用到 task2 当天生成的最新数据,那么 task1 依赖属性的上游任务应该配置 task2 b. 若 task2 执行时需要用到 task1 当天生成的最新数据,task3 每天需要用到 task2 当天生成的最 新数据,那么 task3 依赖属性的上游任务应该直接配置 task1 c. 若 task2 执行时需要用到 task1 当天生成的最新数据,task3 每天需要用到 task2 当天生成的最 新数据,那么 task3 依赖属性的上游任务必须直接配置 task2 和 task1 d. 若 task2 执行时需要用到 task1 当天生成的最新数据,task3 每天需要用到 task2 当天生成的最 新数据,那么 task3 依赖属性的上游任务直接配置 task2 28. 34、Data IDE 中,调度系统提供了一些常用的时间参数,使周期任务自动调度运行时参数会自动替换 具体的时间值。其中${bdp.system.bizdate}参数值是取任务运行时的定时时间所在的年月日(即业 务日期),按天调度的周期任务配置定时时间为 20:00,2016-01-01 当天自动调度时该参数赋值结果 是 20160101。(F) 29. 35、Data IDE 中,task1 和 task2 都是按天调度的周期性调度任务,task1 生成分区表 table1,task2 生成分区表 table2,每天 task2 取 table1 最新分区的数据进行统计,而 task1 有部分数据来源是 table2 前一天分区的数据。task1 和 task2 的依赖关系需要任何配置?(D) a. 只需要 task2 依赖属性的上游任务配置为 task1 b. task1 和 task2 都不需要配置依赖属性 c. 只需要 task1 依赖属性的上游任务配置为 task2 d. task1 跨周期依赖选择“等待自定义任务的上一周期结束,才能继续运行”,自定义任务填写 task2, task2 依赖属性的上游任务配置为 task1 30. 36、Data IDE 中,任务 task1 是按天调度的周期任务,task1 生成分区表 table1,该表每次执行生成 的分区(分区名 ds)取前一天日期的年月日(格式为 yyyymmdd),要使用调度系统提供的时间参数定 义 table1 的分区,使得 task1 每次调度运行时自动替换时间值,task1 应该如何配置?(正确答案的 数量:2 个)(AC) a. task1 的代码中 table1 的分区 ds=${bdp.system.bizdate} b. task1 的代码中 table1 的分区 ds=${var},task1 的参数配置:var=${yyyymmdd} c. task1 的代码中 table1 的分区 ds=${var},task1 的参数配置:var=${yyyymmdd-1} d. task1 的代码中 table1 的分区 ds=${ bizdate} 31. 37、Data IDE 中,虚拟节点类型是空跑节点,即调度时直接返回成功状态不会真正执行。两个周期调 度任务 task1、task2 之间没有依赖关系,业务上也没有共同上游任务,但是希望可以有一个共同的 父任务进行统筹管理,那么可以创建一个虚拟节点作为 task1 和 task2 的上游任务。(T) 32. 38、Data IDE 中,调度任务每次运行前都先将任务实例化,即生成一个实例,调度运行时实际上在执 行相应的实例。在调度的不同阶段,实例会处于不同的状态,包括未运行、运行中、运行成功、运行 失败、等待时间、等待资源等。当实例处于______状态时可以将任务量为成功并恢复调度。(D) a. 运行中 b. 未运行 c. 等待时间 d. 失败 33. 40、Data IDE 中,通过运维中心的任务运维视图可以对调度任务操作重跑并恢复调度,即重跑该任务 同时把下游未运行的任务恢复调度。任务 task3 依赖任务 task2,任务 task2 依赖任务 task1,对 task2 操作重跑并恢复调度,以下哪个场景会使 task2 和 task3 执行?(D) a. task1 为失败状态,task2、task3 都是未运行状态 b. task1、task2、task3 都是运行成功状态 c. task1、task2、task3 都是未运行状态 d. task1 为成功状态,task2 为失败状态,task3 为未运行状态
34. 41、Data IDE 中,调度任务每次运行前都先将任务实例化,即生成实例,调度运行时实际上在执行相 应的实例。在调度的不同阶段,实例会处于不同的状态,包括________。(正确答案的数量:3 个) (ABC) a. 运行中 b. 失败 c. 未运行 d. 未完成 35. Data IDE 上 某 个 数 据 同 步 任 务 执 行 失 败 , 运 行 日 志 中 提 示 : “Code:[OdpsReader- 33],Description:[分区配置错误.].-分区配置错误,根据您所配置的分区没有匹配到源头表中的分 区 . 源 头 表 所 有 分 区 是 :[ ds=’2010328’ ds=’20160328’.done’ ds=’20160329’ ds=’20160330’ ds=’20160330.done’ ], 您配置的分区是:[ ds=${daytime} ], 请您根据实际情 况作出修改。”(B)会造成类似错误。(注:本题答案不明确,原试题是 B) a. 改任务在运行的时候,分区 ds=${daytime}被删除了 b. 配置任务的源表时,制定分区值时使用了自定义变量${daytime},但在数据同步节点的参数配置 中未给变量 daytime 赋值 c. 该任务配置的源表分区还没有生成,该任务就已经开始运行了。可能的原因是该任务没有配置合 适的依赖关系 d. 配 置 任 务 的 源 表 时 , 指 定 分 区 值 时 应 该 写 成 : ds=’20160328’ ds=’20160328.done’ ds=’20160329’ ds=’20160329.done’ ds=’20160330’ ds=’20160330.done’ 36. Data IDE 中,事实表 A 需要按天增量更新(配置成任务 task1),事实表 B 需要按天增量更新(配置 成任务 task2),每天事实表 A 中的部分数据信息来自事实表 B 前一天的数据。Task1 和 task2 需要如 何配置才能实现上述场景。(D) A. task1 的依赖属性中的上游任务配置为 task2 B. 不需要配置以来关系,在 task1 直接使用表 B 生成表 A 即可 C. task2 的依赖属性中的上游任务配置为 task1 D. task1 的跨周期依赖属性设置为“等待自定义任务的上一周期结束”,自定义任务选择 task2 37. Data IDE 中,通过数据开发面板的脚本开发,可以创建 SQL 脚本文件并直接编辑、执行。关于脚本文 件,以下说法正确的是(B) A. 脚本文件可以自动调度 B. 脚本文件不能发布到目标项目空间 C. 脚本文件可以设置依赖属性 D. 脚本文件不能保存 38. Data IDE 中,项目空间 prj1 的 SQL 任务 task1 中,部分数据来源于项目空间 prj2 的任务 task2 生 成的表 table2,task1 和 task2 都是按天调度的周期性调度任务,task1 每次执行要使用 table2 同周 期生成的数据,为了保证 task1 能正常执行,即每次运行时所需的 table2 数据已经生成,以下 task1 和 task2 配置说法正确的是?(B) A. task1 代码中表 tabke2 的写法为“table2”,task1 依赖属性的上游任务配置为 prj2 中的 task2 B. task1 代码中表 tabke2 的写法为“prj2.table2”,task1 依赖属性的上游任务配置为 prj2 中的 task2 C. task1 代码中表 tabke2 的写法为“prj2.table2”,但是 task1 和 task2 不在同个项目无法配置成依赖关 系 D. task1 代码中表 tabke2 的写法为“table2”,但是 task1 和 task2 不在同个项目无法配置成依赖关系 39. Data IDE 中,task1 和 task2 都是按天调度的周期性调度任务,task1 生成分区表 table1,task2 生 成分区表 table2,每天 task2 取 table1 最新分区的数据进行统计,而 task1 有部分数据来源是 table2 前一天分区的数据。Task1 和 task2 的依赖关系需要如何配置?(C) A. 只需要 task1 依赖属性的上游任务配置为 task2 B. task1 和 task2 都不需要配置依赖属性 C. task1 跨周期依赖选择“等待自定义任务的上一周期结束,才能继续运行”,自定义任务填写 task2, task2 依赖属性的上游任务配置为 task1 D. 只需要 task2 依赖属性的上游任务配置为 task1 40. Data IDE 中,SQL 任务 task1 是按小时调度的周期性调度任务,任务配置为每 1 小时执行一次,结果 会插入到表 table 中去,table1 为一个有两个分区键(ds 和 hh)的分区表,其中 ds 取前一个小时的 年月日(格式为 yyyymmdd),hh 取前一小时的小时(格式为 hh24),要使用调度系统提供的时间参数 定义分区,使得 task1 每次调度运行中自动替换时间值,task1 应该如何配置?(B) 注:本题倾向 D A. task1 代 码 里 table1 的 分 区 ds=${daytime} , hh=${hh} , 任 务 参 数 配 置 : daytime=$[yyyymmdd],hh=$[hh24-1/24] B. task1 代码里 table1 的分区 ds=${bdp.system.bizdate}, hh=${hh},任务参数配置:hh=$[hh24-1/24] C. task1 代码里 table1 的分区 ds=${bdp.system.bizdate}, hh=${hh},任务参数配置:hh=$[hh24] D. task1 代码里 table1 的分区 ds=${daytime},hh=${hh},任务参数配置:daytime=$[yyyymmdd- 1/24],hh=$[hh24-1/24]
41. Data IDE 中,通过运维中心的任务运维视图可以对调度任务操作重跑并恢复调度,即重跑该任务同时 把下游未运行的任务恢复调度,任务 task3 依赖任务 task2,任务 task2 依赖任务 task1,对 task2 操作重跑并恢复调度,以下哪个场景会使 task2 和 task3 执行?(A) A. task1 为成功状态,task2 为失败状态,task3 为未运行状态 B. task1、task2、task3 都是未运行状态 C. task1、task2、task3 都是运行成功状态 D. task1 为失败状态,task2、task3 都是未运行状态 42. Data IDE 中,调度任务每次运行前都先将任务实例化,即生成一个实例,调度运行时实际上在执行相 应的实例。运维中心中的任务运维视图有运维、测试、补数据 3 种类型实例,运维实例是任务日常自 动调度生成的实例,测试实例和补数据实例是通过任务管理视图对任务进行测试和补数据生成的实例。 以下哪种类型任务不会生成自动调度实例?(C) A. 按天调度的周期调度工作流任务 B. 按月调度的周期调度工作流任务 C. 一次性工作流任务 D. 按周调度的周期调度工作流任务 43. Data IDE 中,调度任务每次运行前都先将任务实例化,即生成一个实例,调度运行时实际上在执行相 应的实例。通过运维中心的任务运维视图可以查看任务自动调度的实例。任务 task1 是按天调度的周 期性任务,2016 年 4 月 9 日 11 点 30 分成功提交到调度系统。2016 年 4 月 10 日到任务运维视图查看 task1 的实例时可以查到_____ _。(C) A. task1 业务日期为 2016-04-08 的实例 B. task1 业务日期为 2016-04-10 的实例 C. task1 业务日期为 2016-04-09 的实例 D. 无相关实例 44. Data IDE 中,项目空间 prj1 随着调度任务量的不断增多,经常出现任务调度时长时间处于等待资源 状态。为了对自己负责的周期性任务的调度时间进行规划调整,prj1 的开放角色成员 A 想统计 prj1 每天执行时间最长且任务负责人为自己的 10 个任务,通过__可以快速查到。(B) 注:原答案 A,修改后为 B A. 运维中心的任务管理列表 B. 运维中心的任务运维列表 C. 数据开发面板中的节点属性 D. 项目管理中的血缘分布 45. Data IDE 中,调度任务每次运行前都先将任务实例化,即生成实例,调度运行时实际上在执行相应的 实例。周期性调度任务每天自动调度的实例都是在当天 23:30 开始生成的,以下说法正确的是?(3 个) (ABD) A. 任务 task1 是按天调度的周期性调度任务,2016 年 4 月 9 日 23 点 00 分,把 task1 的定时时间从 原来零点整改成 8 点 30 分,4 月 10 日,task1 的实例定时时间为 8 点 30 分 B. 任务 task1 是任务 task2 的上游任务,2016 年 4 月 9 日 11 点 30 分,把 task2 的上游任务换成 task3,当天 task2 的自动调度实例依赖的还是 task1 的实例 C. 2016 年 4 月 9 日 11 点 30 分新增的按天调度的周期性调度任务,当天可以自动调度运行 D. 2016 年 4 月 9 日 11 点 30 分新增的按天调度的周期性调度任务,4 月 10 日可以自动调度运行 46. Data IDE 中,一次性工作流任务不会被自动调度运行,需要运行时,可以到运维中心对一次性任务操 作测试的方式手法运行,以下关于一次行工作流说法正确的是()(2 个) (AC) A. 一次性工作流创建好后,无法修改成周期调度工作流 B. 一次行工作流测试的时候,业务日期只能选择前一天的日期 C. 周期调度任务的依赖属性的上游任务不能配置为一次性工作流 D. 一次行工作流的依赖属性的上游任务可以配置为周期调度任务
分享到:
收藏