logo资料库

阿里云大数据专业认证(ACP级)-样题-0209.pdf

第1页 / 共3页
第2页 / 共3页
第3页 / 共3页
资料共3页,全文预览结束
阿里云培训与认证 阿里云大数据专业认证(ACP 级)-考试样题 阿里云大数据专业认证(ACP 级)考试样题 一. 单选题 1. 阿里云大数据计算服务(MaxCompute,原 ODPS)是阿里巴巴自主研发的海量 数据处理平台,主要服务于批量结构化数据的存储和计算。以下哪个场景不适合使 用大数据计算服务实现? a) 在线交易系统 b) 数据仓库 c) 大数据的分析建模 d) 网站日志离线分析 2. 3. 阿里云大数据计算服务(MaxCompute,原 ODPS)中的表 event 是分区表,分 区键是 dt (类型为 string),每天生成一个分区,现在表中有 dt='20160101' 至 dt='20160531' 共 5 个月的数据,为了统计 3 月份 eventid 非空的数据量,开发 人员运行了以下语句: select count(*) from event where substr(dt,1,6)='201603' and eventid is not null; 对此任务的描述正确的是 ________。 a) 此任务需要读 event 表中所有分区中的数据 b) 此任务只需要读 event 表中 dt='20160301' 至 dt='20160331'共 31 个分区中 的数据 c) 此任务会读 event 表中所有分区中 eventid 非空的数据 d) 此任务只需要读 event 表中 dt='20160301' 至 dt='20160331'共 31 个分区中 eventid 非空的数据 某信贷公司推出一款线上贷产品,采用阿里云的数据处理技术,通过对会员的历史 数据进行分析,包括交易量、网上信用评价、企业自身经营状况等等,每天处理的 数据量在 20P 左右,基于这些数据对用户信用进行聚类分析建模并产生预测数 据,用户线上申请贷款时,能在 1 秒钟内根据用户模型预测结果得到该用户的资质 评估、授信等信息。请根据您对阿里云产品的理解判断,下述方案中成本最低、性 能最好的一个是________。 a) 使用阿里云大数据计算服务(MaxCompute,原 ODPS)对数据进行建模,然 后使用该模型对所有符合贷款条件的会员进行资质评估和授信评估,将处理结 果保存在 MaxCompute 中 b) 使用阿里云大数据计算服务(MaxCompute,原 ODPS)对数据进行建模,然 后使用该模型对所有符合贷款条件的会员进行资质评估和授信评估,将处理结 果保存在阿里云表格存储(Table Store,原 OTS)中,以供实现快速查询 c) 使用阿里云分析型数据库(Analytic DB,原 ADS)对数据进行建模,然后使用 该模型对所有符合贷款条件的会员进行资质评估和授信评估,将处理结果保存 在 Analytic DB 中 1
4. 阿里云培训与认证 阿里云大数据专业认证(ACP 级)-考试样题 d) 使用阿里云分析型数据库(Analytic DB,原 ADS)对数据进行建模,然后使用 该模型对所有符合贷款条件的会员进行资质评估和授信评估,将处理结果保存 在阿里云表格存储(Table Store,原 OTS)中 某企业选择了使用阿里云大数据计算服务(MaxCompute,原 ODPS)进行数据 仓库建设,由一个多人的团队负责实施和运维。为了更好的进行角色分工、数据权 限、多用户协同等管理工作,同时还能实现任务的自动调度、任务监控、错误告警 及处理等运维工作,并且需要有一个简单易用的开发环境,以下方案中________是 最便捷、最高效的。 a) 用 MaxCompute 的 console 客户端作为主要开发工具 b) 使用 Maxcompute 提供的 SDK 自己开发一个客户端工具 c) 使用 Data IDE 作为开发工具 d) 使用 MaxCompute 的管理控制台 二. 多选题 1. DataX 是阿里集团发起的开源项目,是一种离线数据同步的工具,支持多种异构 数据源之间的高效的数据同步。DataX 支持的数据源包括________。(正确答案的 数量:3 个) 2. 3. a) 关系型数据库:Mysql、SQLserver、Oracle b) 阿里云大数据分析处理 MaxCompute(原 ODPS)、Hbase、阿里云分析型数 据库(Analytic DB,原 ADS) c) 半结构化数据存储:阿里云表格存储(Table Store,原 OTS) d) 非结构化数据存储:图片、视频 阿里云大数据计算服务(MaxCompute,原 ODPS)中的 MapReduce 是一种编 程模型,用于大规模数据集的并行运算,它极大地方便了编程人员在不会分布式并 行编程的情况下,将自己的程序运行在分布式系统上。其中,两个主要阶段 Map 和 Reduce 相互配合,可以完成对海量数据的处理。关于这两个阶段的关系,说 法正确的有________。(正确答案的数量:3 个) a) 一个 map 的输出结果可能会被分配到多个 reduce 上去 b) 一个 reduce 的输入数据可能来自于多个 map 的输出 c) 一个 MR 处理可以不包括任何 map d) 一个 MR 处理可以不包含任何 reduce 阿里云大数据计算服务(MaxCompute,原 ODPS)中,在做 web 日志分析时如 果发现日志内容(对应字段 log_content)中有 'select' 字符串,则有可能是恶意 的 sql 注入攻击,为了从日志表 log 中找出所有符合这种特征的访问,可以使用以 下哪些方式?(正确答案的数量:3 个) a) b) select * from log where instr(tolower(log_content),'select')>0; select * from log where regexp_instr(tolower(log_content),'select',1)>0; 2
阿里云培训与认证 阿里云大数据专业认证(ACP 级)-考试样题 select * from log where 'select' in tolower(log_content); select * from log where tolower(log_content) like '%select%'; c) d) 三. 判断题 1. 2. 3. 在阿里云大数据计算服务(MaxCompute,原 ODPS)中,当一个用户被移除出 项目空间(project)后,与该用户有关的 ACL 授权仍然会被保留。一旦该用户以 后被再添加到该项目空间时, 该用户的历史的 ACL 授权访问权限将被重新激活。 在为企业的 IT 系统做架构设计时,成本是一个很重要的考虑因素。对于分析型数 据库(Analytic DB,原 ADS)和大数据计算服务(MaxCompute,原 ODPS), 前者使用了 SSD 盘存储数据,价格比较贵,因此在两个产品都能实现的场景下, 优先选择大数据计算服务,会降低用户的整体使用成本。 Data IDE 中,调度任务每次运行前都先将任务实例化,即生成实例,调度运行时 实际上在执行相应的实例。按天调度的周期性任务每天生成一个自动调度实例;按 00:00 至 23:59 之间每隔一小时执行一次的周期性任务,每天生成 24 个自动调 度实例。 3
分享到:
收藏