学习推荐
华为培训与认证官方网站
http://learning.huawei.com/cn/
华为在线学习
https://ilearningx.huawei.com/portal/#/portal/ebg/26
华为职业认证
http://support.huawei.com/learning/NavigationAction!createNavi?navId=_31&l
ang=zh
查找培训入口
http://support.huawei.com/learning/NavigationAction!createNavi?navId=_traini
ngsearch&lang=zh
更多信息
华为培训APP
版权所有© 2018 华为技术有限公司
HCIA-BigData V2.0 实验手册
华为认证 Big Data 系列教程
HCIA - Big Data V2.0
第 1 页
大数据工程师
实验指导手册
版本:2.0
华为技术有限公司
HCIA-BigData V2.0 实验手册
版权所有 © 华为技术有限公司 2017。 保留一切权利。
第 2 页
非经本公司书面许可,任何单位和个人不得擅自摘抄、复制本文档内容的部分或全部,并不得以任何形式传
播。
商标声明
和其他华为商标均为华为技术有限公司的商标。
本文档提及的其他所有商标或注册商标,由各自的所有人拥有。
注意
您购买的产品、服务或特性等应受华为公司商业合同和条款的约束,本文档中描述的全部或部分产品、服务
或特性可能不在您的购买或使用范围之内。除非合同另有约定,华为公司对本文档内容不做任何明示或暗示
的声明或保证。
由于产品版本升级或其他原因,本文档内容会不定期进行更新。除非另有约定,本文档仅作为使用指导,本
文档中的所有陈述、信息和建议不构成任何明示或暗示的担保。
地址:
网址:
华为技术有限公司
深圳市龙岗区坂田华为总部办公楼 邮编:518129
http://e.huawei.com
HCIA-BigData V2.0 实验手册
第 3 页
前言
简介
本实验手册所有实验均以华为 FusionInsight HD 大数据平台作为实验环境,指导学生完成
HCIA-Big Data 课程所规定的实验任务,旨在使学员掌握 FusionInsight HD 平台大数据重要
组件的使用方法。
内容描述
本实验指导书共包含 8 个实验小节:FusionInsight 客户端安装、HBase 数据库实战、HDFS
文件系统实战、Loader 数据导入导出实战、Flume 数据采集实战、Kafka 消息订阅实战、
Hive 数据仓库实战、集群综合实验等。
实验须知
学员在实验过程中,不得随意删除文件。
学员在对目录、topic、文件进行命名时,均须包含学员账号 stuxx 或 userxx 字样,如目录
stu06_data,表 user01_socker。
学员登录环境所需用户名和密码由讲师统一管理和分配,如有不清楚的,请询问讲师。
参考文档
《FusionInsight HD 产品文档》。
实验环境说明
实验硬件及软件
服务器
CPU
Bit-mode
内存
网卡
硬盘数量
最低配置
Intel 4 核 *2
64 位
48GB
推荐配置
Intel 8 核 *2
64 位
64GB
2 张千兆网卡
2 张千兆网卡
Disk * 7
Disk *7
HCIA-BigData V2.0 实验手册
Disk ≥ 610G
Disk ≥ 610G
推荐 SUSE Linux Enterprise Server 11 SP3(SuSE11.3)
第 4 页
最低配置全 1Gb 口以太网交换机,推荐配置全 10Gb 口以太网交换
机
硬盘大小
操作系统版本
其他硬件:
交换机
实验拓扑
本实验采用 3 个服务器节点,每台服务器配置 2 张网卡,分别用于管理平面和业务平面。
服务器系统盘做 RAID1,数据盘做 RAID5。
学员账号及软件说明
每个学员分配 2 个账号:stu 开头的是 FusionInsight HD 集群账号,可用于登录
FusionInsight Manager 管理界面和组件之间通信进行认证,以及在访问大数据组件时的认
证;user 开头的账号是集群节点 OS 账号,用于登录群节点操作系统,进行组件实验操作。
为方便学员,实验过程中所用到的集群客户端软件和文件放在每个集群节点的
/FusionInsight_Client 目录下,学员在使用的时候可以该目录下获取。
HCIA-BigData V2.0 实验手册
第 5 页
实验过程中所用到的 SSH 工具和文件上传工具放在 ftp://10.175.199.8/下 07 other tool 目录
下,ftp 用户名/密码为 admin1/admin1,学员可自行获取。
1 FusionInsight HD 客户端安装
1.1 实验背景
FusionInsight HD 客户端是用户与集群交互的接口,也是后续实验的基础。安装客户端后,
在集群安全模式部署的情况下,需进行安全认证才可与集群进行交互。
1.2 实验目的
掌握客户端的下载、安装方法。
1.3 实验任务
1.3.1 安装客户端
步骤 1 登录集群节点。
使用 putty 工具,学员账号登录集群节点,例如 192.168.224.45,stu01(具体节点 IP 地址须由
讲师分配)。
HCIA-BigData V2.0 实验手册
第 6 页
复制 FusionInsight HD 客户端到 user01 的 home 目录下,客户端文件在每台集群节点的
/FusionInsight_Client 目录下。
> cd /FusionInsight_Client
> cp FusionInsight_V100R002C60SPC200_Services_ClientConfig.tar /home/user01
步骤 2 解压客户端软件。
> cd /home/user01
> tar –xvf FusionInsight_V100R002C60SPC200_Services_ClientConfig.tar
步骤 3 安装客户端。
进入 FusionInsight_V100R002C60SPC200_Services_ClientConfig 目录,并执行安装命令,将
软件安装在当前用户的 home 目录下“/home/user01/1001_hadoopclient”。
> cd /home/user01/FusionInsight_V100R002C60SPC200_Services_ClientConfig/
>./install.sh /home/user01/hadoopclient
系统提示 Components client installation is complete 表示安装完成。
步骤 4 执行环境变量文件并完成认证。
进入/home/user01/hadoopclient,执行:source bigdata_env 完成环境变量的设置。
进行安全认证:kinit sut01 输入密码 Huawei@123,完成认证。
执行如下命令进行环境变量设置
> source hadoopClient/bigdata_env
> kinit stu01
Password for admin@HADOOP.COM:
注:初始密码 Huawei@123(或咨询授课老师),第一次认证若提示修改,密码统一修改成
Huawei12#$。
HCIA-BigData V2.0 实验手册
步骤 5 测试客户端。
使用 hdfs 命令测试客户端:
> hdfs dfs –ls /
第 7 页
drwxr-x---+ - flume hadoop
0 2017-07-15 00:39 /flume
drwx------+ - hbase supergroup
0 2018-03-31 10:28 /hbase
drwxrwxr-x+ - admin supergroup
0 2018-01-28 15:52 /mapreduceInput
drwxrwxrwx+ - mapred hadoop
0 2017-07-15 00:39 /mr-history
测试成功,标明客户端安装成功!
--结束!
1.4 实验小结
本实验主要讲述 FusionInsight HD 客户端的安装,在安装过程中,客户端软件要解压两次,
需要注意的是指定安装客户端的目录下不能有文件或文件夹,否则安装失败。
2 HDFS 文件系统实战
2.1 实验背景
HDFS 是 Hadoop 大数据平台中的分布式文件系统,为上层应用或其他大数据组件提供数据存
储,如 Hive,Mapreduce,Spark,HBase 等。在 HDFS shell 客户端我们可以实现对分布式
文件系统的操作和管理等。掌握 HDFS 的使用对我们更好的理解和掌握大数据大有裨益。
2.2 实验目的
掌握 HDFS 常用操作。
掌握 HDFS 文件系统管理操作。