一、简介(CDH)
1.CDH 是什么
CDH是Apache Hadoop和相关项目最完整、最受测试和最受欢迎的发行版。CDH提供了Hado
2.CDH 优点是什么
灵活性:可以存储任何类型的数据,并使用各种不同的计算框架对其进行操作,包括批处理、交互式SQL、自由
整合:集成在一个完整的Hadoop平台上快速启动和运行,该平台与广泛的硬件和软件解决方案一起工作。
安全:过程控制敏感数据。
可扩展性:使应用程序和扩展范围更广,并扩展它们以满足您的需求。
高可用性:信任并执行关键业务任务。
兼容性:可以利用现有的IT基础架构和资源。
3.CDH组件有哪些
Apache Avro、Apache Crunch、Apache Flume、Apache Hado
二、版本环境(CDH)
1.TLS版本支持
CDH和Cloudera Manager支持的传输层安全版本
Cloudera Manager Server 存储需求
基于主机的Cloudera Manager服务器要求
带有 HDFS, YARN, or Impala 的集群
Flume
HDFS
Hbase
Hive
Hive on Spark 执行节点
Spark
YARN
ZooKeeper
Oozie
Impala
根据使用IMPALA的工作量大小和类型,IMPALA的尺寸要求可能会有很大的不同。
对于多机架集群的网络拓扑结构,建议使用
Kafka
kafka需要相当少量的资源,特别是在一些配置调整中。默认情况下,Kafka可以在1核和1GB内存上
CPU很少成为瓶颈,因为Kafka的I/O很重,但是具有足够线程的中等大小的CPU对于处理并发连接和
Kafka代理往往具有与HDFS数据节点类似的硬件配置文件。如何构建它们取决于什么对您的Kafka用
Kafka节点的常见选择如下:
名称
内存/Java Heap
CPU
磁盘
Broker
RAM: 64 GB推荐Java heap: 4 GB使用Broker Kafka配置属性的Java
12- 24 核
操作系统用1个硬盘
Zookeeper dataLogDir 用一个硬盘
存储kafka 用10- HDDs, 使用 Raid 10
MirrorMaker
1 GB heap使用MirrorMaker Kafka配置属性的Java堆大小设置此值。
1核3~4 streams
MirrorMaker实例上不需要磁盘空间。目标代理应该有足够的磁盘空间来存储要复制的主题。
2.软件依赖
iproute 版本
Cloudera Enterprise 6.1.x 支持的操作系统
数据库对应版本
JAVA JDK版本
三、环境准备(CDH)
1.安装前准备
JDK1.8(Oracle版本RPM安装)
Cloudera Manager 6.2.0
Linux 系统三台以上(centos 7X 以上 16G以上两台、32G以上一台)
Linux 镜像(必须与系统版本对应)
MYSQL 5.7
Python 2.7
CDH 6.2.0
2.安装顺序
关闭seLinux (所有机器)
关闭防火墙 (所有机器)
设置hostname (所有机器)
设置hosts (所有机器)
配置免密登录 (所有机器)
配置文件yum源 (一台主节点)
通过yum源安装httpd 、ntp 、gcc 、python (httpd 主节点,其他全部)
通过httpd 重新配置yum 源仓库
安装jdk (Oracle版本RPM安装)(所有机器)
安装MYSQL 并配置 (一台主节点)
通过yum 源方式安装 cloudera-scm-server
通过cm web端安装cloudera-scm-agent
配置具体服务角色
四、安装服务(CDH)
1.关闭seLinux (所有机器)
2. 关闭防火墙 (所有机器)
3.设置hostname (所有机器)
4.修改hosts (所有机器)
5.配置免密登录 (所有机器)
6.配置文件yum源 (一台主节点)
7.安装httpd
8.重新配置yum源
9.安装gcc 、python、ntp (所有机器)
10.安装jdk(oracle 版本rpm安装,所有机器)
11.安装mysql (任意一台节点)
12.通过yum 安装cloudera-scm-server
13.登录页面配置
14.系统文件存储结构
与服务相关联目录
Hdfs相关配置
集群相关配置信息(JSON格式)
配置生成方式
配置修改
数据库
CM结构
升级
卸载
开启数据库远程访问
15.硬件选择
工作负载
CDH硬件推荐
CPU、内存、磁盘IO、YARN监控
16.角色及节点分配
测试/开发集群(小于 10 台)
小规模集群(10-20 台)
中等规模集群(20-200 台)
大规模集群(200 台以上)
节点分配
五、Data-web安装
1.安装前准备
2.安装服务
3.测试是否安装成功
六、CDH与datax-web使用和注意事项