Hadoop 集群安装手册
安装前准备
下载路径:
https://pan.baidu.com/s/1RKd29ijCK1v5razYQg0jpg
密码: s3hx
此次安装基于 linux 系统,需要三台虚拟机,内 1G,硬盘大小 20G,三台机器可以互相通
信。
jdk 版本:jdk1.8.0_171
hadoop 版本:hadoop-2.7.3
安装步骤
安装 JDK 上版本
Jdk 的版本需要选择 1.7.0 及以上版本,本次安装选择 jdk 1.8.0 版本,安装步骤如下:
1. 将文件拷贝到需要安装的机器上
2. 解压安装包(如上图的 jdk1.8.0_171 文件夹)
tar -xvf jdk-8u171-linux-x64.tar.gz
3. 配置环境变量
3.1 切换到 root 用户
su root
3.2 打开文件/etc/profile 并配置环境变量
vi /etc/profile
4. 重启虚拟机
reboot
5. 检查是否安装成功
配置 SSH 免密
•
•
•
•
•
修改.ssh 目录权限
chmod 755 ~/.ssh
生成秘钥文件
把公钥加到认证公钥文件中
修改 authorized_keys 的权限
chmod 644 authorized_keys
验证 ssh 是否安装成功
Hadoop 文件系统安装
1. 将 hadoop 安装包拷贝到机器上并解压
2.配置 hadoop 参数(红色标注为修改部分)
2.1 hadoop-env.sh
2.2 core-site.xml
2.3 hdfs-site.xml
2.4 mapred-site.xml
2.5 mapred-site.xml
2.6 slaves
以上的 JDK 安装,ssh 免密配置和 hadoop 文件系统安装在三台机
器上安装步骤一致(只要在 master 机器安装后,把装个环境 scp 到
其他的 slave 环境),接下来按照 master 和 segment 分开安装
Master 安装配置
设置机器 hostname
•
1.1 修改/etc/hosts
1.2 修改/etc/sysconf/network
1.3 修改 hostname
1.4 重启系统
•
设置免密
然后再执行下面的命令
master@master$ ssh-add
slave 安装配置
1. 设置机器 hostname
1.1 修改/etc/hosts
1.2 修改/etc/sysconf/network
1.3 修改 hostname
1.4 重启系统
启动 Hadoop
1. Master 和 slave 都配置完成后,在 master 机器上执行以下命令(slave 机器不用启动)
2. 查看启动情况
2.1 hadoop dfsadmin -report 命令查看(master 机器)
2.2 jps 查看 master(master 机器)和 slave 启动情况(slave 机器)