中国移动通信集团贵州有限公司
2014 年网络部网管数据集成与共享标准技术服务项目
HBASE 安装部署、参数设置、备份、恢复、
监控规范
普元信息技术股份有限公司
2014 年 10 月
1 / 29
中国移动通信集团贵州有限公司
2014 年网络部网管数据集成与共享标准技术服务项目
目录
1 概述..................................................................................................................................................................3
1.1
1.2
1.3
背景.................................................................................................................................................3
目的.................................................................................................................................................4
范围.................................................................................................................................................4
2 硬件准备..........................................................................................................................................................5
3 实施..................................................................................................................................................................5
3.3
3.4
3.6
3.1
3.2
3.5
软件准备.........................................................................................................................................5
HBASE 服务器规划..........................................................................................................................5
HBASE 安装部署..............................................................................................................................5
HBASE 参数配置..............................................................................................................................9
HBASE 备份恢复............................................................................................................................10
3.5.1 常用的在线备份方案及其比较...................................................................................................10
3.5.2 原理...............................................................................................................................................12
3.5.2.1 Replication 总体结构 ............................................................................................12
3.5.2.2 Replication 工作流程 ............................................................................................13
3.5.2.3 Replication Class 简介 .......................................................................................... 14
3.5.2.4 Replication Zookeeper 上的结构...........................................................................15
3.5.2.5 Replication Failover................................................................................................16
3.5.3 部署...............................................................................................................................................18
3.5.3.1 Master 集群配置文件 ........................................................................................... 18
3.5.3.2
Slave 集群配置文件 ..............................................................................................20
3.5.3.3 Master 集群配置 ................................................................................................... 20
3.5.3.4
Slave 集群配置 .......................................................................................................20
HBASE 监控....................................................................................................................................20
3.6.1 hbase的监控配置说明................................................................................................................21
3.6.2 hadoop基于ganglia的监控框架..............................................................................................21
3.6.3 hbase regionserver中RPC metric的计算采集....................................................................22
3.6.4 hbase中JVM监控数据的计算采集............................................................................................23
3.6.5 hbase中regionserver进程相关metric的计算采集............................................................24
region 的 metric 采集 .............................................................................................25
3.6.5.1
3.6.5.2
blockcache 相关的 metric 采集 ............................................................................. 26
3.6.5.3 读写请求的 metric 采集 ........................................................................................ 26
3.6.5.4
dfs 操作的 metric 采集 .......................................................................................... 27
compact 与 split 的操作数据采集.........................................................................28
3.6.5.5
3.6.5.6
handler 的 metric 采集........................................................................................... 29
2 / 29
中国移动通信集团贵州有限公司
2014 年网络部网管数据集成与共享标准技术服务项目
1 概述
1.1 背景
随着 OSS 域各个系统的建设,系统间数据共享的需求也越来越多。目前,贵州移动的
网管系统在总部规范指导下,按需逐年建设而成的。这些系统实现对通信网络和业务平台的
管理,支撑配置管理、故障监控、指标分析、网络优化、例行维护、指挥调度等工作。但是,
面向网元和网络的分专业网管,难以支持以客户感知为核心、面向端到端业务实现的运维管
理新要求。越来越多的跨系统应用需要同时来自多个生产系统的数据进行支撑,实际生产分
析场景需要将多类型、多专业的性能、质量等数据的进行集中管理,并建立模型关联,准实
时、非实时分析需求并存。
CMOSS2.0 明确提出了数据集成和共享平台的技术架构要求。包括服务总线和数据总线。
数据集成和共享平台作为所有系统的交互桥梁,能够实现全面支持 CMOSS 规范中的所有共享
模式,提升系统稳定性及业务吞吐量;提供基于标准模型的数据共享服务,以解决数据开放
共享问题。建设效果直接影响到中国移动的 IT 业务能力和 IT 功能支撑能力。
根据集团 CMOSS2.0 技术规范的要求,结合贵州移动在网管领域对数据共享的具体需求。
贵州移动规划建立网络数据共享平台,通过对生产系统数据准实时的采集,将数据汇总到数
据共享平台上。利用目前业界最新的数据分析和处理技术,按照不同的业务视角利用采集到
数据,为企业运营提供技术决策依据。同时,由于统计分析使用的数据和生产运营的数据分
离,可以较少对正式系统的影响,从而保障生产系统运营更加稳定、可靠。
由于数据来自各个专业系统,需要面对不同的厂商、不同的技术架构。在数据共享平
台的建设过程中,存在数据标准化、服务标准化、大数据处理等问题。这些问题是数据集成
和共享平台建设成功的关键,需要重点解决。
1) 对现有网管数据从生产到消费的全流程梳理,形成网管数据血缘关系和数据地图,以作
为网管数据统一建模、集成共享的基础;
2) 根据数据地图,建立可扩展的、面向底层数据源和上层应用灵活适配的网管数据模型,
作为数据共享中心模型标准。
3) 研究海量数据共享技术和模式,对数据库共享、数据编排、服务共享等数据共享技术和
3 / 29
中国移动通信集团贵州有限公司
2014 年网络部网管数据集成与共享标准技术服务项目
模式进行评估,制定符合网络数据中心的共享技术标准。
4)
Hadoop 是当前大数据处理常用的技术,但 Hadoop NoSQL 和多接点的特点,为应用开发
和平台维护带来一定的难道。通过技术服务,对 Hadoop 应用开发提供参考标准和技术支持,
研究并制定 Hadoop 平台的维护标准。
1.2 目的
1) 形成对网管数据地图与数据模型标准的梳理,作为在建数据共享中心的规范与指导;
2) 研究海量数据的处理与分析技术、模式,为后续进一步建立针对大数据的数据共享中心
提供可行方案与指导。
为了达到上述目标,本项目分解为四个子项目,各子项目工作内容如下:
1)网络数据地图研究子项目
对现有网管数据从生产到消费的全流程梳理,形成网管数据血缘关系和数据地图,
以作为网管数据统一建模、集成共享的基础;
2) 网络数据共享模型标准研究子项目
根据数据地图,建立可扩展的、面向底层数据源和上层应用灵活适配的网管数据模
型,作为数据共享中心模型标准。
3) 网络数据共享技术标准子项目
研究海量数据共享技术和模式,对数据库共享、数据编排、服务共享等数据共享技
术和模式进行评估,制定符合网络数据中心的共享技术标准。
4) 网络数据共享平台维护标准子项目
数据共享平台采用 Hadoop 架构,多种技术共存,方案相对复杂,NoSQL 和多节点
的特点,为应用开发和平台维护带来一定的难道。通过技术服务,对应用开发提供
参考标准和技术支持,研究并制定平台的维护标准。
1.3 范围
该文档是用于指导贵州移动网络共享平台 HBASE 安装部署、参数设置、备份、恢复、监
控的规范。
4 / 29
中国移动通信集团贵州有限公司
2014 年网络部网管数据集成与共享标准技术服务项目
2 硬件准备
设备用途
操作
系统
设备
数量
设备
数量
主机名
IP
说明
2
14
CXNDSP_HDP_01
CXNDSP_HDP_02
CXNDSP_HDP_03
CXNDSP_HDP_04
………...
CXNDSP_HDP_16
控制服务器
数据节点
Hadoop 服
务器
Centos6.2
Centos6.2
16
3 实施
3.1 软件准备
HADOOP 软件已经正确安装完成。
3.2
HBASE 服务器规划
Hadoop 版本:hadoop-1.2.1
Hbase 版本:hbase-0.94.19
zookeeper 版本:hbase 自带
主机名
HADOOP 功能
Hbase 功能 zookeeper 功能
CXNDSP-HDP-01
Master/NameNode
Master
HQuorumPeer
CXNDSP-HDP-02
Slave/DataNode
DataNode
HRegionServer
CXNDSP-HDP-03
Slave/DataNode
DataNode
HQuorumPeer/HRegionServer
CXNDSP-HDP-04
Slave/DataNode
DataNode
HQuorumPeer/HRegionServer
CXNDSP-HDP-05
Slave/DataNode
DataNode
HQuorumPeer/HRegionServer
…
…
…
…
CXNDSP-HDP-15
Slave/DataNode
DataNode
HQuorumPeer/HRegionServer
CXNDSP-HDP-16
Slave/DataNode
DataNode
HQuorumPeer/HRegionServer
3.3 HBASE 安装部署
1、 hbase 软件下载
官网:http://www.apache.org/dyn/closer.cgi/hbase/
下载当前稳定版“hbase-0.94.19.tar.gz”
2、 下载后解压到 HADOOP 系统用户下:/opt/cloud/ hbase-0.94.19
5 / 29
中国移动通信集团贵州有限公司
2014 年网络部网管数据集成与共享标准技术服务项目
3、 配置
文件 1: hbase-env.sh
主要修改:
a)
JAVA 环境配置
export JAVA_HOME=/usr/java/jdk1.6.0_45/
b) HBASE_CLASSPAT, 利于 Hbase 与 Hadoop 关联
export HBASE_CLASSPATH=/opt/cloud/hadoop-1.2.1/conf
c) 设置使用 Hbase 自带 ZOOKEEPER
export HBASE_MANAGES_ZK=true
d) 参考: hbase-env.sh
配置文件 2: hbase-site.sh
a) hbase.rootdir
这个目录是 region server 的共享目录,用来持久化 HBase
需要先创建该目录:hadoop fs -mkdir hdfs://CXNDSP-HDP-01:9000/hbase
b) distributed 是指定开启集群分布式,true 为开启
c) master 是指定 master 的机子和端口
d) quorum 是指定放 zookeeper 机子,被指定的机器上会运行 HQuorumPeer 进程
e) dataDir 是指定临时目录,建议为${hadoop.tmp.dir}/hbase
f)
参考: hbase-site.xml
hbase参数.htm
配置文件 3:
regionservers
a) HregionServer 节点,配置为 hadoop 的 datanode 节点即可
4、 驱动包
因为 Hbase 与 Hadoop 有版本支持对应关系,所以要将 Hadoop 根目录下的驱动包
放到 Hbase 的 lib 目录,同时删除 Hbase 的 lib 下的旧版本的 hadoop-core-***包:
将
6 / 29
中国移动通信集团贵州有限公司
2014 年网络部网管数据集成与共享标准技术服务项目
覆盖到
5、 安装到其他节点
将当前配置好的 Hbase 同步到其他节点机:
scp -r /opt/cloud/hbase-0.94.19/ hadoop@CXNDSP-HDP-02:/opt/cloud/
scp -r /opt/cloud/hbase-0.94.19/ hadoop@CXNDSP-HDP-03:/opt/cloud/
scp -r /opt/cloud/hbase-0.94.19/ hadoop@CXNDSP-HDP-04:/opt/cloud/
……
……
scp -r /opt/cloud/hbase-0.94.19/ hadoop@CXNDSP-HDP-15:/opt/cloud/
scp -r /opt/cloud/hbase-0.94.19/ hadoop@CXNDSP-HDP-16:/opt/cloud/
6、 启动 HBASE:
Bin/Start-hbase.sh
启动完成后 JPS 查看进程:
7 / 29
中国移动通信集团贵州有限公司
2014 年网络部网管数据集成与共享标准技术服务项目
也可网页浏览:
http://172.17.1.1:60010/master-status
7、 进入:Hbase shell ,安装成功
8 / 29