监控方案
目录
目录..........................................................................................................................................................I
1. ZABBIX 监控工具....................................................................................................................1
1.1. ZABBIX 简介......................................................................................................................... 1
1.2. ZABBIX 主要功能.................................................................................................................1
1.3. ZABBIX 监控原理.................................................................................................................3
1.4. ZABBIX 运行条件................................................................................................................3
1.5. ZABBIX 监控类型.................................................................................................................4
2. NAGIOS 监控工具.................................................................................................................. 4
2.1. NAGIOS 的简介..................................................................................................................... 4
2.2. NAGIOS 主要功能................................................................................................................5
2.3. NAGIOS 监控原理................................................................................................................6
2.4. NAGIOS 运行条件和原理图............................................................................................ 7
3. CACTI 监控工具....................................................................................................................... 8
3.1. CACTI 简介............................................................................................................................ 8
3.2. CACTI 主要功能...................................................................................................................8
3.3. CACTI 工作原理...................................................................................................................9
3.4. CACTI 组件功能和工作流程图....................................................................................10
3.5. CACTI 应用场景.................................................................................................................11
4. ZABBIX,NAGIOS,CACTI 监控的优缺点............................................................12
1.zabbix 监控工具
1.1. Zabbix 简介
Zabbix 是一个高度集成的网络监控解决方案,可以提供企业级的开源分布式
监控解决方案,由一个国外的团队持续维护更新,软件可以自由下载使用,运作
团队靠提供收费的技术支持赢利。
zabbix 是一个基于 Web 界面的,提供分布式系统监控以及网络监视功能的企
业级的开源解决方案。
zabbix 能监视各种网络参数,保证服务器系统的安全运营,并提供灵活的通
知机制以让系统管理员快速定位/解决存在的各种问题。
zabbix 主要由 2 部分构成 zabbix server 和 zabbix agent,可选组建 zabbix
proxy。
zabbix server 可以通过 SNMP,zabbix agent,fping 端口监视等方法对远
程服务器或网络状态完成监视,数据收集等功能。同时支持 Linux 以及 Unix 平
台,Windows 平台只能安装客户端。
1.2. Zabbix 主要功能
①具备常见的商业监控软件所具备的功能(主机的性能监控、网络设备性能监控、
数据库、性能监控、FTP 等通用协议监控、多种告警方式、详细的报表图表绘
制)
②支持自动发现网络设备和服务器(可以通过配置自动发现服务器规则来实现)
1
③支持自动发现(low discovery)key 实现动态监控项的批量监控(需写脚本)
④支持分布式,能集中展示、管理分布式的监控点
⑤扩展性强,server 提供通用接口(api 功能),可以自己开发完善各类监控(根
据相关接口编写程序实现)编写插件容易,可以自定义监控项,报警级别的设置。
⑥数据收集
可用和性能检测
支持 snmp(包括 trapping and polling),IPMI,JMX,SSH,TELNET
自定义的检测
自定义收集数据的频率
服务器/代理和客户端模式
灵活的触发器
可以定义非常灵活的问题阈值,称为触发器,从后端数据库的参考值
高可定制的报警
发送通知,可定制的报警升级,收件人,媒体类型
通知可以使用宏变量有用的变量
自动操作包括远程命令
实时的绘图功能
监控项实时的将数据绘制在图形上面
WEB 监控能力
ZABBIX 可以模拟鼠标点击了一个网站,并检查返回值和响应时间
Api 功能
应用 api 功能,可以方便的和其他系统结合,包括手机客户端的使用。
2
1.3. Zabbix 监控原理
Zabbix 通过 C/S 模式采集数据,通过 B/S 模式在 web 端展示和配置。
被监控端:主机通过安装 agent 方式采集数据,网络设备通过 SNMP 方式采
集数据
Server 端:通过收集 SNMP 和 agent 发送的数据,写入数据库(MySQL,
ORACLE 等),再通过 php+apache 在 web 前端展示。
1.4. Zabbix 运行条件
Server:Zabbix Server 需运行在 LAMP(Linux+Apache+Mysql+PHP)环
境下(或者 LNMP),对硬件要求低
Agent:目前已有的 agent 基本支持市面常见的 OS,包含 Linux、HPUX、Solaris、
Sun、 windows
SNMP:支持各类常见的网络设备
SNMP(Simple Network Management Protocol,简单网络管理协议
Zabbix 监控过程逻辑图
3
1.5. Zabbix 监控类型
硬件监控 适用于物理机、远程管理卡(iDRAC),IPMI(只能平台管理接口)
ipmitools:,MegaCli(查看 Raid 磁盘)
系统监控: 监控 cpt:lscpu、uptime、top、vmstat 1 、mpstat 1、htop
监控内存: free -m、
**监控硬盘:**df -h、iotop
**监控网络:**iftop、netstat、ss
**应用服务监控:**nfs、MySQL、nginx、apache、php、rsync
2.Nagios 监控工具
2.1. nagios 的简介
Nagios 是一款开源的电脑系统和网络监视工具,能有效监控 Windows、Linux
4
和 Unix 的主机状态,在系统或服务状态异常时发出邮件或短信报警第一时间通
知网站运维人员,在状态恢复后发出正常的邮件或短信通知。
2.2. Nagios 主要功能
1、监控网络服务(SMTP、POP3、HTTP、NNTP、PING 等);
2、监控主机资源(处理器负荷、磁盘利用率等);
3、简单地插件设计使得用户可以方便地扩展自己服务的检测方法;
4、并行服务检查机制;
5、具备定义网络分层结构的能力,用"parent"主机定义来表达网络主机
间的关系,这种关系可被用来发现和明晰主机宕机或不可达状态;
6、当服务或主机问题产生与解决时将告警发送给联系人(通过 EMail、
短信、用户定义方式);
7、具备定义事件句柄功能,它可以在主机或服务的事件发生时获取更多
问题定位;
8、自动的日志回滚;
9、可以支持并实现对主机的冗余监控;
10、可选的 WEB 界面用于查看当前的网络状态、通知和故障历史、日志
文件等;
5
2.3. Nagios 监控原理
Nagios 的功能是监控服务和主机,但是他自身并不包括这部分功能,所有的
监控、检测功能都是通过各种插件来完成的。
1) 启动 Nagios 后,它会周期性的自动调用插件去检测服务器状态,同时 Nagios
会维持一个队列, Nagios 执行安装在它里面的 check_nrpe 插件,并告诉
check_nrpe 去检测哪些服务;
2) 通过 SSL,check_ nrpe 连接远端机子上的 NRPE daemon;
3) NRPE 运 行 本 地 的 各 种 插 件 去 检 测 本 地 的 服 务 和 状 态 ( check_disk ,
check_load 等) ,利用这些插件可以方便的监控很多服务状态,check_disk 是
检查磁盘空间的插件,check_load 是检查 CPU 负载的,等等。每一个插件可以
通过运行./check_xxx –h 来查看其使用方法和功能;
4) 最后,NRPE 把检测的结果传给主机端的 check_nrpe,check_nrpe 再把结
果送到 Nagios 状态队列中,所有插件返回来的状态信息都进入队列;
5) Nagios 每次都从队首开始读取信息,并进行处理后,把状态结果通过 web
显示出来。
Nagios 可 以识 别 4 种 状态 返回 信息 , 即 0(OK) 表 示状 态正 常/绿 色、
1(WARNING)表示出现警告/黄色、2(CRITICAL)表示出现非常严重的错误/红色、
3(UNKNOWN)表示未知错误/深黄色。Nagios 根据插件返回来的值,来判断监
控对象的状态,并通过 web 显示出来,以供管理员及时发现故障。
6
2.4. Nagios 运行条件和原理图
Nagios 是如何通过插件来管理服务器对象后,现在开始研究它是如何管理远
端服务器对象的。打开 Nagios 官方的文档,会发现 Nagios 基本上没有什么依
赖包,只要求系统是 Linux 或者其他 Nagios 支持的系统。不过如果你没有安装
apache(http 服务),那么你就没有那么直观的界面来查看监控信息了,所以
apache 姑且算是一个前提条件。Nagios 系统提供了一个插件 NRPE。Nagios
通过周期性的运行它来获得远端服务器的各种状态信息。它们之间的关系如下图
所示:
7