logo资料库

IBM Netcool and ITM 产品概述.doc

第1页 / 共16页
第2页 / 共16页
第3页 / 共16页
第4页 / 共16页
第5页 / 共16页
第6页 / 共16页
第7页 / 共16页
第8页 / 共16页
资料共16页,剩余部分请下载后查看
1.ITM集中监控管理解决方案
概述
系统架构和方案
系统监控的范围
服务器系统监控
数据库监控
网络故障监控
网络拓扑、资产、基于拓扑故障根源分析
网络设备、应用性能监控
扩展接口
2.NetCool网络管理解决方案
概述
系统架构和方案
产品组件
管理范围
产品特点
全面深入灵活的信息采集
灵活定制的事件管理结构
丰富的事件管理关联分析和自动处理
开放全面的信息接口,灵活支持和集成Netcool相关管理系统
灵活的事件管理流程功能
灵活定制的管理界面,丰富的管理工具
网络性能和流量管理
网络拓扑和资源管理
系统、应用采集信息监控
1. ITM 集中监控管理解决方案 概述 IBM Tivoli Monitoring 可以帮助监测和管理关键的 IT 服务和资源,其中 包括操作系统、数据库、应用程序和异构环境。ITM 建立在一个轻便、高度可扩 展 的体 系 结 构基 础 之上 , 并 且 已 经 完全 全 球 化。 它 通 过一 个 称为 Tivoli Enterprise Portal (Tivoli Enterprise Portal TEP) 的新型门户界面将不同 平台(包括分布式、主机和应用程序系统)的视图合并到一起。TEP 使您可以在 单个视图中集成并利用多个可用性管理产品,包括 ITM 5.1、ITM 6.1、IBM Tivoli Composite Application Management、IBM Tivoli Enterprise Console 和 IBM Tivoli OMEGAMON XE 产品。 为了保证应用正常运行的同时实现对重要参数的监控必须考虑管理信息对 资源占用情况, Tivoli Monitoring 对服务器的监控采用本地代理程序进行数 据采集的方式(见下图),这种操作方式解决了传统的 SNMP 管理协议在进行系统 管理时,由于可靠性和资源占用的问题会表现出力不从心。 Tivoli Monitoring 采用的是本地代理程序的方式,管理员将需要检查的信 息传送给被监测的终端,安装在终端的代理程序就按照所定义的监控周期和门限 值定义进行检查。如果正常,就不需要向管理服务器进行汇报,只有设备出现问 题时,才将数据传递给管理服务器,并采用声音、警告窗口等多种方式报警,从 而大大减少网络上的管理信息。 IBM Tivoli Monitoring 的优点: 通过一个屏幕了解您的整个企业。 使用内置的复杂警报处理功能对问题划分优先级。 IBM Tivoli Monitoring 解决方案通过工作负载、网络和风险信息以及系统 日志实时检测失控流程和资源消耗情况。“采取措施”(Take Action) 功能通过 运行现有的脚本和从提供的模板创建的脚本来解决重复发生的问题,这样,您就 可以把精力集中在其它关键领域上。 第 1 页 共 16 页
“警报”功能不仅仅是设置一个简单的阈值。内置的情形编辑器使您可以创 建复杂的阈值、情形和警报――无需编写任何代码。这个功能使您可以通过图表 方式合并许多衡量标准,以消除错误的警报。可用动态图表和表格来自定义工作 区,这些图表和表格可即时正确地放置情形。 “专家建议”为如何解决已发生的问题提供建议。除了产品提供的情形,您 还可以编辑“专家建议”,使之包含专门针对您的环境的解决方案,并为所有人 员保留此知识。 IBM Tivoli Monitoring 解决方案使您可以将分散的操作系统信息合并到 一个全企业系统性能视图中。这种完整的系统管理方法可以帮助管理不同的操作 系统,例如 Windows、Linux、UNIX、中型服务器和主机。 因为 IBM Tivoli Monitoring 解决方案为您提供一个可扩展、可自动化、 可定制的解决方案,这样,您就可以妥善进行增长规划。实时报告给您提供有关 分布式环境的即时性能信息,而历史报告功能向您显示一段时间里操作系统的性 能情况。通过对实时和历史报告进行合并,您可以确定趋势、预测系统行为并制 定明智的管理决策来指导未来增长。 IBM Tivoli Monitoring 是一个真正的端到端的可用性管理解决方案,可 以有效地管理 Microsoft、Linux、UNIX 甚至 I/OS, z/OS 之间的性能和可用性。 ITM 还包含一个新的 Tivoli Data Warehouse,“现成地”提供前所未有的报告 灵活性,而且易于配置和适于使用。 第 2 页 共 16 页
系统架构和方案 在该平台架构中,我们分为三个层次: 第一层:基础资源采集层,例如服务器、数据库、存储、备份系统、中间 件、网络系统监控、应用监控等,我们使用专业的监控产品进行实现,并且将监 控数据储存在数据库中,以便历史数据查询; 第二层:功能层,功能层主要包括两大部分数据集中处理层和流程管理服 务台,其中数据集中处理层我们主要通过 Tivoli Netcool Object Server 实现, 包括压缩,事件关联,自动化处理等工作,并通过 Netcool 将事件信息传入历史 数据库进行存储。通过统一的事件管理平台来整合基础资源与业务系统之间的逻 辑关系,同时由 Webtop 实现综合监控呈现; 第三层:统一视图:统一视图需要实现以下功能,包括业务服务管理,系 统管理,报表分析等。 根据功能架构设计及 IBM Tivoli 相应产品的功能特点,以下是此次项目的 技术实现路线: 第 3 页 共 16 页
系统监控的范围 服务器系统监控 服务器管理针对整个系统中的大量运行关键业务的 UNIX,Linux 和 Windows 服务器,帮助提高其整体的对外服务可靠性。IBM Tivoli Monitoring 可以将管 理人员日常关注的资源对象、故障概率相对较高的资源对象、对应用影响较大的 资源对象纳入到它的监控范围,管理人员通过制订监控策略并分发到管理对象 上,从而获得对关键资源的 7*24 的监控能力。IBM Tivoli Provisioning Manager for Software 可以实现跨平台环境的管理体系,这既包含 Windows 桌面机,也 包含 Unix、Linux 服务器。TPM 实现对这些不同系统服务器的硬件资产,软件资 产扫描,为管理员提供全面,准确的系统软硬件配置信息,便于企业的资产管理。 Tivoli Monitoring 可以提供的监控包括: 监控操作系统的主要参数,如 CPU 利用率、显示系统、用户、空闲时间的比 例;交换空间的利用率、虚拟内存的利用率、消息队列的情况等。 第 4 页 共 16 页
监控特定的文件系统,包括文件系统磁盘使用情况、使用率、监控重要的文 件的大小等。 监控特定的进程,监控任意关键进程的运行情况和状态变化情况,利用该功 能可跟踪操作系统、数据库及用户应用系统的进程,并这些重要进程因意外原因 终止时,可根据需要自动重启,并将报警信息写入事件日志。 另外对于 IBM System p 服务器提供基于硬件的监控,包括服务器的运行状 态和可用性,在同一控制台提供关于 AIX,LPAR,CEC 和 VIOS 资源的丰富图形化视 图,查看虚拟资源与物理硬件如何映射,实现强大的监控能力和快速体现价值的 目的。 数据库监控 数据库监控是整个系统的关键之一,为了加强对这一资源的管理工作,IBM Tivoli Monitoring for Databses(ITM for DB) 提供了大量的数据库监控和管 理能力,其中包括 Oracle,DB2,Sybase,MSSQLSERVER,Lotus Domino 等。 Tivoli Monitoring for Database 提供了一组预先定义的数据库监控器,可以 监控所有的关键数据库性能比例,从简单的数据库状态到复杂的数据锁、客户端 访问情况等的监控,以保证数据库的高可用性和性能。该功能基于 IBM Tivoli Monitoring 技术,允许用户为每个监控器定义多个事件阈值和自动维护操作。 ITM for DB 支持历史性能数据的分析,通过内置的 Tivoli Data Warehouse,管 理员可以按时间顺序将多个数据库服务器的历史性能信息存储到压缩的历史性 能数据库中。这些信息将帮助用户获得资源使用的趋势和模式。这样,用户可对 潜在的问题或空间需求心中有数。 在整体分布式系统管理方案中,管理数据库资源十分重要。为了充分了解数 据库的状态和性能,分析数据库之下的操作和为了资源也极其关键。Tivoli Monitoring for Database 可以将这些系统资源的管理完美地集成于事件管理平 台。Object server 作为事件处理中心,能够收集所有被管理计算资源的警报和 事件,包括数据库、网络和操作系统。Object server 的分组和过滤功能显著减 少了需要显示和人工干预的事件数。因此管理员就可以高效、有效地将精力集中 于最重要的事件。 通过 IBM Tivoli 的数据库管理软件,可以为数据网系统中的所有数据库系 第 5 页 共 16 页
统提供统一的管理和监控功能。 通过应用最佳做法,消除了数据管理员 (DBA) 面临的确定监测什么、何时 监测以及如何解释和处理监测结果的两难局面,从而为集中精力执行更复杂的关 键业务任务留出更多时间。IBM Tivoli Monitoring for Databases 提供始终如 一的例行监测――在数据库性能以及客户信心降低之前预见并纠正问题。 IBM Tivoli Monitoring for Databases 的特性 提供带有预设阈值和自动纠正措施的监测程序。 提供自动的“现成”值,特别适用于下面这样的新客户:他们需要为确保其 数据库的健康状况而捕获的关键指标方面的指导。允许自动处理例行任务,使高 级 IT 人员和数据库管理员可以集中精力处理更复杂的问题。 提供单个产品,该产品具有一个一致的体系结构,用来管理不同平台之间的 多个数据库。 能够将数据馈送到一个中央存储库,以便跟踪一致性,并预测服务水平协议 的违背情况。 在不同 IT 规则之间整合管理系统, 易于集成到一个端到端的管理解决方 案中。 提供历史报告和实时报告 IBM Tivoli Monitoring for Databases 的益处 最大限度地提高 IT 人员的生产率和利用率。提供主动确定最重要且相 关的性能问题和事件的能力。 减少对 IT 和 DBA 人员的培训要求。提供针对 IT 资源的集中视图和控制 能力,而不考虑其位置。 提供趋势分析数据,以便更好地规划和预测资源利用情况。 消除了使用多家供应商提供的不同产品管理企业的必要。 网络故障监控 Tivoli 网络故障监控具有如下特点: 多渠道采集网络故障,典型的包括 SNMP trap 、Syslog 等 采集模块分布部署,面向未来扩展 采集模块具备健壮性能力,保障数据采集可靠性 第 6 页 共 16 页
长期以来积累的各厂商策略知识库 (节省需求分析和定制时间) 网络故障采集到统一事件平台后,可以进一步综合分析处理。 网络拓扑、资产、基于拓扑故障根源分析 Tivoli /Network Manager 将实时报警与物理及逻辑网络设施联系在了一起, 并将所有可能的数据路径映射到有关的最有可能引发该报警或故障的原因和根 位置上。Tivoli /Network Manager 的这种独特设计最大限度地扩展了系统的伸 缩性和技术效率。Tivoli /Network Manager 由两个基本软件部件组成:一个可 能故障引擎和一个带网络发现引擎的 2、3 层拓扑服务器。 拓扑服务器则从设备的物理位置直接收集大量的网络信息,并将其记录在该 设备相应的逻辑标识下,从而将定义网段的物理拓扑与逻辑拓扑唯一地结合在一 起。通过网络发现引擎,该服务器可以实际提供 2、3 层的信息。它首先发现网 络部件,并通过可用的 MAC 和 IP 地址指出它们在网络中的位置。然后,它对 2、 3 层网络拓扑与每一个部件的标识、它的物理位置以及 MAC 和 IP 地址实现映射。 可能性故障引擎也接收来自拓扑服务器的信息。它首先计算出两个节点之间所有 可能的路径以及可能的网关,并以每秒 250,000 个事件的速度对所有相关事件进 行分析,最终确定数据的物理路径。 网络分片技术可以自动识别 PFE 所考虑的实际物理路径的端口顺序。通过定 义,路径数据结构可以包括“上行流”和“下行流”信息。这样,专门用于识别 下行流报警的复杂相关算法就可以被省去了。可能故障引擎位于网络的物理数据 路径之上,它可以识别数据的收敛点。当网络的某个位置显示的收敛点最多时, 该点很有可能就是故障的始发点。因此,Network Manager 真正是重新定义了根 原因分析的概念。 两个子系统的数据路径定义、相关事件定义以及可能原因的确定工作是共享 的,但它们可以运行在不同的服务器上,以便最大限度地保证整个系统的伸缩能 力。每个子系统还可以直接与 NETCOOL Object Server、SQL 数据库以及为 NETCOOL/Network Manager 收集事件数据和设备信息的其他数据收集器配合工 作。Tivoli Object Server 通过 NETCOOL 的探测器和监视器主机几乎可以收集 每一台设备、部件以及由语音、数据、互联网和无线网组成的系统的事件管理数 第 7 页 共 16 页
据,这些数据在经过去除冗余和处理之后被送到 NETCOOL/Network Manager。 以下是 Precesion 的网络分片方法区别于传统网络发现算法的几点理由: 1. 网络分片方法可以从多个层次收集相关数据,而不只是单纯的路由(逻 辑)拓扑或 MAC 层数据; 2. 网络分片方法对设备的移动、增加和变化进行监测,并在计算物理路径 定义时进行相应的补偿; 3. 网络分片方法可以理解和考虑不同厂商 2 层设备(集线器、交换机)在 组织数据创建虚拟专网(VPN)或虚拟 LAN(VLAN)时采用的方法; 4. 网络分片方法可以确定非管理设备所在的位置。 网络设备、应用性能监控 对关键网络服务,利用 ISM 进行服务水平管理,目前构成 Netcool ISM 系列 产品的 18 种协议可以支持网络的核心服务,包括电子信函、文件传输、Web 网 页传输、新闻、目录服务、电子商务和网络安全等。这些服务对于衡量网络服务 的水平和质量是至关重要的。 Netcool ISM 收集响应时间和可用性数据采用的是预先定义的默认时间间 隔。以 Web 可以访问的格式加以存储。这些采集的数据以日为单位循环,随时保 持 24 小时数据,可以提供即时的趋势分析和能力规划。 对 ISM 监控的网络服务,可以根据服务本身的特性进行服务水平衡量的标准, 以 HTTP 协议为例,会分析 HTTP 协议的 Lookup、Connect、Response、Download 时间,根据 HTTP 协议的各个性能指标,可以定义 SLA 的监控指标,如 Lookup 时间不能超过 1ms,Response 时间不能超过 2ms 等,并统计超过指标占总情况的 百分比,如超过预定的比例则认为服务水平失效。通过 ISM 提供的监控界面,可 以实时查看服务当前的服务水平和每天、每月等历史服务水平报告。 ISM 提供的监控器包括: SNMP 监视器:对 SNMP 设备的 SNMP 服务进行监视,提供阈值报告和历史基线 查阅,从而确保对系统状况的把握,实现系统的综合能力规划。SNMP 监视器可 以用来对类似指定机器的剩余磁盘空间、特定网络接口数据包丢包等质量状况进 行检查。该监视器的配置支持 SNMP 对象标识(OID)的分组,这些对象标识可以 随后用于具有相同类型的设备。 第 8 页 共 16 页
分享到:
收藏