面向大型网络的可用性监控工具
没有任何一家企业能够离开网络可用性监控工具。评估和修复网络设备故障、保障它们的可用性,是现代数据中心的一个基础需求——特别是那些要求保证应用与服务持续可访问的企业。
虽然没有任何一个工具能够满足所有网络的要求,但是理解组织的需求和网络的复杂性,有助于确定哪一些可用性监控工具能够产生最大好处。幸好,有各种不同的工具可以满足不同规模网络的需要——包括最小规模企业和最大规模企业及服务提供商。为了帮助读者了解更多关于网络可用性监控工具的知识,我们对一些主流供应商产品进行了分析。
在本文中,我们将分析一些适合中型到大型企业的工具。
CA Spectrum
CA Spectrum是专门设计用来管理大型企业基础架构的产品,它可以监控有万级以上设备的网络。Spectrum网络监控工具可以发现各种网络设备和非网络设备,并且将它们组织到2层和3层网络拓扑图中,然后由它来定期和自动更新。它的服务感知管理功能可以发现、建模、监控和管理支持那些通过网络运行的业务服务的基础架构。
Spectrum使用简单网络管理协议(SNMP)轮流检测网络设备和收集事件信息。此外,它还可以从其他网络管理工具收集日志和数据,然后将它们整合到自己的分析工具中。
Management(之前是Nimsoft)整合,从而支持服务器监控。Spectrum还可以集成许多其他的CA产品,包括它的应用性能管理系统和服务帮助台产品,而且它还支持集成一些第三方管理系统。Spectrum移动应用可以允许管理员在他们的移动设备上查看最多100条警报。
CA Spectrum的智能错误检测功能支持自动分析网络问题的根源。此外,它还可以将事件关联到抑制警报上,后者往往只是核心问题的表象。
这个系统包含了一个变更管理功能,它可以跟踪和控制网络的配置变化。它可以将网络问题关联到配置变更上,从而帮助管理员诊断出由于变更引发的问题,从而快速地在修改过的相同接口上修复问题。此外,它还支持基于角色的可定制界面,其中涉及报表、警报和仪表板等功能,因此用户可以根据自己的知识和能力定制这些工具。
Spectrum 10.2是以一个软件镜像部署在服务器上,其中嵌入了自己的数据库和分析引擎。这种方式可以简化部署和管理,但是限制了平台的可定制性——例如,客户无法使用第三方数据库。但是,运行在平台之上的CA特性和功能仍然具有高度可定制性。Spectrum可以运行在Windows Server 2008 SP2或最新版的Linux或Solaris服务器。
CA提供了一种分层、基于设备的Spectrum授权模型。它有永久授权和订阅授权两种模式。公司提供了本地现场客户支持和离岸非工作日支持。此外,它还维护了一个客户门户网站,支持用户个体之间的社区讨论和一个知识分享中心。CA还提供了用于实现Spectrum的可选专业服务,以及产品培训服务。
Entuity Network Management
Entuity Network Management是一个统一可用性监控系统,它专门用于服务中型及大型企业。BMC Software负责分销这个产品,分销方式是将它作为自己业务服务管理套件中的一个网络监控组件。
Entuity可以从网络设备上自动发现和收集各种不同的信息,其中包括SNMP、系统日志、链路层发现协议、流与服务质量等。它能够自动执行扫描操作,从而发现所有添加到网络的新设备。此外,它还能发现一些非网络设备,但是它的主要卖点是网络监控系统。它还能够发现和监控虚拟基础架构,其中包括VMware、Oracle和微软虚拟机管理程序及底层虚拟交换机,以及思科的Nexus物理与虚拟交换机产品。
Entuity会根据它发现的设备自动构建一个拓扑图,监控网络错误和性能状态,最后根据所收集和监控的数据生成报表。它还有内置的目录清单和资产管理特性,并且可以监控配置变化,从而在发现有违反策略的变更时发出警报。这个产品还提供了一个嵌入式和可定制的事件管理系统,它可以执行根源分析,从而将警报组织成为意外事件汇总。未处理的意外事件则可以自动触发警报自动升级,从而保证不会有警报被遗漏掉。
Entuity基于Web的管理控制台使非IT用户也能够在系统中创建网页入口。这些网页对于IT与业务人员之间的协调非常有用,而且也非常适合托管服务提供商使用,他们可以用它向客户展示他们所提供的服务。Entuity的报表功能也支持通过向导、模板和脚本进行定制。
这个产品的Integrated Flow Analyzer(集成流分析器)会收集和分析网络流记录,其中包括用于监控网络流量流的NetFlow及IPFIX。这些特性的免费版支持采集和分析按5分钟间隔汇总的最长2小时的流量,也支持按天汇总的最多35天的流量。收费版则支持按1分钟间隔轮循的流监控和其他一些高级特性。
在2016年秋季发布的16.5版本中,Entuity推出了SurePath网络路径分析工具,它可以自动发现任意两台设备之间的网络路径,然后显示该路径上跳与跳之间的拓扑图。SurePath集成了Entuity Network Management,它给客户提供了一个可视化工具,它使用该公司的网络可用性监控产品,帮助客户优化和修复所监控设备的故障。
Entuity的软件支持30天完整功能免费试用期。这个公司还提供了基于设备和基于对象的两种授权方式。它还销售一个包含维护服务的永久授权和一个基于订阅的授权。这个产品安装在一台服务器上,其中嵌入了自己的数据库和分析引擎。此外,它还支持安装为虚拟机管理平台中运行的一个虚拟机。
Entuity Network Management在设计上支持扩展到超大规模网络,而且客户通过增加服务器而扩展部署时完全不需要支付额外的费用。这个产品还集成了几个第三方事件管理产品和IT基础架构管理软件,如BMC、Oracle、IBM和惠普等。Entuity的产品还可以从注册零售商处购买。
Entuity提供了可选专业服务,以及关于其产品的现场和在线两种方式的培训与认证。
Hewlett Packard Enterprise Network Node Manager i
Network Node Manager i (NNMi)是专门用于管理大型企业网络的工具,也可以支持服务提供商和移动网络运营商的网络。除了可用性监控等基础功能,它还可以作为性能管理系统。
这个产品的高级自动发现特性可以从所发现的设备中获得各种不同的数据,其中包括配置信息、虚拟LAN和设备之间的物理连接。NNMi会用发现的数据自动生成2层和3层拓扑图,然后用户可以根据拓扑图监控自己的网络。此外,NNMi还可以发现和监控大规模非网络设备。
NNMi的警报管理功能包括事件关联和警报升级特性,它们可以防止用户被事件警报所淹没。此外,它还有一个插件目录清单和资产管理模块。
NNMi基于Web的可定制控制台允许用户根据自身需要定制各种不同的数据视图和仪表板。此外,这个工具还包含一些基于角色和设备分组的特性,它们支持将大型网络团队分割成多个有不同监控职责的域。这个产品的意外事件生命周期管理特性使用户只需要关注于专门分配给他们的意外事件。
这个产品的高级特性还包括一个支持跨多个地区的全局网络管理架构、扩展路径可视化和VMware虚拟机及底层物理网络连接的发现与监控。
HPE有2个版本的NNMi:NNMi Premium(高级版)和NNMi Ultimate(终极版)。高级片包含2个可选安装的智能插件,它们将NNMi从一个错误和可用性监控工具扩展为一个网络性能和服务保证工具。
终极版带有几个其他的可选安装智能插件,支持流量监控、IP电话、IP多播、MPLS和监控特性。此外,终极版还带有一个网络工程插件,它支持一些工程任务的工作流自动化。NNMi可以安装在许多种操作系统上,包括Windows Server、HP-UX和Linux。HPE提供了支持其多个产品和NNMi的连接器,包括HPE Operations Manager i、HPE Intelligent Management Center和同样是惠普的配置管理数据库产品UCMDB。
HPE基于NNMi所监控的设备数量销售授权,但是这些授权还可以根据所监控设备的功能数量而分级销售。
NNMi带有一个嵌入式数据库,但是企业需要定制系统,则可以选择使用自己的数据库技术。
HPE还提供了一个可选的专业服务,包括NNMi安装及其培训课程。这个产品还带有全球支持服务,覆盖这个软件的所有方面,以及用户集成到其中的其他HPE产品。此外,HPE还提供了一个在线门户网站,用户可以在网站上获得学习、咨询和技术支持等资源。
IBM Tivoli Network Manager
IBM Tivoli Network Manager平台包含一个核心网络可用性监控组件。此外,它也作为Netcool Network Management在市场销售,这个产品定位于中大规模企业和服务提供商。它的核心特性包括网络发现、监控、事件管理与配置。虽然Tivoli Network Manager并没有目录清单和资产管理特性,但是它可以集成一个独立的IBM工具来支持这个功能。
IBM经常将Tivoli Network Manager和另一个网络变更与配置管理系统Tivoli Netcool Configuration Manager打包销售。此外,IBM还推出了一个高级事件管理与运营分析平台Netcool Operations Insight,它支持多个IBM管理系统的警报整合、事件分析和事件自动化,其中包括Tivoli Network Manager。
Tivoli Network Manager可以监控万级数量的设备。它的集中控制台专门支持可见性和报表功能,允许用户管理超大的复杂环境。用户可以选择不同的方式去查看网络,包括按虚拟LAN、子网、虚拟私有网络等方式,并且还有一个Network Hop View(网络跳视图)可以显示指定设备所连接的所有设备。
这个平台使用多个同步和批处理采集方法去发现物理和虚拟网络设备,其中包括SNMP和互联网控制消息协议。然后,Tivoli Network Manager可以将这些发现的设备自动组织为一个拓扑图。在Tivoli的拓扑图和事件报表上,用户可以通过右键单击一个对象来查看一系列故障修复指令和设备信息。
这个产品的事件管理功能使用根源分析技术过滤多余的警报,然后从中分离出关键的警报。Tivoli Network Manager的高级分析功能可以在问题发生之前就通知网络管理员,如预测警报和趋势功能。
Tivoli Network Manager还有一个专门为非IT用户设计的门户网站,用户可以自行创建与业务相关的仪表板,从而帮助他们了解所使用网络的状态。
IBM推出了一个永久性Tivoli Network Manager授权,它按照每一个托管设备来分层发放授权,其中每一层分别对应设备类型、大小和复杂度——例如,一个网络设备越复杂,它产生的监控数据越复杂,那么监控的费用就越高。这个授权还包含一年的软件维护服务,它需要每年续费。
IBM还提供了一个可选的Tivoli Network Manager专业安装服务。这个产品由IBM及其渠道伙伴直接销售。
Tivoli Network Manager带有一个嵌入式数据库和分析引擎,但是客户也可以使用自己偏好的数据库。IBM已经为这个产品开发出了一个高级高可用架构,它允许用户将这个产品的多个实例部署为双活或单活加备份的模式,从而保证工具一直在线和正常工作。这个功能对于IBM的服务提供商客户而言至关重要,因为他们必须依靠Tivoli Network Manager来监控服务水平协议。
SolarWinds Network Performance Monitor
SolarWinds Network Performance Monitor (NPM)性能监控系统可以监控网络,也可以监控服务器、存储和虚拟化软件。
NPM可以自动发现网络中所有启用了SNMP或Windows Management Instrumentation协议的设备。用户可以设置产品的重新发现特性频率,它支持每隔一小时、一天、一周或一月去扫描发现新设备。
NPM能够发现设备之间的2层和3层链接,这样可以简化创建网络拓扑图的过程,从而方便实现性能与可用性数据的可视化跟踪。用户可以选择已发现的设备,然后将它们拖放到拓扑制作环境中。拓扑图制作特性会自动为选定的设备创建一个拓扑图。
用户可以通过拓扑图、仪表板和报表监控网络设备的状态和可用性。下拉选择这些视图,就可以查看设备的更详细信息,以便执行后续的故障修复、性能管理和容量规划等任务。
这个产品的事件管理系统允许用户设定临界值警报,创建将事件关联到多个设备的自定义警报,以及根据持续条件和多个设备状态组合来定制警报。此外,这个事件管理系统还可以根据拓扑和依赖条件过滤警报,从而避免产生冗余警报。
这个产品的Web控制台也支持通过拖放操作进行定制。它带有几个标准报表模板,但是用户也可以自己创建和分发自己的报表。
SolarWinds提供了几个NPM插件模块,用于扩展它的全面网络管理,其中包括基于数据包的性能监控。NPM集成了另外几个SolarWinds产品,其中包括一个NetFlow监控工具、一个IP语音监控系统、一个服务器与应用管理器和一个网络配置管理系统。
SolarWinds的NPM授权是基于所监控的设备与接口的数量。此外,这个公司还提供了30天完整功能NPM的免费试用。NPM是以单个软件包的方式交付给用户的,它自带了一个嵌入的SQL数据库,但是用户可以选择使用自己在独立服务器上安装的SQL数据库。这个软件可以安装在Windows Server 2008或2012操作系统上。这些服务器可以安装在物理机或虚拟机上。对于更大规模的部署环境,它们可能还需要增加一些分析引擎服务器。
NPM包含一年期可续费的技术支持服务。SolarWinds还提供了由内部人员执行的24/7全球技术支持服务,也维护了一个Thwack用户社区和知识库。