在前面发布的Zabbix与乐维监控对比分析文章中,我们评析了二者在架构与性能、Agent管理、自动发现、权限管理、对象管理等方面的差异。接下来让我们一起看看二者在告警管理方面的差异。
告警管理是所有IT监控平台最重磅的功能之一,也是评判一个监控平台好坏的最重要指标之一。告警管理篇是Zabbix与乐维监控对比分析专题系列文章的第四篇,主要包括告警管理、告警中心、告警收敛、告警通知、日报周报等内容。
Zabbix的告警筛选条件复杂,不易理解,不支持告警导出、全局检索、知识库匹配等功能,且Zabbix的告警统计只支持触发器TOP排行。
乐维监控提供实时告警功能,支持:
a. 自动刷新及按时间(最近6小时、最近12小时、最近24小时)统计告警信息;
b. 新告警高亮显示;
c. 按照告警严重级别、关键字、未恢复等筛选功能,其中关键字支持对象名称、告警名称、对象类型等检索。
乐维监控的全部告警功能支持简单查询和高级查询两种查询方式,其中高级查询可按照告警级别、开始及结束时间、对象类型、精准IP、维护情况等进行筛选;简单查询支持关键字查询,支持批量确认告警和关闭告警,支持设置列功能,提供列排序和列宽度设置,支持查看各种通过匹配算法自动匹配到告警的知识信息,提供告警导出功能。
此外,系统还配备了告警关联知识库功能,便于实现知识复用。
乐维监控支持自定义时间用户权限下的告警统计,包括总数、已关闭、未关闭、平均MTTR时间,以及点击相应图标,显示各对象子类型的分布统计情况;支持基于触发器的TOP筛选与基于对象的TOP筛选,点击相应对象或触发器可以弹窗显示细项。
乐维监控支持告警关联拓扑功能,能够进行故障影响范围分析,可快速打开包含该资源的拓扑界面。
设备出现故障后,支持在告警详情界面直接调用自动化脚本进行检测排查及修复。
Zabbix只支持自身告警的展示,不支持其他告警的接入处理,也没有集中统一的告警中心。
1. 乐维监控集成了告警中心功能,支持多平台应用一体化管理,可以将多个监控平台接入进行统一管理,支持平台有Zabbix、Prometheus、solarwinds、Vmware等
2. 支持自定义设置接入系统数据自动关闭时间
Zabbix 支持告警依赖收敛,可以根据先触发某个告警来抑制关联的告警,这存在很大的局限性,比如需要清楚明白触发器间的业务关系,并且不能解决突发状况,比如产生了大量同触发器、同对象、同时间、同业务属性等的告警,无法达到收敛抑制的作用。
乐维监控告警收敛支持多维度告警压缩合并,在不遗漏重要告警前提下,帮助用户快速减少告警,有效的避免告警风暴;同时收敛规则设置更灵活,支持按告警等级、告警内容、告警对象、业务分组等进行收敛。如:
l 同对象的告警收敛
l 同业务的告警收敛
Zabbix的告警通知需通过动作进行配置,虽然功能强大、灵活,但配置步骤繁琐,操作也很复杂。普通用户难以理解配置动作,不适合非管理员的用户操作。
支持简单的告警通知配置:什么等级的告警,以什么方式通知用户,只需简单配置即可完成。
Zabbix没有周报日报概念
乐维监控可以灵活地统计每日、每周的系统的总体状况,支持订阅。
以上就是Zabbix与乐维监控关于告警管理方面的对比分析。
大家好,我是乐乐,多年Zabbix二开经验,专注IT运维技术研究与分享。关注我,了解更多Zabbix技术内容,如有Zabbix等技术问题,还可在乐维社区留言提问。
错误信息