在企业生产过程中,并非所有的设备都需要全天候、满负载运转,也有些仅需要周期性的运转即可。例如,在某家企业,有一批这样的机器,每天都会在固定的时间跑批量任务,期间,机器的CPU使用率会有明显的提升。在这种情况下,如果zabbix触发器配置成为全天候生效机制,那么跑批量任务期间就CPU使用率升高应付直接触发告警。但对于企业与主机管理员而言,这期间CPU使用率升高是正常场景,并不需要为此发出告警。
为避免误告警,主机管理员需要对告警策略进行优化,减少误告警的可能。简言之,就是在跑批量任务期间CPU使用率的提升保持在一定范围内不再触发告警。下面以一台主机的CPU使用率为例:
1.如图可以看到产生了CPU使用率告警(模拟)
2.现时的时间是早上11点10分,假设是跑批任务需要执行30分钟(30分钟内CPU使用率会明显增长),将需要屏蔽这个时段30分钟内的CPU告警。可以将触发器设置为如下图所示内容。
选择功能函数“time”,其中书写对应格式是“时分秒”
完整触发器表达式:CPU使用率大于0.1%且时间范围不在11:10-11:40之间。
也可以为恢复表达式也加上生效时间限制:
3.手动将告警关闭,可以观察到在指定的限制时间范围内,告警并没有产生,一旦超过11:40分0秒后告警重新出现。
以上就是这一期的全部内容。在运维实践中,zabbix触发器定期生效是一个比较常见和实用的配置,它可以自动屏蔽周期性任务告警误报,避免分散运维人员工作精力。大家好,我是乐乐,专注开源运维监控技术研究与分享,更多技术分享欢迎关注乐维社区。
错误信息