在生产环境中,企业的业务系统状态并不是一成不变的。在业务高峰时段,如节假日、促销活动或特定时间段,系统负载和用户访问量会大幅增加,此时可能需要设置更高的告警阈值来适应更高的负载,反之,低谷期则要将告警阈值调低。
实践中,针对不同的业务状态调高或调低告警阈值,可以对zabbix配置多个触发器,设定在不同的时间段生效来实现。本文将以配置两个时段为例,讲解如何分时段设置不同告警阈值。
2.1.配置第一个触发器
假定0-8点为企业业务低谷,期间业务系统CPU使用率一般不超过75%,可以将触发器配置为:当CPU使用率超过75%时即触发告警。
表达式:
now()>=000000 and now()<=080000 and last(/itops-server/system.cpu.util[Usage])>75
表达式含义:
now()>=000000 #当前时间大于0点时触发(时间格式为HHMMSS)
now()<=080000 #当前时间小于8点时触发(时间格式为HHMMSS)
last(/itops-server/system.cpu.util[Usage])>75 #主机CPU使用率指标最新取值大于75时触发
注:表达式用and将各个函数串联,所有条件满足时触发器才会触发告警
2.2.配置第二个触发器
假定8-24点为企业业务高峰,期间业务系统CPU使用率可能接近或短暂超过90%,可以将触发器配置为:当CPU使用率超过90%时触发告警。该触发器与第一个类似,只需修改时段、触发阈值。
表达式:
time()>080000 and time()<=235959 and last(/itops-server/system.cpu.util[Usage])>90
当完成以上配置后,主机CPU使用率在0-8点期间大于75%时告警,在8-24点期间大于90%时告警,至此完成分时段不同告警阈值的设置。
错误信息