Q:今早发现一个奇案,从监控数据的图形来看某个服务超过阈值是发生在四点左右,但是触发器却在二点和三点分别报警一次,在四点没有报警,看了下agent的等级3 的日志没有发现特别奇怪的地方,请问这种事情怎么排查A:有没有去查看过主机的系统时间?Q:查看过 是准确的,现在发现是用另外一台电脑同样查询是正常的A:你用的是什么方式去监控?Q:你好,请问为啥每次日志提示这个之后,zabbix_agent2就自己退出了A:有试过去telnet端口吗?Q:都正常...是zabbix-agent2有什么bug吗A1:这个我也用的agent2,也有类似的情况,不是网络问题,tcpdump抓包试试Q:系统已添加过的主机,突然一天就在系统中没有了,有办法恢复吗?用server端日志能排查出原因吗?A:突然没了?有没有去查过操作的审计日志,有没有可能是手动删掉的?或者去查数据库的日志看看。Q:zabbix 更新模板后用不用重新主机绑定模板A:不用的,更新后的模板是会在模板设定的刷新时间同步到机器上。Q:噢噢 3Q~Q:请教一下两个表达式的值比较,怎么在其中一个加上单位呢?A:触发器是加不了单位的,触发器表达式的值是来源于监控项,监控项很多时候是不带单位的,只是获取数值,单位是在监控项配置的时候补充。Q:嗯嗯,解决了,ISP带宽是在接口描述获取的,默认是M,改成bps *1000000就好了, 不用加单位,谢谢Q:zabbix系统自带的交换机端口模板 我想加一下 比如端口持续掉线5分钟 则报警,但是现在 我不知道用哪个参数,这是自带端口模板的表达式A:如果掉线,这个监控項的返回值是什么?Q:2,1的up状态,2是downA:用count来做触发器,count(#5,2,eq)=5Q:前面的5和后面的5 分别是什么意思?A:最新的五个值等于2的个数,如果等于5个,就告警Q:那如果这样报警了 一直未恢复 是会报1个警告 还是一直会触发下去?A:如果不设置恢复表达式,就只有一个告警,永远不会恢复,只能手动确认这个告警。Q:那恢复表达式 其实还是原来这样就可以了A:可以
397 篇文章
错误信息