Q:如何让告警一直在主面板显示,除非我人工确认 A:选择最近问题,可以看到最近的所有问题,包括已恢复的问题 |
Q:【问题现象】 我的wlc host经常Timeout while connecting to "10.58.1.130:161".应该如何排查? 【问题前操作】 zabbix 通过自动发现检测到wlc上的800多ap,频率为5分钟。发现后,问题出现 【已做排查】 出现问题时,zabbix snmpwalk 能取到wlc 的ap信息。 |
A:zabbix_server.conf上设置的超时时间是多少? Q:4 |
A:可以改为30,重启zabbix服务后看下是否还有这个问题。 Q:配置更改后已重启,问题还未恢复,还需要作其他操作吗? A:需要等待监控项成功获取一次数据才会变成绿色。如果需要排查问题,需要在最新数据界面,找一下是否有部分监控项到了时间间隔,但是数据却没更新的。 Q:部分监控获取到了数据。另snmp监控 ap设置的5分钟间隔已过去 |
A:你的自动发现规则是怎么配置的? Q: |
A:那个自动发现规则里的snmp OID的内容可以复制出来吗? Q:SNMPv2-SMI::enterprises.9.9.513.1.1.1.1.5.{#SNMPINDEX} A:是第一张图的那个snmp OID的全部内容,我感觉是写错了 Qdiscovery[{#APNAME},SNMPv2-SMI::enterprises.9.9.513.1.1.1.1.5] ,这是第一张的 A:snmpwalk 这个OID返回的结果是怎样的? |
Q:snmpwalk -v 2c -c public 10.58.1.130 enterprises.9.9.513.1.1.1.1.5 A:snmpwalk -v 2c -c public 10.58.1.130 enterprises.9.9.513.1.1.1.1.5.0.162.137.0.134.224 这个有数据吗? |
还可以试下不勾选 使用大量请求 这个选项,使用大量请求 这个选项再等5分钟左右看下吧 Q大量请求取消也已测过了,之前就取消了。 A:zabbix的日志有相关的信息吗? Q:没看到相关信息 |
监控单个AP oid正常,是不是snmp批量通信问题? A:是的,是真的有800多个AP在线吗? Q:是的,有优化的资料没? |
A:信息类型是字符来的,可以禁用一部分监控项,测试是否能够获取数据,如果能够获取数据,说明是同一时间获取的量太多导致,确定是这个问题后,如果还是只想通过zabbix的snmp监控,只能调整监控项的时间间隔。其他解决办法:可以通过脚本配合zabbix_sender,时间间隔5分钟获取一次数据。 Q:日志提示临时性关闭snmp agent,zabbix 能实现错峰收集自动发现的800AP信息吗? A:目前还做不到 Q:自动发现网络接口过滤的那个后面的数字代表什么 1 2 3 5 7 |
A:对{#IFOPERSTATUS}这个宏的值进行过滤,只要值为1、2、3、4、5、7的 |
Q:生产环境中会在发现网络接口里过滤吗?如果过滤了down的下次发现接口刚好down那中间就会没有接口的数据吧 A:如果之前是up,自动发现接口down了以后,down的接口监控项会保留一段时间,这段时间里自动发现不了后,再删除,保留多长时间可以在自动发现规则里设置。如果之前是down的,接口up了之后,需要等自动发现时间间隔到了之后生成,这段时间没有监控数据。 |
https://support.huawei.com/enter ... e-12800-pid-7542409 这些信息,对应的设备的mib文件里会说明的,接口mib属于公有mib,所以其他设备的mib也能看到 Q:交换机流量的收发方向这样是正确的吗? |
A:对的 本期待解决问题: 请问,我的一个windows server 2003主机,zabbix里经常出现cpu使用率超出100%的数据,这是什么原因啊? |
错误信息