Zabbix“专家坐诊”第80期问答汇总

欢迎大家加入Zabbix交流群,除了在论坛发帖求问外,还可以在QQ群里交流进步,并且每周三我们会进行免费的技术答疑活动,请大家互相转告一下! 玩转Zabbix群 QQ群号:177428068

Q:Error connecting to database: No such file 出现这个问题要怎么排查吗?网上说建立个软连接 但是还是不行。
A:你和这个是安装什么的报的错?
Q:不是 一直可以的 突然报这个错
A:报错是说没有这个文件,你用find命令找一下。
Q:启动mysql 后面一直点点 这是啥原因
Cushkdtk62d7c904b03d9.jpg
A:启动服务可能比较久,等等吧。
Q:等了几分钟还是这样子
A:中断掉,然后ps -ef | grep mysql 看一下没有没有进程残留,在看一下log,有没有什么报错。
Q:有残留进程 然后kill掉 重启还是这样,日志这样 不知是啥
FHvJcMSz62d7c90e8fe31.jpg
A:df -HT看一下你的磁盘空间。


Q:麻烦问下,我想监控一个node程序名字里带111的进程,是该这么用么:proc.cpu.util[node,root,,111],监控的CPU
A: 可以试一下第三个参数,这里支持正则。
ebcf5khh62d7c9176c338.png
Q:嗯嗯,是的,就是这个参数不会,正则这块我不太了解,值是取出来了,但是和和top的实时监控不对应,我将刷新率同样调到了5秒,结果也不一样,所以我不确定我取到的值是不是正确的
A:方便截几张图吗?
Q:我拿mongo来举的列子,麻烦您帮忙看下
sx6ufkCq62d7c91df0fe7.jpg

Q:监控交换机  一般都监控什么东西? 官方提供的模板可以满足嘛?
A:端口流量、速率、状态、cpu、内存等,官网一般可以满足的;
Q:端口流量 速率 状态的 我都找到了  但是CPU和内存的是那个模板呢?

Q:大佬们,我的Server,agent,web都用docker装在60一台机器上,日志也没报错,但是就是监控不了咋回事?都没有报错呀0YBDbTFw62d7c928dfd01.jpg
6MtRzWLc62d7c9365f1bf.jpg
A:容器的地址有放出来吗?
Q:有的,我防火墙都没开
A:你zabbix配置文件的"Server"参数的地址写的是那个,试一下0.0.0.0
Q:写的也是60,我的Web , server  agent都装在60上,里面的地址都是60,换成0.0.0.0吗?
6tpOTqDB62d7c946c53d2.jpg
A:你这台容器的docker run启动的时候有把10051等端口映射出来吗
Q:有,就映射了10051这个端口
ImGTMXuy62d7c94e9cc06.jpg


Q:我这里根本就walk不到信息。是设备没有开发吗?
ZyGZHpKj62d7c954b9b60.png
zYBV9Mpt62d7c95c673b4.jpg
这里到24就没有了  但是提供的文档上有CPU的使用情况  会是什么原因了?
DHOqch2762d7c9633d1bc.png
A:你这个mib库是和你测试的交换机的型号对应的吗?
Q:是的
A:那就是设备不支持这个Oid了。
Q:那像这样我怎么去找他的cpu和内存的OID ?

XFBksFC762d7c96ba4040.jpg
jrmsMh4162d7c974bb85f.jpg
QwOBbDo262d7c97c14c08.jpg
后面是查出来的结果
KXZvEAs262d7c98693c02.png
意思是  zabbix配置 我怎么将后面那些是风扇  端口这些不用内存的硬件不让他显示
A:可以在自动发现那边的预处理过滤掉即可
ms9MVYih62d7c98e01b81.png
Q:噢噢 晓得了~

Q:proc.cpu.util[node,root,,gate-server-1]请问这个进程,我这么写对么
EI2Tg1bp62d7c99562913.jpg
A:没什么问题
Q:还得请教下,如果proc.cpu.util[node,root,,gate-server-1]这里面写成proc.cpu.util[node,root,,id=gate-server-1],这个=等于号是当做特殊字符来处理的还是普通字符串来处理的呢
A:试一下加一个单引号proc.cpu.util[node,root,,'id=gate-server-1']
Q:好的,我试下

Q:想给snmptrap做个过滤,符合特征接收的时候直接丢弃,请问下有没什么办法?
c5dls0aL62d7c99b6d0ed.png
A:你是在存到zabbix_traps.tmp之前就过滤掉是吗?
Q:对,是想要实现这个目的
A:你这个是什么场景要这样做呢,最好的就是在设备那边做限制。
Q:试了,设备上条件限制只能一股脑发出来没法滤,所以就想在接收的时候丢掉免得给zabbix增加负担
A:你那边通过snmptrap的设备有很多吗,如果不是很多感觉作用不是很大。而且zabbix这边接收到会根据你模板上监控项在进行匹配的。
Q:目前是这样用的,就是想在底层优化一下,了解了,谢谢

Q:我定义了一个自动发现规则,但是不生效
VsQSAbUP62d7c9a60ba37.jpg

A:这边有收到值么
o42bwfX762d7c9ab45d99.png
Q:到哪里看呢
A:监测-->自动发现
Q:这里的action ,是针对新发现的机器,还是已经存在很久的机器都是生效的?我这个规则
2f7Wzs9P62d7c9b0ba465.jpg
A:这里是根据网段去发现的,所以你那个条件以前的机器也是会生效的。
Q:所以没生效就比较奇怪了,反正发现zabbix很多不生效的情况。特别是这里定义的各种action
A:你的自动发现规则我看一下。
Q: M8gRb1Bh62d7c9b676485.jpg
A:你这个的自动发现规则的时间调短一点看看。
Q:以前也试过,我调成30分钟试试

sYJSMLIn62d7c9bc1fb4f.png


0 条评论

请先 登录 后评论
乐维君
乐维君

346 篇文章

作家榜 »

  1. 乐维君 346 文章
  2. YOHOHO 14 文章
  3. 机灵小和尚 13 文章
  4. 我是一只小菜鸡 12 文章
  5. 细雨闲花 11 文章
  6. 御前侍卫张五哥 9 文章
  7. 。。。 8 文章
  8. 小黄人 8 文章