zabbix“专家坐诊”第247期问答

欢迎大家加入Zabbix交流群,除了在论坛发帖求问外,还可以在QQ群里交流进步,并且每周三我们会进行免费的技术答疑活动,请大家互相转告一下! 玩转Zabbix群 QQ群号:177428068、617295020

问题一

Q:乐维MCM免费版还需要再单独安装一个Zabbix连接么?

TVmCHx7d6685f1e0b8989.png

A:估计是perseusZ_server服务进程因为重复安装导致服务挂了。试下能不能启动起来?service perseusZ_server status

Q:正常启动的,页面刷新了还是显示连接不上server

C5awoAU06685f20a26f13.png

A:没启动成功。看下日志。tail /itops/perseusZ/logs/perseusZ_server.log

Q:

32oSWwlm6685f217580a4.png

A:sudo -uitops psql -d lwops -c 'DROP INDEX hosts_7。然后再重启一次。service perseusZ_server restart。因为重新执行LWweb安装的时候,会重新导入数据库,一些表字段会重复导入。所以一般不建议反复执行 LWweb 的LW_web_install.sh

Q:可以了,但是好像跳过了CMDB的步骤,直接初始化安装了,页面和原来的监控页面也一样

A:是用的MCM的包么,MCM的部署包和ITIM的部署包是分开两个的

Q:是用的MCM的,应该和重复安装有关系吧

A:要勾选这个

ZOH88oc86685f228e2f7d.png

问题二

Q:乐维的平台连接dell iDRACS9,用iDRAC8的snmp通用模板,snmpv2连接不上,是什么原因?

A:手动命令测试能否获取数据呢?snmpwalk -v 2c -c 团体字 dell服务IP system

Q:端口号不是默认的161,提示没有响应

A:snmpwalk -v 2c -c 团体字 dell服务IP:非默认端口 system

Q:加了端口的,连其它服务器是正常的,idrac这里打开就可以了吧,还有其它地方要设置吗?

sm2MGyNL6685f2384bef5.png

A:一般配置snmp团体字后snmp请求数据超时会是这两种问题导致:

1.网络策略限制,但是这里说的其他服务器能正常,那就基本排除,除非端口不一致

2.可能是高版本idrac只支持snmpv3,可以配置snmpv3测试

3.有可能配置保存需要重启BMC管理口(如果电源选项没有单独重启BMC,那就是不支持这种操作),设备在维保的话咨询下厂商看下


问题三

Q:zabbix 的mysql 备份的时候,为什么server 就中断停止了呢,网页界面一直转圈圈?

A:如果用的mysqldump 等命令执行导出操作,是会导致库锁定的,页面读库查询的时候就无法读取。


问题四

Q:想问下这个问题的数据记录在哪个表啊?zabbix的问题数据记录在哪个表啊?5.0版本

PZMAl7646685f24d47f20.png

A: problem及event

Q:那这个主机下面触发得状态哪里改,问题删掉了

xbQuWPJS6685f2593924d.png

A:trigger表。直接删problem记录的操作不提倡呀,有可能触发些奇奇怪怪的BUG


问题五

Q:我已经在web页面禁用不需要的主机了,为什么在zabbix server还能收到大量的

9853:20240703:151834.073 cannot send list of active checks to "192.168.72.5": host [h23-12-47] not monitored的日志,如何解决。

A:正常提示消息来的,因为agent会像server发主机数据的报文,然后server检测到发数据的主机已经被禁用就会提示这个。如果不希望收到这种消息,只能是登录agent端停用agent服务进程

Q:意思要登录到agent端 手动gent服务是么

A:嗯,如果想要server停止产生这种日志的办法只能是关停对应主机的agent。其实可以忽视这种日志的,因为它也不是error或者warn级别的问题。


问题六

Q:zabbix server会话有大量的状态是TIME_WAT,有11952个,如何解决。

A:time_wait状态的连接都是用哪些端口呢

Q:10050 和10051

A:如果监控对象多的情况下,一个对象会保持或者建立关闭有1~3的网络连接,这种情况下有大量time-wait的网络连接的属于正常现象,可以针对time-wait的连接统计做一下指标监控,看下是持平的还是持续增加的,如果是只增不消的则需要额外排查


问题七

Q:最近一小时cpu使用率的区间在80-90%之间,突然降到了50%,这算不算异常?要不要告警?

A:min(10m)>80肯定要告警啊。一般CPU达到70%以上就要告警了。不是很重要的业务设备CPU达到80%-85%就要告警了。


问题八

Q:内存使用率和cpu使用率超过80% 并且持续时间超过5分钟或着10分钟 触发表达式怎么写?

A:min(10m)>80。类似这样:

ctP8iqpb6685f65fdf3d6.png


问题九

Q:7.0 版本是不是只能安装postgresql 了,原来5.x版本的升级到7.0的话,数据库能通用嘛?

A:需要留意下支持的PG版本和弃用的PG版本,zabbix的环境需求文档里会说明。

2 安装要求

7yda9wds6685f27ba8337.png

问题十

Q:zabbix的图形只能显示20页,这个参数改了没用

hda8B7h06685f28bd5e1f.png

A:没理解说的哪里的20页的限制

Q:

kzBj7QHy6685f29a37fc4.png

A:界面设置

jwlpb6la6685f2a6ce861.png

问题十一

Q:zabbix7.0启动过几分钟服务会自动挂掉,日志显示没连到ha,必须要用ha吗?我这刚起了一分钟就挂了

WrBrmbDC6685f2b07c25b.png

T7IiqDwe6685f2b7a09f5.png

A:把server配置的debug等级加大,看下能不能拿到更多报错信息

Q:配置到5,没有别的信息,是不是对硬件配置有要求

A:select * from ha_node;看下库里面的address,如果没做HA应该是localhost,然后再查下/etc/hosts里面有没有写localhost域名对应的IP记录

Q:是localhost

M3TUfwT86685f2c810bfb.png

u7gmlAcS6685f2cf95448.png

这个localhost可以改成127.0.0.1吗

A:第一条已经是了,日志没有显示出具体问题,使用编译方式部署的么?重新跑一次zabbix编译看看呢

EvatP5Eb6685f2d884311.png

Q:用编译方式部署的,还是在centos7上部署的,那我再编译一次看看


问题十二

Q:zabbix语言只有英文能选,怎么增加中文选项啊

A:参考:16 其他前端语言


zl7VgwZo6685f696da97b.png

0 条评论

请先 登录 后评论
乐维君
乐维君

397 篇文章

作家榜 »

  1. 乐维君 397 文章
  2. YOHOHO 14 文章
  3. 机灵小和尚 13 文章
  4. 我是一只小菜鸡 12 文章
  5. 细雨闲花 11 文章
  6. 。。。 9 文章
  7. 御前侍卫张五哥 9 文章
  8. 小黄人 8 文章