问题一
Q:乐维MCM免费版还需要再单独安装一个Zabbix连接么?
A:估计是perseusZ_server服务进程因为重复安装导致服务挂了。试下能不能启动起来?service perseusZ_server status
Q:正常启动的,页面刷新了还是显示连接不上server
A:没启动成功。看下日志。tail /itops/perseusZ/logs/perseusZ_server.log
Q:
A:sudo -uitops psql -d lwops -c 'DROP INDEX hosts_7。然后再重启一次。service perseusZ_server restart。因为重新执行LWweb安装的时候,会重新导入数据库,一些表字段会重复导入。所以一般不建议反复执行 LWweb 的LW_web_install.sh
Q:可以了,但是好像跳过了CMDB的步骤,直接初始化安装了,页面和原来的监控页面也一样
A:是用的MCM的包么,MCM的部署包和ITIM的部署包是分开两个的
Q:是用的MCM的,应该和重复安装有关系吧
A:要勾选这个
Q:乐维的平台连接dell iDRACS9,用iDRAC8的snmp通用模板,snmpv2连接不上,是什么原因?
A:手动命令测试能否获取数据呢?snmpwalk -v 2c -c 团体字 dell服务IP system
Q:端口号不是默认的161,提示没有响应
A:snmpwalk -v 2c -c 团体字 dell服务IP:非默认端口 system
Q:加了端口的,连其它服务器是正常的,idrac这里打开就可以了吧,还有其它地方要设置吗?
A:一般配置snmp团体字后snmp请求数据超时会是这两种问题导致:
1.网络策略限制,但是这里说的其他服务器能正常,那就基本排除,除非端口不一致
2.可能是高版本idrac只支持snmpv3,可以配置snmpv3测试
3.有可能配置保存需要重启BMC管理口(如果电源选项没有单独重启BMC,那就是不支持这种操作),设备在维保的话咨询下厂商看下
Q:zabbix 的mysql 备份的时候,为什么server 就中断停止了呢,网页界面一直转圈圈?
A:如果用的mysqldump 等命令执行导出操作,是会导致库锁定的,页面读库查询的时候就无法读取。
Q:想问下这个问题的数据记录在哪个表啊?zabbix的问题数据记录在哪个表啊?5.0版本
A: problem及event
Q:那这个主机下面触发得状态哪里改,问题删掉了
A:trigger表。直接删problem记录的操作不提倡呀,有可能触发些奇奇怪怪的BUG
Q:我已经在web页面禁用不需要的主机了,为什么在zabbix server还能收到大量的
9853:20240703:151834.073 cannot send list of active checks to "192.168.72.5": host [h23-12-47] not monitored的日志,如何解决。
A:正常提示消息来的,因为agent会像server发主机数据的报文,然后server检测到发数据的主机已经被禁用就会提示这个。如果不希望收到这种消息,只能是登录agent端停用agent服务进程
Q:意思要登录到agent端 手动gent服务是么
A:嗯,如果想要server停止产生这种日志的办法只能是关停对应主机的agent。其实可以忽视这种日志的,因为它也不是error或者warn级别的问题。
Q:zabbix server会话有大量的状态是TIME_WAT,有11952个,如何解决。
A:time_wait状态的连接都是用哪些端口呢
Q:10050 和10051
A:如果监控对象多的情况下,一个对象会保持或者建立关闭有1~3的网络连接,这种情况下有大量time-wait的网络连接的属于正常现象,可以针对time-wait的连接统计做一下指标监控,看下是持平的还是持续增加的,如果是只增不消的则需要额外排查
Q:最近一小时cpu使用率的区间在80-90%之间,突然降到了50%,这算不算异常?要不要告警?
A:min(10m)>80肯定要告警啊。一般CPU达到70%以上就要告警了。不是很重要的业务设备CPU达到80%-85%就要告警了。
Q:内存使用率和cpu使用率超过80% 并且持续时间超过5分钟或着10分钟 触发表达式怎么写?
A:min(10m)>80。类似这样:
Q:7.0 版本是不是只能安装postgresql 了,原来5.x版本的升级到7.0的话,数据库能通用嘛?
A:需要留意下支持的PG版本和弃用的PG版本,zabbix的环境需求文档里会说明。
Q:zabbix的图形只能显示20页,这个参数改了没用
A:没理解说的哪里的20页的限制
Q:
A:界面设置
Q:zabbix7.0启动过几分钟服务会自动挂掉,日志显示没连到ha,必须要用ha吗?我这刚起了一分钟就挂了
A:把server配置的debug等级加大,看下能不能拿到更多报错信息
Q:配置到5,没有别的信息,是不是对硬件配置有要求
A:select * from ha_node;看下库里面的address,如果没做HA应该是localhost,然后再查下/etc/hosts里面有没有写localhost域名对应的IP记录
Q:是localhost
这个localhost可以改成127.0.0.1吗
A:第一条已经是了,日志没有显示出具体问题,使用编译方式部署的么?重新跑一次zabbix编译看看呢
Q:用编译方式部署的,还是在centos7上部署的,那我再编译一次看看
Q:zabbix语言只有英文能选,怎么增加中文选项啊
A:参考:16 其他前端语言
错误信息