问题一
Q:大佬们,有没有基础的 监控模板 触发器分享下?
A:你可以试一下乐维免费版(https://forum.lwops.cn/download ),里面基本的模板全齐。
问题二
Q:orabbix监控查询SQL执行时间长的话就报alive,这个怎么能调整下查询时间?
A:你是说监控oracl指标超时?
Q:是的,这个怎么可以调整超时时间吗?数据库没有问题,然后报oracle alive
A:默认超时时间是30s的,除非改源码,才可以超过这个时间。然后可以试一下通过脚本监控,把oracle的监控脚本放后台,然后通过sender方式采集。zabbix_server.conf那个timeout参数或者是agent.conf那个timeout参数限制了
Q:收到
Q:zabbix-server杀掉自己又起来,我怎么看下是不是守护进程?
A:你是没停掉吧?还是说有定时任务,一直重启,或者用来高可用的软件那些?
Q:杀掉了,没有定时任务,也没高可用
Q:就是这个还有什么可能呢?使用二进制方式安装的,服务是守护进程,自动启动?
A:你现在是停了又启动了?
Q:嗯
A:你怎么停止的?停止命令用什么
Q:kill -9
A1:那你用killall zabbix_server,或者killall -u Zabbix
A:整个进程停了吧
Q:都停了
A:
ss -ntlp|grep 10051
ps -ef|grep zabbix_server
确认一下,你二进制安装也不会一直启动
问题三
Q:zabbix 能监控 jar 包运行情况吗?
A:自己写脚本就能,看看进程状态正不正常就可以了。
问题四
Q:有人知道怎么让bat脚本后台执行不弹窗口么?
A:你看下这个文档,之前我试过的,可以放到后台,不弹窗
https://blog.csdn.net/weixin_43631631/article/details/104389284
问题五
Q:我们公司有电话服务,能不能把zabbix接入进去?
A:可以的,一般是对接api的
问题六
Q:zabbix报警不及时出现,报警也不准确一般是什么原因?
A:
(1)先看一下触发器设置规则。
(2)排查你告警的平台,因为有些对接了第三方平台的话,告警多会导致发送告警积压压延迟发送。告警不准确这个是要看采集的监控项是不是设置错了,或者取值脚本有误 。
(3)监控平台性能,性能都到达了瓶颈,别说告警,用vi都会卡的
问题七
Q:还有一个问题想请教一下,我的zabbix在我的本地,被监控机子上云上,我需要监控云上的机子,需要怎么搞要简单些?
A1:网络通就用agent就行啊,云肯定有公网吧,走公网。
A2:云主机要放通端口,然后要映射个外网ip,和那个安全组策略都要放。
问题八
Q:我的zabbix用的是mariadb,然后之前按网上的教程把datadir改了,结果起来了但是写入不了数据,一直在报database mariadb is probably initialized,请问这是什么问题呢?
A:你这个现在应该是数据库起不来,你看下数据库日志,报什么明显提示。
Q:报的是gssapi plugin not found in keytab
A:就只改了一个datadir的一个参数?
Q:是的,然后把datadir里的内容复制到新文件夹
A:你改配置的时候,数据库有没有运行?
Q:我记得是关了的
A:那应该没问题,不然那个进程可能是旧的。现在确认一下是不是没有旧的mysql服务存在
Q:没有旧服务,但是现在问题有点复杂,之前有点病急乱投医,有跑过mysql_install_db命令,导致binlog有变动过,不知道有没有影响
Q:凭着datadir的文件,有办法恢复数据库吗?比如说重新建数据库然后导入
A:你现在把数据库修复后,应该就可以的。你现在数据库都起不来。最坏打算就是重新初始化数据库,然后重新导入一下zabbix的那个sql语句,把这个插件停用看下是不是数据库就能起来,gssapi plugin not found in keytab
Q:数据库恢复了,但是zabbix报failed to set dbversion_status,且网页端无法登录
Q:解决了,原来是开了innodb的只读模式,谢谢。
错误信息