在企业IT运维管理过程中,网络响应超时是比较常见的故障之一。尽管网络响应超时的原因多种多样,解决方案各不相同,但归根结底,解决故障的首要前提是发现问题。
在网络超时监控方面,Zabbix能够实时捕获并响应网络设备的超时事件,提供及时的告警通知。通过对超时对象的监控,系统管理员可以迅速识别潜在的网络问题,采取有效的措施以确保网络的稳定性和可用性。本文将探讨Zabbix在监控网络超时方面的优势和应用,帮助用户更好地利用该监控系统实现网络性能的全面管理。
以下是具体的配置过程:
1、将以下脚本上传至Agent自定义脚本路径下
#!/bin/bash
#Role:统计Zabbix日志里网络超时的详细清单
#时间范围,输入“1”代表统计前一个小时到现在时间点的网络超时清单
timeRange=$1
#Zabbix日志绝对路径
logFile=$2
startTime=$(date -d "-$timeRange hour"+%Y%m%d:%H%M)
timeoutList=$(grep 'wait for 15 seconds' $logFile | grep "$startTime"| grep -v 'name"'| awk -F'host''{print $2}'| awk '{print $1}' | awk '{a[$0]++}END{for(i in a){print i,a[i] | "sort -r -k 2"}}')
# 判断$timeoutList是否为空
if[-n "$timeoutList"];then
# 如果非空,则打印$timeoutList的值
echo "$timeoutList"
else
# 如果为空,则打印NULL
echo "NULL"
fi
2、修改所属用户、用户组并赋予脚本执行权限
[root@itim_6 zabbix_self_monitor]# chmod +x network_error_list.sh
[root@itim_6 zabbix_self_monitor]# chown itops: network_error_list.sh
[root@itim_6 zabbix_self_monitor]# ll | grep network_error_list.sh
3、编辑zabbix_agentd文件,添加自定义监控项
[root@itim_6 zabbix_self_monitor]# vim /itops/zabbix/etc/zabbix_agentd.conf
添加以下内容:
UserParameter=network_error_list[*],/itops/zabbix/scripts/zabbix_self_monitor/network_error_list.sh $1 $2
4、重启zabbix_agentd服务
[root@itim_6 zabbix_self_monitor]# service zabbix_agentd restart
5、打开WEB页面,按下图内容在模板侧添加监控项
添加宏值
6、将模板链接至监控主机后,观察最新数据
至此,可查看网络超时的对象以及对应数量,根据这份数据做针对性的调优。
错误信息