之前部署了清国产Lerwee运维智能体的监控或MCM,但缺乏对监控系统整体认识,这里我就给大家讲清国产Lerwee运维智能体如何快速理解和上手。
这里就不废话多说了,直接看下面的草图理解。

从这个草图可以看到,Lerwee运维监控智能体,从我们理解的层面分为四层:
模板---》已迁移的模板---》监控对象---》告警和指标:

这一层模板是干什么用的呢?
简单的说,这个模板是运维人员自己配置的采集模板,里面包含了监控项、触发器和自动发现规则。
监控项:配置的是你想要的采集指标,比如你想要看这主机的CPU的使用率,就可以在这里配置CPU使用率,你要什么指标,都可以在这里配置,如下图:

触发器:配置你想要的各种各样的告警,触发器是通过对获取的采集指标值(比如:CPU总使用率)与你期望的值比较或计算,得出你想要的告警。这里举个简单例子:
有一台设备,我想监控CPU使用率是否超过90%,那我在触发器配置,只需要在表达式这里就配置监控项(CPU使用率)超过阈值90%就行。(这里就不需要你自己去手动写,直接添加,输入阈值就完成触发器表达式添加)

自动发现规则:通过预设规则动态识别主机资源(如磁盘、网卡、进程等)并自动生成监控项、触发器。简单举个例子:
我有个Windows模板需要建个磁盘使用率的监控项,但我需要多次建C盘使用率、D盘使用率、E盘使用率等监控项,万一有十几个,不是要建十几次。这里就使用自动发现规则,建一个磁盘使用率,自动生成C盘使用率、D盘使用率、E盘使用率等多个相同监控项,触发器也是同理。
看到这里,那我自己建个模板难吗?
其实一点也不难,毕竟国产lerwee已经内置300多的模板,足以支持常规使用,如果还不满足,国内还有80%使用者支持呢。

已迁移的模板与上面的模板有什么区别?作用是什么?
相同:都有监控项、触发器、自动发现规则。
区别:增加了模板类型、插件类型、采集情况、面板配置、示例说明等。
作用:将杂乱无章的模板逐一归类后,针对已迁移的每个模板,可设定异常数据采集情况;同时,可为每个模板定制专属的监控面板配置,并补充模板操作示例说明。

那现在看看“区别”中究竟有如何强大的作用?
模板类型:模板类型是为了将创建的资源归类,如操作系统、数据库、中间件等。对比没有迁移的模板来创建对象,是不是都是整合在一起,让你没法区分是操作系统、数据库等。

插件类型:这里分两类:主模板、附加模板。主模板是用来基于这个模板创建监控资源,而附加模板是装载额外的监控项、触发器。举个例子:
“window操作系统对象A”有CPU使用率、内存使用率这两个指标,但还需要磁盘IO、文件系统监控项,又不想在模板上增加磁盘IO、文件系统监控项,想单独给这个“window操作系统对象A”使用。那怎么办,只能用这个附加模板类型,创建一个附加模板,单独挂载这个“window操作系统对象A”对象上使用。


采集情况:这里的采集情况需要根据自己选择的触发器来判断,在不同业务下,有的设定采集不到数据,有的设定CPU超过90%,具体的情况具体分析(一般选采集不到数据作为基准,来判断采集情况)

面板配置:面板配置就是监控资源详情页面的展示配置。
配置页面如下:
展示页面如下:
示例说明:这里就是是一个示例帮助说明,它可以帮助用户快速了解这个模板的用途以及使用的前置条件。看到这里,不经想到,真假如我是一个小白,我想纳管某厂商的服务器,自己创建了某厂商的服务器,但什么数据都没有采集到,觉得是不是漏了什么,而这帮助示例教会我如何在采集前去配置。

监控对象,网络上有很多说法,可以是被监控设备、监控资源、主机......,总的来说,就是你要监控的设备或对象。
从上面草图可以看到,它是从已迁移的模板中,选取符合匹配的模板来创建监控对象。
下面这张图就是从这里选取自己符合的模板来创建监控对象。

从上面草图来看,告警和指标是从哪里衍生出来的?
那我就回到模板上来说,我们之前都是从模板上创建监控项、触发器、自动发现这些配置,而模板的作用是实现复用,那给谁复用呢?
对,这些是给监控对象复用的,你想想,在一个Windows模板上,创建了许多win的监控对象,这些对象都继承了window模板的监控项、触发器、自动发现,转变成对象所属的指标(监控项)和告警(满足触发器表达式产生)。

在草图上,上面只是讲述了重点。你在想,这样是不是可以完全了解整个监控系统了?
是的,很容易国产Lerwee监控的功能,都是在这四大层面上:模板---》已迁移的模板---》监控对象---》告警和指标。
而以后的扩展功能和现有的功能,大部分都是在这四层上面扩展功能来使用的。
错误信息