对国产Lerwee监控模块的理解和使用

本文系统介绍了国产Lerwee运维智能体监控系统的架构设计。该系统采用四层架构:模板层(配置监控项、触发器、自动发现规则)、已迁移模板层(增加分类、插件、采集配置等)、监控对象层(基于模板创建监控实例)、告警指标层(生成具体监控数据)。重点阐述了模板功能,包括300+内置模板、自动发现机制,以及已迁移模板的增强特性(分类管理、附加模板、采集配置等)。通过分层架构设计,Lerwee实现了监控配置的复用性和扩展性,为运维人员提供了标准化的监控管理方案。

前言

    之前部署了清国产Lerwee运维智能体的监控或MCM,但缺乏对监控系统整体认识,这里我就给大家讲清国产Lerwee运维智能体如何快速理解和上手。

    这里就不废话多说了,直接看下面的草图理解。

国产lerwee理解和使用的草图

SJhX1Sno6900c70d7f5bb.png

从这个草图可以看到,Lerwee运维监控智能体,从我们理解的层面分为四层:

        模板---》已迁移的模板---》监控对象---》告警和指标:

(一)模板

QK24Szss6900c7498c2d9.png

        这一层模板是干什么用的呢?

        简单的说,这个模板是运维人员自己配置的采集模板,里面包含了监控项、触发器和自动发现规则。

        监控项:配置的是你想要的采集指标,比如你想要看这主机的CPU的使用率,就可以在这里配置CPU使用率,你要什么指标,都可以在这里配置,如下图:

V9qz9OMP6900c77ae38aa.png

        触发器:配置你想要的各种各样的告警,触发器是通过对获取的采集指标值(比如:CPU总使用率)与你期望的值比较或计算,得出你想要的告警。这里举个简单例子:

            有一台设备,我想监控CPU使用率是否超过90%,那我在触发器配置,只需要在表达式这里就配置监控项(CPU使用率)超过阈值90%就行。(这里就不需要你自己去手动写,直接添加,输入阈值就完成触发器表达式添加)

e75S08SM6900c7ba39c65.png

 自动发现规则:通过预设规则动态识别主机资源(如磁盘、网卡、进程等)并自动生成监控项、触发器。简单举个例子:

        我有个Windows模板需要建个磁盘使用率的监控项,但我需要多次建C盘使用率、D盘使用率、E盘使用率等监控项,万一有十几个,不是要建十几次。这里就使用自动发现规则,建一个磁盘使用率,自动生成C盘使用率、D盘使用率、E盘使用率等多个相同监控项,触发器也是同理。

5L7JykR16900c7f3908c9.png        看到这里,那我自己建个模板难吗?

        其实一点也不难,毕竟国产lerwee已经内置300多的模板,足以支持常规使用,如果还不满足,国内还有80%使用者支持呢。

(二)已迁移的模板

Gzq4ra696900c84ce1398.png

       已迁移的模板与上面的模板有什么区别?作用是什么?

        相同:都有监控项、触发器、自动发现规则。

        区别:增加了模板类型、插件类型、采集情况、面板配置、示例说明等。

        作用:将杂乱无章的模板逐一归类后,针对已迁移的每个模板,可设定异常数据采集情况;同时,可为每个模板定制专属的监控面板配置,并补充模板操作示例说明。

XRVBjiE86900c8742a20b.png

那现在看看“区别”中究竟有如何强大的作用?

模板类型:模板类型是为了将创建的资源归类,如操作系统、数据库、中间件等。对比没有迁移的模板来创建对象,是不是都是整合在一起,让你没法区分是操作系统、数据库等。

6mX5stn36900c8d276511.png

插件类型:这里分两类:主模板、附加模板。主模板是用来基于这个模板创建监控资源,而附加模板是装载额外的监控项、触发器。举个例子:

    “window操作系统对象A”有CPU使用率、内存使用率这两个指标,但还需要磁盘IO、文件系统监控项,又不想在模板上增加磁盘IO、文件系统监控项,想单独给这个“window操作系统对象A”使用。那怎么办,只能用这个附加模板类型,创建一个附加模板,单独挂载这个“window操作系统对象A”对象上使用。

VfYQZHwu6900c90d66734.pngW0FRRjgG6900c91d2fdc8.png

采集情况:这里的采集情况需要根据自己选择的触发器来判断,在不同业务下,有的设定采集不到数据,有的设定CPU超过90%,具体的情况具体分析(一般选采集不到数据作为基准,来判断采集情况)

i8BRZrxg6900c93fa2724.png

JB2OKK1j6900c971dd80a.png面板配置:面板配置就是监控资源详情页面的展示配置。

配置页面如下:

yvH1kaTj6900c99aa7ec1.png展示页面如下:

saX5kCRv6900c9ba99002.png示例说明:这里就是是一个示例帮助说明,它可以帮助用户快速了解这个模板的用途以及使用的前置条件。看到这里,不经想到,真假如我是一个小白,我想纳管某厂商的服务器,自己创建了某厂商的服务器,但什么数据都没有采集到,觉得是不是漏了什么,而这帮助示例教会我如何在采集前去配置。

QqbGP1cG6900ca28a65a4.png

(三)监控对象

RZNjSwCx6900ca50a2bf9.png       监控对象,网络上有很多说法,可以是被监控设备、监控资源、主机......,总的来说,就是你要监控的设备或对象。

        从上面草图可以看到,它是从已迁移的模板中,选取符合匹配的模板来创建监控对象。

        下面这张图就是从这里选取自己符合的模板来创建监控对象。

SVVUyADA6900ca7358b56.png

(四)告警和指标

He0A7Img6900ca985cdec.png        从上面草图来看,告警和指标是从哪里衍生出来的?

        那我就回到模板上来说,我们之前都是从模板上创建监控项、触发器、自动发现这些配置,而模板的作用是实现复用,那给谁复用呢?

        对,这些是给监控对象复用的,你想想,在一个Windows模板上,创建了许多win的监控对象,这些对象都继承了window模板的监控项、触发器、自动发现,转变成对象所属的指标(监控项)和告警(满足触发器表达式产生)。

扩展理解

n2q81fq96900cada0a797.png

        在草图上,上面只是讲述了重点。你在想,这样是不是可以完全了解整个监控系统了?

        是的,很容易国产Lerwee监控的功能,都是在这四大层面上:模板---》已迁移的模板---》监控对象---》告警和指标。

        而以后的扩展功能和现有的功能,大部分都是在这四层上面扩展功能来使用的。



0 条评论

请先 登录 后评论
骑着蜗牛工作
骑着蜗牛工作

1 篇文章

作家榜 »

  1. 乐维君 488 文章
  2. YOHOHO 14 文章
  3. 细雨闲花 13 文章
  4. 机灵小和尚 13 文章
  5. 我是一只小菜鸡 12 文章
  6. 。。。 9 文章
  7. 御前侍卫张五哥 9 文章
  8. 小黄人 8 文章