开源工具构建的千亿级企业运维管理平台实践(1)——企业

开源工具构建的千亿级企业运维管理平台实践,主要从以下几个方面来介绍: 1、企业级运维管理平台之殇。2、开源工具的选择,Zabbix和Prometheus之争。3、基于开源工具构建之痛。4、企业级运维管理平台之实践。5、问题解答 今天我们先讲第一部分“企业级运维管理平台之殇”,企业在运维管理中到底碰到什么问题,什么需求,当前的市场格局是什么样的?

企业运维的现状
企业运维的现状,需要从三个层面去剖析,从决策层到管理层,再到执行层。
决策层往往大多公司在不了解现状的情况下,盲目制定IT运维管理战略,存在IT资源和企业经营严重脱节的问题,还有部分企业在资源组织的调度上非常混乱,导致内外部相互扯皮,这都很常见。
在管理层面,管理者对现状很茫然,不知道管理资源有多少,都处于什么阶段,然后工作效率低下成本大大上升等诸多问题,导致IT经理工作价值体现不出来。
最后在执行层面,通常是比较被动的,没有预警机制,故障发生没有及时发现,导致无法判断问题根源,不能及时解决问题,进而导致基层运维人员工作价值发挥不出来。
9lWqhZ1O62e3435e68e55.png
企业运维平台的现状
企业运维平台的现状也要从三个层面去分析,运维平台的重点、难点及关键成功因素。
首先重点,核心业务系统的集中管理和保障,核心基础架构、网络链路管理和保障决定客户的满意度,如果全面性和兼容性不够,则会慢慢脱离运维平台的性能,迭代便易性,结果是新版本出来工具跟不上也会丧失它的灵活性。
其次难点,平台的多样性和复杂度,Zabbix本身难的地方在于模板,我们碰到的硬件模板,尤其是存储MIB的OID深度,一般公司去分析处理几乎是不可能的,我们曾经发现过一个现象例如服务器的突破,仅仅相差一天的时间,OID就不对了。解决现实问题的定制化才是有意义的,基于特定故障场景下进行定制化优化,如一个核心的系统出现内存爆满(90%)的警示,IO没有告警阀值,但IO有出现持续波动,导致业务发生故障,基于这种个性化场景,当告警发出的时候,我们会经过一系列的告警阀值判断才会决定发不发出告警。
最后是关键成功因素,有成熟的服务团队至关重要,也要有自主控制的产品研发及二次开发的能力,成熟的方法和工具,IT运营管理的组织架构和管理制度配套,持续优化改进的生产和服务能力都是缺一不可的。

BCfc7L3j62e34369bb1fa.png
运维管理平台的现状
运维管理平台的现状需要从4方面来介绍,国外“老四大“产品、国内传统产品、互联网流派及开源。
一是国外的“老四大”产品,理论层面的东西其实蛮高的,像从国外引入的BSM的概念,但是在国内的服务能力还是很弱的。再有它们迭代能力略显不足,而且很贵,目前国内用在银行保险金融行业比较多。部分功能人性化不足,在欧美地区,更喜欢比较朴素原始的东西,但在国内截然相反,被认为丑、难看等等一些列问题。
二是国内传统产品,有非常强的本地化服务优势,设计也符合国情,界面酷炫就是一个很好的例子,然后大部分从网管起家,IT起家的很少,像银行保险金融比较严谨的客户,一般看不上,但是中小客户又会去买,由于价格不贵又有开源的demo,导致他们处在市场的夹心层,收益受到很大影响,进而就没有研发的动力,能维持就不错了,再有底层的功力尚显不足,比如采集层,传统的运维采集能力跟开源工具的采集能力就有差别。
三是互联网流派,从互联网出来的创始团队做出的产品,底层性能比较扎实,使用前瞻性技术,像TS时序、CMDB等,但有时想法过于理想。也有挺多企业不管产品功能如何,先占了市场再说,导致离客户的真实场景还是有点距离,另外部分企业服务意识交付意识比较淡薄,这就导致用户使用成本有了明显的提高。
四是开源商业化的流派,国外的产品一般都是功能代码全开放,国内只是Agent服务开放,还有一些流行的开源社区支撑能力也是不错的。开源产品的自由度也是很大的,相对而来的就是开源的成本高,体现在使用成本、部署成本、维护成本,我们就有碰到这样的客户,碰到瓶颈或者人员离职了导致他们开发不下去,就会找到我们,还有在维护方面很难实现一两个人长期维护一个开源平台,尤其是重要程度比较高的金融保险领域,几乎是不可能的。开源也存在一些问题,高度依赖企业内部能力,二开成本高,这些都是开源软件的通病,导致使用开源工具的企业很痛苦。
DSTnlKHf62e34373b56f9.png
技术交流欢迎加入Q群:177428068


0 条评论

请先 登录 后评论
乐维君
乐维君

351 篇文章

作家榜 »

  1. 乐维君 351 文章
  2. YOHOHO 14 文章
  3. 机灵小和尚 13 文章
  4. 我是一只小菜鸡 12 文章
  5. 细雨闲花 11 文章
  6. 御前侍卫张五哥 9 文章
  7. 。。。 8 文章
  8. 小黄人 8 文章