发布日期:2023-07-03 16:23:44
分享到
最近嘉为蓝鲸weops研发的五款数据库监控插件在蓝鲸s-mart市场(点击跳转)上架啦!为了确保监控插件的兼容性、稳定性和安全性,研发团队做了大量的测试优化,甚至还用到了混沌工程。接下来,让我们一起看看如何打造出高质量的监控插件吧!
s-mart市场是腾讯蓝鲸推出的一款云原生应用市场,为用户免费提供一些基于蓝鲸开源平台的云原生应用系统、运维脚本工具、以及一些实用插件。
说明:插件可在蓝鲸监控平台导入使用,蓝鲸平台版本不低于v6.1
01. 研发背景
蓝鲸监控平台兼容prometheus exporter、datadog agent等各种开源的监控采集插件,运维人员利用开源社区可以快捷地将各类it对象纳入监控。
但开源社区中的监控插件质量往往无法得到保证,主要体现在以下几个方面:
稳定性:
一些监控插件没有经过专业测试,在使用过程中出现运行崩溃、内存泄露、大量占用系统资源等问题,严重时甚至影响业务系统的正常运行;
兼容性:
监控插件通常是针对it组件的固定版本,在其他版本上使用时可能出现采集不到数据或采集到错误数据的问题;
安全性:
当监控插件存在安全隐患或被植入了病毒代码,将会造成无法估量的损失;
易用性:
大部分开源社区的监控插件是纯英文,指标和介绍不易阅读理解;同时也存在插件需要经过改造才能在蓝鲸监控平台上使用的情况。
为此,我们基于开源社区,经过十道严格的工序对监控插件进行筛选、测试、优化改造与验证,制作成更适合蓝鲸监控体系的五大数据库监控插件,并免费回馈给蓝鲸社区,让运维人员的工作更加轻松和高效。
02. 制作工序
1)挑选经过大众检验的插件
精选prometheus社区官方建议的数据库插件及其他开源数据库插件。
2)精选拓展性好的插件
部分插件由于编写语言不支持,无法在蓝鲸正常采集的,需寻找替代插件并补全需要的指标(如mysql router exporter)
3)搭建84个版本环境测试兼容性
使用jenkins流水线在集群内部署容器,测试了84个不同模式或版本的数据库使用情况,得到每个探针的版本兼容性数据。
4)甄选出重要的监控指标
只保留运维工作中需要关注的指标,避免信息过载。
5)使用chaos混沌工程进行随机破坏与压力测试
通过chaos混沌工程,模拟了探针在高负载,故障等复杂情况下的运行状况,为探针的性能和稳定性提供保证。
6)隐藏敏感信息,改进探针的安全性
优化前:账号密码在后台显示
优化后:账号密码已隐藏
7)指标汉化
8)适配蓝鲸监控平台
优化前:导入插件存在各类异常报错问题
优化后:导入插件即可直接使用
9)编写使用文档
优化前:开源的配置文件不能指导如何在蓝鲸平台配置
优化后:添加进行蓝鲸采集的配置说明
10)封装打包
优化前:需要配置脚本文件
优化后:一键导入
新的数据库监控插件具有简单易用、多样化监控、实时监控、数据可视化、安全可靠等多种优势,是企业实现数据库监控的不二选择。
03. 使用方法
以mysql为例,首先进入s-mart市场mysql监控插件产品详情,点击【立即下载】下载插件。
进入监控平台,点击【集成】板块,点击【导入】上传监控插件。
按照步骤指引和内置的使用文档完成配置。
04. 效果展示
上述工具及部署指南已上架蓝鲸s-mart市场及github,点击下方链接进行查看/下载。详细介绍请点击底部阅读原文可获取插件说明文档。
s-mart 市场:https://bk.tencent.com/s-mart/market?sys_type=2&user_type=2&best_type=1&page_size=12
github:https://github.com/orgs/weops-lab/repositories?type=all
05. 社区贡献
作为腾讯蓝鲸的一级k8凯发天生赢家的合作伙伴,嘉为蓝鲸7年来致力于共建蓝鲸开源社区,在监控插件、脚本工具、应用系统等各板块持续输出内容,推动蓝鲸社区的开源生态的发展和创新。欢迎大家下载使用,给我们提供宝贵的建议和反馈!
微信扫码登录
申请演示
请登录后在查看!