像数据库服务,应用服务,应用的链路追踪都是需要重新部署的,以及对Docker也是需要进行监控的,性能是一个很大的工程,涉及到的部门和技术都是很广的,性能测试不仅仅只是写写脚本,执行一下这简单,前期是需要对性能需求进行分析,评估,设计性能方案,性能策略等等,性能团队及相关人员对这些也会进行评审。
1、监控指标一个好的系统,主要监控以下内容集群监控节点资源利用率节点数运行PodsPod监控容器指标应用程序【程序占用多少CPU、内存】2、监控平台使用普罗米修斯【prometheus】 + Grafana 搭建监控平台prometheus【定时搜索被监控服务的状态】开源的监控、
先需要模版的 《服务器资源总览表》 和 《 资源明细 | 资源明细》, 分成两个部分, 从 服务器资源总览表dashboards上点击主机地址,会跳转到 资源明细 | 资源明细 这个dashboard。
以上基于Prometheus+Grafana+钉钉简单部署了一个告警系统,可以结合实际情况自行进行扩展,在生产上Prometheus一般采用集群方式,防止单点故障,同时也可与consul结合做服务自动发现,减少手动配置环节。
Micrometer支持的监控系统:AppOptics, Azure Monitor, Netflix Atlas, CloudWatch, Datadog, Dynatrace, Elastic, Ganglia, Graphite, Humio, Influx/Telegraf, JMX, KairosDB, New Relic, Prometheus, SignalFx, Google Stackdriver, StatsD, and Wavefront.
云原生系统搭建完毕之后,要建立可观测性和告警,有利于了解整个系统的运行状况。基于Prometheus搭建的云原生监控和告警是业内常用解决方案,每个云原生参与者都需要了解。本文主要以springboot应用为例,讲解云原生应用监控和告警的实操,对于理论知识讲解不多。