Prometheus包含了一个报警模块,这就是Alertmanager,Alertmanager 主要用于接收 Prometheus 发送的告警信息,它支持丰富的告警通知渠道,而且很容易做到告警信息进行去重,降噪,分组等,是一款前卫的告警通知系统。
以上基于Prometheus+Grafana+钉钉简单部署了一个告警系统,可以结合实际情况自行进行扩展,在生产上Prometheus一般采用集群方式,防止单点故障,同时也可与consul结合做服务自动发现,减少手动配置环节。
Micrometer支持的监控系统:AppOptics, Azure Monitor, Netflix Atlas, CloudWatch, Datadog, Dynatrace, Elastic, Ganglia, Graphite, Humio, Influx/Telegraf, JMX, KairosDB, New Relic, Prometheus, SignalFx, Google Stackdriver, StatsD, and Wavefront.
Prometheus是一个开源的系统监控和报警系统,现在已经加入到CNCF基金会,成为继k8s之后第二个在CNCF托管的项目,在kubernetes容器管理系统中,通常会搭配prometheus进行监控,同时也支持多种exporter采集数据,还支持pushgateway进行数据上报,Prometheus性能足够支撑上万台规模的集群。
Prometheus在容器监控方面的优势是Zabbix不能相比的,它提供了多维度数据模型和灵活的查询方式、支持服务器节点的本地存储且易于维护,已经成为了新一代云原生监控系统中的事实标准,更是企业级云原生应用的首选开源监控工具。
面试官问我,要是遇到了下面这些场景,该怎么处理:"生产环境Pod疯狂重启!""服务发现异常,大量502!""配置更新后服务没响应!""日志突然采集不到了..."让我们通过10个真实场景,来揭开K8s的神秘面纱。