面试官问我,要是遇到了下面这些场景,该怎么处理:"生产环境Pod疯狂重启!""服务发现异常,大量502!""配置更新后服务没响应!""日志突然采集不到了..."让我们通过10个真实场景,来揭开K8s的神秘面纱。
本文节选自龚正等编著的《Kubernetes权威指南》,该节主要对常用的Kubernetes系统运维操作和技巧进行详细说明。Node的隔离和恢复在硬件升级、硬件维护等情况下,我们需要将某些Node进行隔离,脱离Kubernetes集群的调度范围。
同时也会映射到宿主机的磁盘上,但这样就可以睡安稳觉了么,当然不能,因为备份时间比如设置在凌晨1点,如果还没有到该时间点即还没有进行备份或备份中,pod挂掉了,那一天的代码是不是就丢失了,为了保证数据不会丢失,还需要做一个代码备份。
从 2023 年 11 月 27 日晚上 10 点左右截止 2023 年 11 月 28 日中午 12 点期间,DD发生了长达12小时的p0级bug,造成的影响大家通过各种平台或者亲身经历如何我就不多说了,单说对企业造成的损失超千万单和超4个亿的交易额。