工作中总会碰到几次要分析机器历史问题的需求,之前没有系统化的整理过,也没有深入的去理解那些排查系统性能工具的指标输出,导致在遇上这种需求的时候,总是心虚,能搪塞过去就搪塞过去,不过随着工作年限的增加,遇到这种需求,再说不出个123来,就配不上工牌上那“高级运维工程师”几个字了。
当站点响应慢的时候一般会怀疑服务器是不是有问题,而服务器也是有很多因素(CPU、内存、磁盘I/O等等)组成,在这里我们使用sar命令进行初期排查。sar命令是可以显示LoadAverage、CPU使用率及磁盘I/O信息的命令,更重要的是可以查看过去的信息。
iostat:用于查看 CPU 使用率、磁盘 I/O 和网络 I/O 等系统统计信息。top 命令的屏幕输出分为多个区域:第一行是系统总体信息,包括系统当前时间、运行时间、登录用户数、系统负载平均值等。
本篇文章没有太多的理论知识,主要分为基础语法案例、常用工具型命令、工作中常见的需求,建议花十分钟阅读一遍收藏即可,当工作中需要编写 Shell 脚本直接套用案例中的脚本模板,足可满足后端开发的大部分需求。