【cpu负载是什么意思】系统负载看不懂？

web开发经历了“开发-在线-部署”的三个过程，但部署后网站的运营状态不太受关注。

如果我们要估算网站能承受多大的并发，你可能需要真正了解系统负载。

一、先看场景

1.服务器状态（Linux 服务器通过 Top 命令查看）

2.数据监控

上面是两个典型应用场景，我们可以直接在服务器查看系统负载。当然，也可以获取数据本地可视化显示。听起来不错，可是问题来了：

Q1：load average: 0.03, 0.12, 0.07 是什么？

Q2：为什么同时监控 1 分钟，5 分钟，15 分钟？

如果你对此有疑问，不妨继续阅读。

二、参数说明

为了便于理解，我们从「一个比喻」，「两个概念」和「三个边界」来说明。

1.一个比喻

我们可以把 CPU 比喻成一条马路，进程任务就是马路上飞驰的汽车，Load 则表示马路的拥挤程度。

2.两个概念

系统负载（System Load）：系统 CPU 繁忙程度的度量，即有多少进程在等待被 CPU 调度（进程等待队列的长度）。

平均负载（Load Average）：一段时间内系统的平均负载，这个一段时间一般取 1 分钟、5 分钟、15 分钟。

3.三个边界

Load = 0，路上一辆车也没有；Load = 0.7，一大半路上有车；Load = 1，所有路段都有车，基本饱和状态，但是道路仍然能够通行；

阮一峰老师「理解 Linux 系统负荷」中举的这个例子很形象：

总之，当系统负荷大于1，后面的车辆就必须等待了；系统负荷越大，过桥就必须等得越久。

道路的通行能力，就是 CPU 的最大工作量；道路上的车辆，就是一个个等待 CPU 处理的进程（Process）。

三、多核负载如何计算？

上文我们不管是路还是桥的例子，都是默认电脑只有一个 CPU，那如果多 CPU，情况又是如何呢？

很简单，2 个 CPU，意味着电脑的处理能力翻了一倍，能够同时处理的进程数量也翻了一倍。

2 个 CPU 表明系统负载可以达到 2.0，此时每个 CPU 都达到 100% 的工作量。如果你的服务器是 4 核 CPU，那么系统负载极限就是 4.0。

四、答题时间

到这里，相信我们的 Q1 问题已经解决了。我们重点来看 Q2：为什么同时监控 1 分钟，5 分钟，15 分钟？

一分钟理解负载 LoadAverage 中有很好的解释：

那么如果按照 1 分钟来评估系统负载，会被系统短暂的抖动所影响。

所以 1 分钟更多是作为一个参考度量，综合 5 分钟和 10 分钟使监控指标更加准确。

1 分钟 Load > 5，5 分钟 Load < 1，15 分钟 Load < 1

短期内繁忙，中长期空闲，初步判断是一个「抖动」或者是「拥塞前兆」

1 分钟 Load > 5，5 分钟 Load > 1，15 分钟 Load < 1

短期内繁忙，中期内紧张，很可能是一个「拥塞的开始」

1 分钟 Load > 5，5 分钟 Load > 5，15 分钟 Load > 5

短中长期都繁忙，系统「正在拥塞」

1 分钟 Load < 1，5 分钟 Load > 1，15 分钟 Load > 5

短期内空闲，中长期繁忙，不用紧张，系统「拥塞正在好转」

五、热门原创文章推荐

人工智能时代，Web 前端能做什么（二）？

从优秀到卓越 - Web 前端不可错过的 6 个网站

酷炫的 HTML5 网页 PPT

快来关注我吧，一起成长，一起研究 Web 的点点滴滴。

推荐阅读