Node 是不是使用 100% CPU?

Posted

技术标签:

【中文标题】Node 是不是使用 100% CPU?【英文标题】:Is Node using 100% CPU?Node 是否使用 100% CPU? 【发布时间】:2021-05-02 23:25:12 【问题描述】:

我对正在运行的节点进程所看到的内容有些困惑。主机上的docker stats 显示容器正在使用超过 100% 的 CPU。这让我认为节点进程正在最大化 CPU。当我在主机上运行top 并看到节点进程正在使用超过 100% 的 CPU 时,这一点得到了证实。

当我跳入 docker 容器时,我看到该节点只使用了 54% 的 CPU,并且处理在两个内核之间进行了拆分。因为 Node 是单线程的,所以我希望看到一个内核达到最大值,另一个内核为 0。

我找到了这个 QA,看起来操作系统可能正在内核之间移动进程(对我来说是个新闻)。 Is This Single Node.JS App Using Multiple Cores?

你能帮我解释一下结果吗?节点是否已被最大化?或者由于容器中的进程显示为 54% 的使用率可以上升到 100%?为什么节点容器中的顶部显示节点的使用率为 54%,但两个内核的使用率为 45% + 46%。除了单节点进程,容器中没有运行任何东西。我没有使用集群,尽管我包含的包可能是。

我问这一切是因为我试图了解我是否应该扩展这个 ECS 实例,或者节点是否可以处理更多。

Node.JS: 15.1.0
EC2 Instance: c5.large
NestJS: 7.3.1

【问题讨论】:

嗨,有趣,这可能有助于解释它***.com/questions/47401648/… 请记住,nodejs 确实在内部使用线程进行某些操作(如磁盘和加密操作),因此它可以通过使用其他线程来涉及多个 CPU 内核。 如果它的使用率超过 100%,那么您有一个过载的进程,这表明您可能应该启动多个并使用负载均衡器。 @tadman,但它是否使用了超过 100% 的单核? @IronMan,这个问题是关于 docker stats 不完全准确,但就我而言,docker stats 和 top 在主机上非常接近(均高于 100%)。 【参考方案1】:

不同的tops

您所看到的(可能)是由于top 的风格不同。

我要大胆猜测一下,您的 Docker 映像可能是基于 Alpine 的? Alpine 中的top 命令是busybox。它以 TOTAL 可用 CPU 数量 (nCPU * 100%) 的百分比形式报告每个进程的 CPU 使用率。

这与大多数其他风格的 top 不同,后者将每个进程的 CPU 使用率报告为 SINGLE CPU 的百分比。

两个顶部显示相同的东西:每个 CPU 的使用率约为 50%

两个top 的屏幕截图实际上显示了同一件事:node 进程正在使用大约 50% 的 2 个 CPU。

测试理论

我们可以通过以下方式进行测试:

# This will max out 1 cpu of the system
docker run --name stress --rm -d alpine sh -c 'apk add stress-ng && stress-ng --cpu 1'

# This shows the busybox top with usage as ratio of total CPUs
# press 'c' in top to see the per-CPU info at the top
docker exec -it stress top

# This will install and run procps top, with usage as a ratio of single CPU
docker exec -it stress sh -c 'apk add procps && /usr/bin/top'

在上面的截图中,我们可以看到两种不同风格的top。它们报告的 CPU 使用率相同,但上面的报告为“100% CPU”(占单个核心的百分比),而较低的报告为 6%(1/16 核心 = 6.25%)。

这告诉我们node 的 CPU 使用率是什么?

节点是单线程的,不能使用超过 100% 的 CPU。 ...有点。在底层,Node 使用libuv,它确实在孤岛中运行线程。例如,这就是 Node 接收 IO 操作的异步事件的方式。这些线程确实使用 CPU,可以将你的 CPU 使用率提高到 100% 以上。有些包也写成add-ons to Node,而且这些包也使用线程。

环境变量UV_THREADPOOL_SIZE 限制了可以同时运行的libuv 控制的线程的最大数量。在运行节点之前将其设置为更大的数字(默认为 4)可能会消除瓶颈。

如果您正在执行一些 CPU 密集型操作,请考虑使用 cluster、Worker Threads、writing your own add-on 或生成单独的进程来进行计算。

【讨论】:

不错的猜测,我在容器中使用 Alpine。 node.js 在两个内核之间拆分工作对我来说仍然很奇怪,但我不希望您猜到我的业务逻辑是如何做到的。谢谢您的帮助! :-) @Brett 很高兴这是答案!这确实有点奇怪,但我认为这可能是正常的。如果我运行一个循环进行计算,我注意到它似乎确实在我机器上的核心之间旋转了这个负载。我敢打赌,如果您能够将刷新速度提高到足够高,那么它会一次在任何给定核心上显示 100%。如果我执行htop -d 1(每 1/10 秒刷新一次),我的机器上就是这种情况

以上是关于Node 是不是使用 100% CPU?的主要内容,如果未能解决你的问题,请参考以下文章

如何调试导致 100% cpu 使用的 node.js?

Node API 占用 100% CPU,node-tick-processor 输出看起来很神秘

node.js 应用程序突然以 100% 加载 CPU 并挂起

当集群退出并重新启动时,使用集群和 mariaSQL 100% 的 CPU 使用率

CPU使用100%意味着啥

CPU使用老是100% 进程里services.exe 占用CPU非常大, 是怎么回事