successful NUMA node read from SysFS had negative value (-1)告警的处理方法

Posted 白马负金羁

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了successful NUMA node read from SysFS had negative value (-1)告警的处理方法相关的知识,希望对你有一定的参考价值。

NUMA是多处理器系统中使用的计算机内存设计方法之一,访问内存的时间取决于内存与处理器的相对位置。在 NUMA 架构中,当处理器访问其本地内存时,它比访问远程内存时更快。远程内存是指连接到另一个处理器的内存,本地内存是指连接到自己处理器的内存。换句话说,它是一种在一块主板上使用多个处理器的同时提高内存访问效率的技术。当一个特定的处理器用完内存时,它会自己独占总线,因此其他处理器必须发挥作用,并指定“仅在此处访问”,并将其称为 NUMA 节点。

第一步:检查节点

lspci | grep -i nvidia
  
0000:01:00.0 VGA compatible controller: NVIDIA Corporation TU106 [GeForce RTX 2060 12GB] (rev a1)
0000:01:00.1 Audio device: NVIDIA Corporation TU106 High Definition Audio Controller (rev a1)

第一行显示 VGA 兼容设备 NVIDIA Geforce 的地址为 01:00 。每个都会不同,所以让我们仔细更改这部分。

第二步:检查并更改NUMA设定值

如果你用ls命令查看/sys/bus/pci/devicecs/,你会看到下面的列表:

ls /sys/bus/pci/devices/
  
0000:00:00.0  0000:00:06.0  0000:00:15.0  0000:00:1c.0  0000:00:1f.3  0000:00:1f.6  0000:02:00.0
0000:00:01.0  0000:00:14.0  0000:00:16.0  

以上是关于successful NUMA node read from SysFS had negative value (-1)告警的处理方法的主要内容,如果未能解决你的问题,请参考以下文章

有没有办法为 NUMA 中的数据分配特定的内存?

怎么查看一个计算节点具体的Numa资源分布详情

内核解读之内存管理内存管理三级架构之内存结点node

什么是真正的 pte(相对于 NUMA 中的迁移 pte)

虚拟机NUMA和内存KSM

内存管理