了解“nvidia-smi topo -m”输出

Posted

技术标签:

【中文标题】了解“nvidia-smi topo -m”输出【英文标题】:Understanding "nvidia-smi topo -m" output 【发布时间】:2019-08-17 05:59:28 【问题描述】:

为了在系统上利用 GPU,我希望能够绘制框图并所表示的连接。

这是一个示例输出:

有人可以提供一个系统级框图吗?连接的描述也会很棒。我相信这会帮助很多人利用他们的多 GPU 系统。

【问题讨论】:

这个节点是什么?看起来不像 DGX1。 你试过hwloc包中的lstopo命令吗? @GillesGouaillardet 好主意,我什至没有考虑过使用 MPI 方面的工具。 请注意,即使 hwloc 项目由 Open MPI 项目托管,这也是一个独立于 MPI 库的独立包。请注意,您可能必须自己构建 hwloc 并使用 --with-cuda 进行配置 @GillesGouaillardet 如何检查 hwloc 是否使用 CUDA 支持编译?所以我不能依赖包管理器安装的hwloc? 【参考方案1】:

您有两个 CPU 插槽。每个 CPU 都有一个通向两个 PCIe 交换机的 PCIe 主机桥 (PHB)。每个(两次乘以 2)PCIe 交换机都有两个连接到它的 GPU,总共八个。

【讨论】:

其实我很喜欢这篇arxiv论文中的图片:arxiv.org/pdf/1903.04611.pdf 太棒了!我认为这会帮助很多人。如果 nvidia 将它内置到 nvidia-smi 中,那就太棒了,

以上是关于了解“nvidia-smi topo -m”输出的主要内容,如果未能解决你的问题,请参考以下文章

Linux下实时查看GPU状况

nvidia-smi命令输出详解

nvidia-smi 的输出中的“关闭”是啥意思?

P1347 排序(topo)

试题 基础练习 矩阵乘法暴力矩阵乘法,再次了解一下矩阵

UVA 10305 Ordering Tasks