了解“nvidia-smi topo -m”输出
Posted
技术标签:
【中文标题】了解“nvidia-smi topo -m”输出【英文标题】:Understanding "nvidia-smi topo -m" output 【发布时间】:2019-08-17 05:59:28 【问题描述】:为了在系统上利用 GPU,我希望能够绘制框图并所表示的连接。
这是一个示例输出:
有人可以提供一个系统级框图吗?连接的描述也会很棒。我相信这会帮助很多人利用他们的多 GPU 系统。
【问题讨论】:
这个节点是什么?看起来不像 DGX1。 你试过hwloc
包中的lstopo
命令吗?
@GillesGouaillardet 好主意,我什至没有考虑过使用 MPI 方面的工具。
请注意,即使 hwloc
项目由 Open MPI 项目托管,这也是一个独立于 MPI 库的独立包。请注意,您可能必须自己构建 hwloc
并使用 --with-cuda
进行配置
@GillesGouaillardet 如何检查 hwloc 是否使用 CUDA 支持编译?所以我不能依赖包管理器安装的hwloc?
【参考方案1】:
您有两个 CPU 插槽。每个 CPU 都有一个通向两个 PCIe 交换机的 PCIe 主机桥 (PHB)。每个(两次乘以 2)PCIe 交换机都有两个连接到它的 GPU,总共八个。
【讨论】:
其实我很喜欢这篇arxiv论文中的图片:arxiv.org/pdf/1903.04611.pdf 太棒了!我认为这会帮助很多人。如果 nvidia 将它内置到 nvidia-smi 中,那就太棒了,以上是关于了解“nvidia-smi topo -m”输出的主要内容,如果未能解决你的问题,请参考以下文章