替代 nvidia-smi 来测量 GPU 利用率?

Posted

技术标签:

【中文标题】替代 nvidia-smi 来测量 GPU 利用率?【英文标题】:Alternative to nvidia-smi for measuring GPU utilization? 【发布时间】:2012-02-29 17:49:33 【问题描述】:

在使用某些工具和/或开发库/工具时,nVidia 放弃了对所有非 quadro 和 tesla 卡的支持。我有两台 GTX 590,当我使用 nvidia-smi 时,大多数可查询字段都返回 N/A,因为它们不再支持此卡。

是否有其他工具可以收集这些信息?是否可以/直接使用 SDK 查询此信息?

【问题讨论】:

【参考方案1】:

在 Windows 上,NvAPI 适用于所有 GPU。

在 Linux 上,如果您正在运行 X Server,您还可以使用 nvidia-settings 实用程序查询一些信息(GPU 温度、时钟,不幸的是没有利用率)。例如nvidia-settings -q all

对于 Quadro 和 Tesla GPU,NVML/nvidia-smi 适用于 Linux 和 Windows 64。

【讨论】:

【参考方案2】:

虽然这是一个非常古老的问题,但我将把它留在这里,以防遇到同样问题的人偶然发现这个问题。 Nvidia-settings 仍然通过 -q [gpu:X]/GPUUtilization 转发 GPU 使用情况。与nvidia-smi相比,它非常慢,但总比不知道要好。无论哪种方式,我都编写了一个脚本,以简洁易读的方式将这个和其他一些常见的统计数据放在一起。 Here it is for those who want it.

【讨论】:

使用这种方法仍然不包括gpu utlization【参考方案3】:

GPUstat 输出带有彩色单线。它是用 Python 实现的,如果你想调整它,它有一个测试套件。

https://github.com/wookayin/gpustat

【讨论】:

【参考方案4】:

我建议您使用 MSI Afterburner Windows 应用程序链接-https://www.msi.com/page/afterburner 当你执行你的程序时,时钟会上升 通常是空闲号码 如果您不想执行那些命令和东西,我认为这是最简单的方法 并且有很多选项可以查看您的 GPU 统计信息,希望对您有所帮助 谢谢你,祝你好运

Before Executing Your Programm It Should Be Like This

And While It's Executing It Should Be Looking Like This

【讨论】:

以上是关于替代 nvidia-smi 来测量 GPU 利用率?的主要内容,如果未能解决你的问题,请参考以下文章

nvidia-smi GPU性能测量没有意义

nvidia-smi 结果中如何定义 GPU 和内存利用率?

nvidia-smi 关键知识

Nvidia GPU信息nvidia-smi(Persistence-M持久性内存Volatile Uncorr. ECC显存错误校正GPU-Util显卡利用率Compute M.显卡计算模式)

在 TensorFlow 中打印 GPU 和 CPU 使用率

gpu温度监测