OpenMP 运行时看不到我的 GPU 设备

Posted 2023-03-16

技术标签:

【中文标题】OpenMP 运行时看不到我的 GPU 设备【英文标题】：OpenMP runtime does not sees my GPU devices 【发布时间】：2021-05-24 05:30:39 【问题描述】：

我正在尝试将一些 OpenMP 卸载到我的本地计算机上的 GPU，该计算机与 GTX 1060 显卡一起使用。我所有的 CUDA 和 Cublas 示例都运行良好。但是，当我尝试运行一些 OpenMP 卸载时，它根本不起作用。为了支持 OpenMP 5.0，我编译了 GCC 10.2.0 工具链。经过一番调试，我发现 OpenMP 运行时看不到任何设备。例如。此代码显示为零：

#include <omp.h>
#include <stdio.h>

int main() 
    printf("%d\n", omp_get_num_devices());
    return 0;

不过，Nvidia 工具链已启动并正在运行：

$ nvidia-smi 
Sun Feb 21 23:06:40 2021       
+-----------------------------------------------------------------------------+
| NVIDIA-SMI 450.51.06    Driver Version: 450.51.06    CUDA Version: 11.0     |
|-------------------------------+----------------------+----------------------+
| GPU  Name        Persistence-M| Bus-Id        Disp.A | Volatile Uncorr. ECC |
| Fan  Temp  Perf  Pwr:Usage/Cap|         Memory-Usage | GPU-Util  Compute M. |
|                               |                      |               MIG M. |
|===============================+======================+======================|
|   0  GeForce GTX 106...  Off  | 00000000:1D:00.0 Off |                  N/A |
|  0%   37C    P8    12W / 200W |    584MiB /  6075MiB |      0%      Default |
|                               |                      |                  N/A |
+-------------------------------+----------------------+----------------------+

那么我错过了什么？ OpenMP 运行时如何找到设备？

编辑：

我正在附加关于我的编译器的信息：

$ gcc -v
Using built-in specs.
COLLECT_GCC=gcc
COLLECT_LTO_WRAPPER=/opt/gcc/10.2.0/libexec/gcc/x86_64-pc-linux-gnu/10.2.0/lto-wrapper
Target: x86_64-pc-linux-gnu
Configured with: ./configure --prefix=/opt/gcc/10.2.0/
Thread model: posix
Supported LTO compression algorithms: zlib
gcc version 10.2.0 (GCC)

代码是使用以下命令编译的：

gcc -fopenmp simple.c

【问题讨论】：

您使用哪种编译器以及哪些编译选项？我使用带有 -fopenmp 标志的 GCC 10.2.0 -fopenmp 不启用卸载。您还需要通过 -foffload=nvptx-none 告诉 GCC 您想要卸载到 NVIDIA 设备。如果您收到 nvptx-none 不是受支持的卸载目标的错误，那么您的 GCC 不是在支持它的情况下构建的。 gcc -v 显示构建配置。您可以在答案中做到这一点。我不知道我必须用卸载支持来编译我的编译器（这并不容易）。我花了一天的时间，但它现在正在工作。我将编辑我的问题并添加提到的输出。你去吧，答案是关于卸载的 GCC wiki 页面的链接。 【参考方案1】：

要编译具有卸载支持的 OpenMP 代码，您需要告诉 GCC 目标的确切平台。这是通过-foffload=<platform> 命令行选项实现的。对于 NVIDIA 设备，平台为 nvptx-none，即，您必须编译：

gcc -fopenmp -foffload=nvidia-ptx simple.c

虽然 GCC 支持卸载到多个目标平台，但并非每个 GCC 发行版都启用了它们，因为它需要依赖。例如，在我的 Arch Linux 上，GCC 根本没有使用卸载支持进行编译。如果您在执行上一条命令时收到错误消息，则您的 GCC 未配置为支持 NVIDIA。 gcc -v 向您展示了编译器的配置方式。在配置选项中查找--enable-offload-targets=nvptx-none。

GCC wiki 上的 Offloading page 提供了有关支持的卸载目标以及如何构建它们的更多详细信息。

【讨论】：