在 Linux 中的多个平台上启用 OpenCL?如何处理 ICD 文件?

Posted

技术标签:

【中文标题】在 Linux 中的多个平台上启用 OpenCL?如何处理 ICD 文件?【英文标题】:Enable OpenCL over multiple platforms in Linux? How to proceed with ICD files? 【发布时间】:2016-08-25 08:58:48 【问题描述】:

详情

我必须安装哪些驱动程序/软件包才能在多个平台上启用 OpenCL:CPU (Intel)、集成 GPU (Intel)、专用 GPU (NVIDIA)? 最好让所有平台都运行 OpenCL 1.2 或更高版本

我知道这可能是一个简单的修复,也许只是选择了正确的库/SKD,但我在让更多它们在一个平台上工作时遇到了一些麻烦。

运行 ubuntu 14.04:我有一个带有集成英特尔显卡的英特尔酷睿 I5 和一个专用的 NVIDIA Geforce 710m 板。


我使用过的资源

https://wiki.tiker.net/OpenCLHowTo 在这里(在 Debian 下)它告诉我我只需要:

    ICD 加载程序包:(您只需要其中一个) ICD 封装 标题包

我已经尝试过的

    已安装 CUDA7.5(全部安装) 由于驱动程序冲突而出现黑屏 通过卸载所有 nvidia 驱动并安装 352 解决 仍需安装 Cuda SDK 发件人:How to make OpenCL work on 14.10 + Nvidia 331.89 drivers? sudo apt-get install nvidia-331 nvidia-331-uvm nvidia-opencl-dev nvidia-modprobe 这些软件包将我的驱动程序降级为 331 和 340 也来自:How to make OpenCL work on 14.10 + Nvidia 331.89 drivers? 链接库: sudo ln -s /usr/include/nvidia-352/GL /usr/local/include sudo ln -s /usr/lib/x86_64-linux-gnu/libOpenCL.so.1 /usr/local/lib/libOpenCL.so OpenCL 1.1 适用于 NVIDIA GPU 无法获取 OpenCL 1.2,因此决定卸载 331 和 340 并重新安装 352 已安装 352(再次) OpenCL 1.1 停止工作用于 NVIDIA GPU(但仍然无法工作)

    已安装英特尔opencl_runtime_14.2_x64_4.5.0.8.tgz

    创建了一个指向英特尔 ICD 的符号链接:

    sudo ln -s /opt/intel/opencl-1.2-4.5.0.8/etc/intel64.icd

    OpenCL 1.2 工作用于 CPU(并且仍然工作)

    已安装 clinfo sudo apt-get install clinfo

    仅检测到英特尔 CPU 平台 尝试安装几个不同的 NVIDIA 软件包以使 NVIDIA GPU 再次工作,但没有成功

安装的包和一些信息:

供应商的 ICD?

ls -l /etc/OpenCL/vendors/
total 4
-rw-r--r-- 1 root root 15 Out 22  2015 Altera.icd
lrwxrwxrwx 1 root root 45 Abr 28 13:48 intel64.icd -> /opt/intel/opencl-1.2-4.5.0.8/etc/intel64.icd

注意缺少的 nvidia.icd

CL 和 GL - GL 有一个有效的链接...现在是红色的

ls -l /usr/local/include
total 4
lrwxrwxrwx 1 root root   31 Abr 28 12:48 CL -> /usr/local/cuda-7.5/include/CL/
lrwxrwxrwx 1 root root   26 Abr 27 11:44 GL -> /usr/include/nvidia-352/GL (IN RED COLOR - folder doesn't exist anymore)

.so 文件

ls -l /usr/local/lib/ | grep CL
lrwxrwxrwx 1 root root    40 Abr 27 11:45 libOpenCL.so -> /usr/lib/x86_64-linux-gnu/libOpenCL.so.1

已安装的包

dpkg --get-selections | grep nvidia
nvidia-340                  deinstall
nvidia-352                  install
nvidia-libopencl1-340               deinstall
nvidia-libopencl1-340-updates           deinstall
nvidia-libopencl1-352               deinstall
nvidia-libopencl1-352-updates           install
nvidia-modprobe                 install
nvidia-opencl-icd-340               deinstall
nvidia-opencl-icd-352               deinstall
nvidia-prime                    install
nvidia-settings                 install


dpkg --get-selections | grep opencl
nvidia-libopencl1-340               deinstall
nvidia-libopencl1-340-updates           deinstall
nvidia-libopencl1-352               deinstall
nvidia-libopencl1-352-updates           install
nvidia-opencl-icd-340               deinstall
nvidia-opencl-icd-352               deinstall
ocl-icd-libopencl1:amd64            deinstall
ocl-icd-libopencl1:i386             deinstall
opencl-headers                  install
unity-scope-openclipart             install

clinfo

clinfo 
Number of platforms:                 1
  Platform Profile:              FULL_PROFILE
  Platform Version:              OpenCL 1.2 LINUX
  Platform Name:                 Intel(R) OpenCL
  Platform Vendor:               Intel(R) Corporation
  Platform Extensions:               cl_khr_icd cl_khr_global_int32_base_atomics cl_khr_global_int32_extended_atomics cl_khr_local_int32_base_atomics cl_khr_local_int32_extended_atomics cl_khr_byte_addressable_store cl_khr_spir cl_intel_exec_by_local_thread cl_khr_depth_images cl_khr_3d_image_writes cl_khr_fp64 


  Platform Name:                 Intel(R) OpenCL
Number of devices:               1
  Device Type:                   CL_DEVICE_TYPE_CPU
  Device ID:                     32902
  Max compute units:                 4
  Max work items dimensions:             3
    Max work items[0]:               8192
    Max work items[1]:               8192
    Max work items[2]:               8192
  Max work group size:               8192
  Preferred vector width char:           1
  Preferred vector width short:          1
  Preferred vector width int:            1
  Preferred vector width long:           1
  Preferred vector width float:          1
  Preferred vector width double:         1
  Native vector width char:          16
  Native vector width short:             8
  Native vector width int:           4
  Native vector width long:          2
  Native vector width float:             8
  Native vector width double:            4
  Max clock frequency:               1800Mhz
  Address bits:                  64
  Max memory allocation:             2040185856
  Image support:                 Yes
  Max number of images read arguments:       480
  Max number of images write arguments:      480
  Max image 2D width:                16384
  Max image 2D height:               16384
  Max image 3D width:                2048
  Max image 3D height:               2048
  Max image 3D depth:                2048
  Max samplers within kernel:            480
  Max size of kernel argument:           3840
  Alignment (bits) of base address:      1024
  Minimum alignment (bytes) for any datatype:    128
  Single precision floating point capability
    Denorms:                     Yes
    Quiet NaNs:                  Yes
    Round to nearest even:           Yes
    Round to zero:               No
    Round to +ve and infinity:           No
    IEEE754-2008 fused multiply-add:         No
  Cache type:                    Read/Write
  Cache line size:               64
  Cache size:                    262144
  Global memory size:                8160743424
  Constant buffer size:              131072
  Max number of constant args:           480
  Local memory type:                 Global
  Local memory size:                 32768
  Error correction support:          0
  Unified memory for Host and Device:        1
  Profiling timer resolution:            1
  Device endianess:              Little
  Available:                     Yes
  Compiler available:                Yes
  Execution capabilities:                
    Execute OpenCL kernels:          Yes
    Execute native function:             Yes
  Queue properties:              
    Out-of-Order:                Yes
    Profiling :                  Yes
  Platform ID:                   0x1659390
  Name:                             Intel(R) Core(TM) i5-3337U CPU @ 1.80GHz
  Vendor:                    Intel(R) Corporation
  Device OpenCL C version:           OpenCL C 1.2 
  Driver version:                1.2.0.8
  Profile:                   FULL_PROFILE
  Version:                   OpenCL 1.2 (Build 8)
  Extensions:                    cl_khr_icd cl_khr_global_int32_base_atomics cl_khr_global_int32_extended_atomics cl_khr_local_int32_base_atomics cl_khr_local_int32_extended_atomics cl_khr_byte_addressable_store cl_khr_spir cl_intel_exec_by_local_thread cl_khr_depth_images cl_khr_3d_image_writes cl_khr_fp64 

所以...

如何让 NVIDIA gpu 也显示为 OPENCL 1.2(或更高版本)平台?集成英特尔显卡怎么样? AMD 库可以与我的硬件一起使用吗? 为什么大部分的nvidia包都标记为deinstall

【问题讨论】:

ps.:我确实有运行 NVIDIA 板 sudo prime-select nvidia ps.:我在 \usr\share\nvidia-352\ 中没有 *.icd 文件。但我之前在\etc\OpenCL\vendors 文件夹中有一些链接到 nvidia-331 的东西。这可能使我能够使用 OpenCL 1.1 【参考方案1】:

如前所述,需要三件事:

来自https://wiki.tiker.net/OpenCLHowTo

ICD 加载程序包:(您只需要其中一个) ICD 封装 标题包

因此对于 Intel CPU 和 NVIDIA GPU

ICD 加载器包: ocl-icd-libopencl1 ICD 包 已安装Intel OpenCL runtime nvidia-opencl-icd-352 标头的包 opencl 头文件

然而,要让它工作,有必要确保包被dpkg --get-selections | grep opencl标记为安装

sudo apt-get install --reinstall nvidia-opencl-icd-352 opencl-headers ocl-icd-libopencl1

除此之外,您还必须确保 intel64.icd 和 nvidia.icd 位于 /etc/OpenCL/vendors (ls -l /etc/OpenCL/vendors) 中。

也就是说,我必须将 intel64.icd 链接到:

cd /etc/OpenCL/vendors/
sudo ln -s /opt/intel/opencl-1.2-X.X.X.X/etc/intel64.icd

而且,由于 nvidia.icd 不在文件夹中(即使在安装了正确的包之后),我不得不将其解压缩并手动从 deb 包中移动

dpkg -x /var/cache/apt/archives/nvidia-opencl-icd-352_352.63-0ubuntu0.14.04.1_amd64.deb ~/tempfolder
sudo mv ~/tempfolder/etc/OpenCL/vendors/nvidia.icd /etc/OpenCL/vendors/nvidia.icd
rm -r ~/tempfolder

最后,确保 nvidia 是活跃的 GPU

sudo prime-select nvidia
sudo reboot -r now

安装并执行 clinfo,两个平台都会出现。

clinfo 
Number of platforms:                 2
  Platform Profile:              FULL_PROFILE
  Platform Version:              OpenCL 1.2 CUDA 7.5.23
  Platform Name:                 NVIDIA CUDA
  Platform Vendor:               NVIDIA Corporation
  Platform Extensions:               cl_khr_byte_addressable_store cl_khr_icd cl_khr_gl_sharing cl_nv_compiler_options cl_nv_device_attribute_query cl_nv_pragma_unroll cl_nv_copy_opts 
  Platform Profile:              FULL_PROFILE
  Platform Version:              OpenCL 1.2 LINUX
  Platform Name:                 Intel(R) OpenCL
  Platform Vendor:               Intel(R) Corporation
  Platform Extensions:               cl_khr_icd cl_khr_global_int32_base_atomics cl_khr_global_int32_extended_atomics cl_khr_local_int32_base_atomics cl_khr_local_int32_extended_atomics cl_khr_byte_addressable_store cl_khr_spir cl_intel_exec_by_local_thread cl_khr_depth_images cl_khr_3d_image_writes cl_khr_fp64 

【讨论】:

我很惊讶您在启动 clinfo 时使用 optirun 能够获得 Nvidia 的 OpenCL。除了其他软件包之外,我还必须安装软件包 bumblebeebumblebee-nvidiaprimus。之后,运行optirun clinfo 会同时打印 Nvidia 平台和 CPU 平台。这是在 Ubuntu 15.10 上。更多说明请访问https://wiki.ubuntu.com/Bumblebee。 我打赌你的意思是“不使用optirun”。使用上述配置,在# prime-select nvidia 之后,没有安装 bumblebee,nvidia 作为默认图形处理器运行。如果考虑到功耗(电池的续航时间只有一半),这可能会非常不方便,但是 - 我相信 - 它完全避免了英特尔板载显卡。 安装那些其他软件包吗?在运行clinfo 之前? dpkg --get-selections | grep opencldpkg --get-selections | grep nvidia 显示什么?正确的包是否标记为install?只是想知道...当您在没有optirun 的情况下运行clinfo 时会发生什么?是否显示板载显卡? 是的,我的意思是“不使用optirun”。我还没有开始安装英特尔的 GPU 运行时,我唯一拥有的其他 OpenCL 平台是 POCL。如果我在没有optirun 的情况下运行clinfo,那么我只能访问POCL 平台。标记为安装的包是:nvidia-opencl-icd-352nvidia-352ocl-icd-libopencl1:amd64ocl-icd-opencl-dev:amd64opencl-headersnvidia-modprobenvidia-primenvidia-settings 是的,如果您通过 bumblebee 使用它,这似乎是预期的行为。对我来说唯一的解释是,在安装 bumblebee 之前,您没有运行 prime-select nvidiareboot,因此您无权访问它的资源。我会在答案上更新它,因为这是必要的步骤。我也没有安装英特尔的 GPU 运行时。如果你能做到的话,你会很高兴在这里发布这个过程。

以上是关于在 Linux 中的多个平台上启用 OpenCL?如何处理 ICD 文件?的主要内容,如果未能解决你的问题,请参考以下文章

1 个 cpu 设备上 OpenCL 的并行性

Linux Arch OpenCL ICD 加载器 - Nvidia GPU、Intel CPU

OpenCL 平台术语

linux上opencl的问题

一台机器上的 OpenCL Nvidia 和 Intel 平台

如何在 Nvidia GPU 上调试 OpenCL?