Cupy add 在同一台机器上的不同环境中以不同的方式工作

Posted

技术标签:

【中文标题】Cupy add 在同一台机器上的不同环境中以不同的方式工作【英文标题】:cupy add working differently in different environments on same machine 【发布时间】:2020-09-10 10:15:11 【问题描述】:

我开始实现深度学习代码,这是我第一次使用深度学习、GPU 和 Cupy。我做了一个玩具示例,在同一台机器上的不同 python 环境中工作方式不同,我希望详细了解发生这种情况的原因和原因。

这是我的代码

import numpy as np
import cupy as cp

X = 150000
Y = 100
Z = 79

shape_pca_mean = np.random.rand(X, 1)

shape_pca_basis = np.random.rand(X, Y)
shape_pca_basis_gpu = cp.asarray(shape_pca_basis)

shape_params = np.random.rand(Y, 1)
shape_params_gpu = cp.asarray(shape_params)

shape_x = shape_pca_basis_gpu.dot(shape_params_gpu)

exp_pca_basis = np.random.rand(X, Z)
exp_pca_basis_gpu = cp.asarray(exp_pca_basis)

exp_params = np.random.rand(Z, 1)
exp_params_gpu = cp.asarray(exp_params)

exp_x = exp_pca_basis_gpu.dot(exp_params_gpu)

a = shape_pca_mean + cp.asnumpy(exp_x) + cp.asnumpy(shape_x)

我有 2 个 Python 环境。一个全局 python3 和一个本地 virtualenv python 3。它们都安装了相同版本的 NumPy、cupy、cupy-cuda110 和其他 python 库。上面的代码在两个环境中都运行良好。

但是,如果我在下面再添加一行,则 virtualenv python3 运行良好,但如果在全局 Python 上运行,则会出现以下错误。

b = cp.asarray(shape_pca_mean) + exp_x + shape_x

错误

$ python3 scratch.py
Traceback (most recent call last):
  File "scratch.py", line 18, in <module>
    a = cp.asarray(shape_pca_mean) + exp_x + shape_x
  File "cupy/core/core.pyx", line 968, in cupy.core.core.ndarray.__add__
  File "cupy/core/_kernel.pyx", line 951, in cupy.core._kernel.ufunc.__call__
  File "cupy/core/_kernel.pyx", line 974, in cupy.core._kernel.ufunc._get_ufunc_kernel
  File "cupy/core/_kernel.pyx", line 714, in cupy.core._kernel._get_ufunc_kernel
  File "cupy/core/_kernel.pyx", line 61, in cupy.core._kernel._get_simple_elementwise_kernel
  File "cupy/core/carray.pxi", line 196, in cupy.core.core.compile_with_cache
  File "/home/ppinazuredlvm1/.local/lib/python3.6/site-packages/cupy/cuda/compiler.py", line 298, in compile_with_cache
    extra_source, backend)
  File "/home/ppinazuredlvm1/.local/lib/python3.6/site-packages/cupy/cuda/compiler.py", line 352, in _compile_with_cache_cuda
    ls.add_ptr_data(ptx, 'cupy.ptx')
  File "cupy/cuda/function.pyx", line 230, in cupy.cuda.function.LinkState.add_ptr_data
  File "cupy/cuda/function.pyx", line 232, in cupy.cuda.function.LinkState.add_ptr_data
  File "cupy/cuda/driver.pyx", line 198, in cupy.cuda.driver.linkAddData
  File "cupy/cuda/driver.pyx", line 118, in cupy.cuda.driver.check_status
cupy.cuda.driver.CUDADriverError: CUDA_ERROR_INVALID_PTX: a PTX JIT compilation failed

如果有帮助,this cupy issue 中提供了有关我的系统和驱动程序等的更多详细信息。

这看起来不像是通常的驱动程序不兼容问题,好像是这种情况,上面的代码不会在任何环境上运行。

【问题讨论】:

【参考方案1】:

您可能同时安装了 cupy 和 cupy-cudaXXX,这会导致各种奇怪的问题。如果是这样,请移除 cupy 并坚持使用 wheel 版本。

【讨论】:

以上是关于Cupy add 在同一台机器上的不同环境中以不同的方式工作的主要内容,如果未能解决你的问题,请参考以下文章

weblogic(一个节点管理器控制来自两个不同域的两台机器)

当多个java程序在同一台机器上运行时

可以在同一台机器上安装两个不同版本的 Android Studio 吗?

如何在同一台机器上使用不同版本的 Qt?

具有不同.net版本的多个应用程序可以在同一台服务器机器上运行吗

如何让多个域名解析到同一台服务器上的不同网站