Google Colab Error : Failed to get convolution algorithm。这可能是因为 cuDNN 初始化失败

Posted

技术标签:

【中文标题】Google Colab Error : Failed to get convolution algorithm。这可能是因为 cuDNN 初始化失败【英文标题】:Google Colab Error : Failed to get convolution algorithm.This is probably because cuDNN failed to initialize 【发布时间】:2019-04-24 03:32:31 【问题描述】:

UnknownError:获取卷积算法失败。这可能是因为 cuDNN 初始化失败,所以请尝试查看上面是否打印了警告日志消息。

 [[node conv2d_1/convolution = Conv2D[T=DT_FLOAT, data_format="NCHW", dilations=[1, 1, 1, 1], padding="VALID", strides=[1, 1, 1, 1], use_cudnn_on_gpu=true, _device="/job:localhost/replica:0/task:0/device:GPU:0"](zero_padding2d_1/Pad, conv2d_1/kernel/read)]]
 [[node metrics/acc/Mean/_255 = _Recv[client_terminated=false, recv_device="/job:localhost/replica:0/task:0/device:CPU:0", send_device="/job:localhost/replica:0/task:0/device:GPU:0", send_device_incarnation=1, tensor_name="edge_563_metrics/acc/Mean", tensor_type=DT_FLOAT, _device="/job:localhost/replica:0/task:0/device:CPU:0"]()]]

我在 Google colab 上遇到此错误。 Colab 的 tensorflow 版本是 1.12.0。

我找不到任何解决方案。原因都是本地系统。

【问题讨论】:

你能分享一个能重现你观察到的错误的独立笔记本吗? 你是如何解决这个问题的? 我收到了同样的错误。似乎该错误仅在您分配 GPU 时显示。使用 CPU 训练模型时没有收到错误消息。 【参考方案1】:

对于未来的路人来说,这看起来像是 Colab 人员正在解决的服务错误。

详情请见the GitHub issue。

更新:此问题已在服务端修复。详情:https://github.com/googlecolab/colabtools/issues/384#issuecomment-451001849

【讨论】:

没有解决。得到这个讨厌的错误。

以上是关于Google Colab Error : Failed to get convolution algorithm。这可能是因为 cuDNN 初始化失败的主要内容,如果未能解决你的问题,请参考以下文章

如何在 Google Colab 上安装 nvidia apex

CHECK(调用)函数在Google Colab中出错[重复]

使用 Colab 的 TensorFlow 依赖项问题

如何修复 Colab 上的“错误:pytorch3d 构建***失败”错误?

Google Colab 运行速度比 Jupyterlab 快,Google Colab 为啥以及如何运行?

在 VM 引擎中导入 google.colab 不会让我在 Google Colab 中运行 Jupyter Notebook?