解决Google colab上安装GPU版本mxnet报错:libnvrtc.so.11.2: cannot open shared object file: No such file...

Posted 叶庭云

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了解决Google colab上安装GPU版本mxnet报错:libnvrtc.so.11.2: cannot open shared object file: No such file...相关的知识,希望对你有一定的参考价值。

文章目录


一、问题


二、解决方法

查看 NVIDIA_CUDA 版本,这里有有个坑:!nvidia-smi方法查看版本为11.2,而 !nvcc --version 方法查看版本为11.1。

!nvidia-smi

!nvcc --version

安装 11.1 版本的会报错:

!pip install mxnet-cu111

而安装 11.2 版本,报错如下:

!pip install mxnet-cu112

!find /usr/ -name "libnvrtc*"


发现根本没有libnvrtc.so.11.2,难怪报错!网上查阅了很多提问和别人的记录,发现也不怎么管用啊,那些文章链接贴在文末了。

# 卸载mxnet-cu112
!pip uninstall mxnet-cu112
# 安装mxnet-cu110
!pip install mxnet-cu110


成功解决了报错!如上图所示。接下来安装上 GluonTS 时间序列预测库,来测试一波。

!pip install -U pydantic
!pip install gluonts

运行有时候会报如下错误,在 StackOverflow 找到了解决方法。

Colab有时会为您的实例提供K80 GPU,有时提供T4 GPU,有时可能还会提供其他GPU。torch/mxnet/TF的最新版本将在 T4 GPU 上运行。它们不能在 K80 上运行,因为他们已经放弃了对旧 K80 GPU(计算能力3.7)的支持。您可以尝试重新启动 Colab 实例,看看是否得到了 T4(实际经验,早上挺容易获得T4 GPU),或者可以尝试找到这些框架的旧版本,它们仍然支持K80。重启了一波,可以跑模型了:

用 Temporal Fusion Transformer 跑了个时间序列预测,效果很Nice!本地 CPU 跑可能要 40min 左右,GPU 大约 8 分钟就跑完。

效果也挺好!如上图所示。


参考了:

以上是关于解决Google colab上安装GPU版本mxnet报错:libnvrtc.so.11.2: cannot open shared object file: No such file...的主要内容,如果未能解决你的问题,请参考以下文章

可以在google colab上安装cupy吗?

google Colab 使用教程 免费GPU google Colaboratory 上运行 pytorch tensorboard

01google Colab 使用教程 免费GPU google Colaboratory 上运行 pytorch tensorboard

在 Google Colab 上请求特定类型的 GPU

Google Colab GPU 环境搭建

如何在 Google Colab GPU 中安装 CUDA