detectron2安装出现Kernel not compiled with GPU support 报错信息

Posted 2020-11-22 marsggbo

tags:

篇首语：本文由小常识网(cha138.com)小编为大家整理，主要介绍了detectron2安装出现Kernel not compiled with GPU support 报错信息相关的知识，希望对你有一定的参考价值。

在安装使用detectron2的时候碰到Kernel not compiled with GPU support 问题，前后拖了好久都没解决，现总结一下以备以后查阅。

不想看心路历程的可以直接跳到最后一小节，哈哈哈。

environment

因为我使用的是实验室的服务器，所以很多东西没法改，我的cuda环境如下：

ubuntu
nvcc默认版本是9.2
nvidia-smi版本又是10.0的

我之前一直没搞清楚这nvcc和nvidia-smi版本为什么可以不一样，想了解原因的可以看一下我之前的文章显卡，显卡驱动,nvcc, cuda driver,cudatoolkit,cudnn到底是什么？。

reproduce

我一般都用Anaconda来安装pytorch，第一次安装的时候使用的如下命令安装的：

conda create -n myenv python=3.7
conda activate myenv
conda install pytorch torchvision cudatoolkit=10.1 -c pytorch

按理说这个命令会给myenv环境安装cuda编译器和驱动等，但是在运行代码的时候还是会出现标题中的报错信息。我猜可能是因为detectron2在build的时候使用的是/usr/local路径下的cuda compiler（即nvcc），而不是我的虚拟幻境下的compiler。所以我重新安装了cuda-9.2版本的pytorch，

conda install pytorch torchvision cudatoolkit=9.2 -c pytorch

但是运行的时候还是出现同样的错误，这更加说明detectron2的编译使用的不是虚拟环境路径下的编译器，所以我在想是不是我没有正确设置系统路径下的CUDA，于是我用官方提供的检验代码查看CUDA路径：

python -c 'import torch; from torch.utils.cpp_extension import CUDA_HOME; print(torch.cuda.is_available(), CUDA_HOME)'

输出的结果是

true /usr/local

可以看到CUDA_HOME对应的输出结果有问题，照理来说输出结果应该是/usr/local/cuda或者/usr/local/cuda-9.2之类的，于是我又查看了~/.bashrc文件，找到与CUDA有关的代码部分,发现我并没有设置CUDA_HOME这个环境变量，于是我做了如下修改：

# vim ~/.bashrc
export CUDA_HOME=/usr/local/cuda
export PATH=$PATH:/usr/local/cuda/bin
export LD_LIBRARY_PATH=$LD_LIBRARY_PATH:/usr/local/cuda/lib64:/usr/local/cuda/lib
export LIBRARY_PATH=$LIBRARY_PATH:/usr/local/cuda/lib64

之后souce一下

source ~/.bashrc

再运行python -c ‘import torch; from torch.utils.cpp_extension import CUDA_HOME; print(torch.cuda.is_available(), CUDA_HOME)‘输出的结果变为true /usr/local/cuda

此时Kernel not compiled with GPU support的问题就解决了，代码正常运行了。

总结

步骤总结

安装相关库

conda create -n myenv python=3.7
conda activate myenv
conda install pytorch torchvision cudatoolkit=9.2 -c pytorch
pip install opencv-python
pip install 'git+https://github.com/facebookresearch/fvcore'
pip install cython; pip install 'git+https://github.com/cocodataset/cocoapi.git#subdirectory=PythonAPI'

编译detectron2

python setup.py build develop

可能出现的问题即解决办法

出现标题中的错误的原因主要是因为你的cuda版本或者路径除了问题，你可以按照如下几个步骤排查可能是那个地方出了问题：

运行nvcc --version查看你的cuda编译器版本，那么你的pytorch-gpu也建议安装对应版本。当然如果你nvcc都没安装。。。那你就先找教程安装。
如果安装的pytorch版本和nvcc版本一致，你可以看一下你的CUDA路径是否在~/.bashrc中设置正确，参考的配置路径如下：

# vim ~/.bashrc
export CUDA_HOME=/usr/local/cuda
export PATH=$PATH:/usr/local/cuda/bin
export LD_LIBRARY_PATH=$LD_LIBRARY_PATH:/usr/local/cuda/lib64:/usr/local/cuda/lib
export LIBRARY_PATH=$LIBRARY_PATH:/usr/local/cuda/lib64

设置好后source ~/.bashrc,然后删除detectron2/build文件夹（如果你之前已经编译过一遍了），然后重新编译dete2tron2。

以上是关于detectron2安装出现Kernel not compiled with GPU support 报错信息的主要内容，如果未能解决你的问题，请参考以下文章

fedora25 安装virtualbox5.1 出现提示Kernel driver not installed (rc=-1908) 错误的解决方法

win8硬盘安装linux重启出现：kernel panic not syncing:attempted to kill init

为虚拟机安装xp os 过程中，出现ezboot kernel not found，怎么回事，如何解决，有经验的说

在fedora14下安装vmware 7.1.4 build-385536 出现C header files matching your running kernel were not found.

虚拟机安装问题希望高手指教，磁盘分区完后出现了 EZBOOT KERNEL NOT FOUND 是啥原因

detectron2报AttributeError: Attribute ‘evaluator_type‘ does not exist in the metadata of dataset(代码片段