完美解决windows系统raise RuntimeError(“Distributed package doesn‘t have NCCL “

Posted ai52learn

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了完美解决windows系统raise RuntimeError(“Distributed package doesn‘t have NCCL “相关的知识,希望对你有一定的参考价值。

在训练时出现如下问题: 

File "C:\\Users\\urser\\anaconda3\\lib\\site-packages\\torch\\distributed\\distributed_c10d.py", line 597, in _new_process_group_helper
    raise RuntimeError("Distributed package doesn't have NCCL "
RuntimeError: Distributed package doesn't have NCCL built in

从文字上来看,错误提示很明显了,没有NCCL

而windows不支持NCCL backend.

我们看下官方文档:

As of PyTorch v1.8, Windows supports all collective communications backend but NCCL, If the init_method argument of init_process_group() points to a file it must adhere to the following schema:

而要解决这个问题也很简单,不使用NCCL backend.就可以了。

只需要一行代码就可以解决问题。

获取解决方案:https://ai.52learn.online/11955

以上是关于完美解决windows系统raise RuntimeError(“Distributed package doesn‘t have NCCL “的主要内容,如果未能解决你的问题,请参考以下文章

如何解决“无法打开'raise.c'”错误?(VSCODE,LINUX)

windows10驱动精灵装完驱动后重启一直诊断修复中。。。完美解决

完美解决windows10磁盘占用100%并出现卡顿假死无反应

完美解决github访问速度慢

Window10升级遇到大坑错误代码:0xc000000e完美解决方案

[完美解决]如何在windows安装docker toolbox,使用tensorflow,Jupyter Notebook,各种问题的解决方案