完美解决windows系统raise RuntimeError(“Distributed package doesn‘t have NCCL “
Posted ai52learn
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了完美解决windows系统raise RuntimeError(“Distributed package doesn‘t have NCCL “相关的知识,希望对你有一定的参考价值。
在训练时出现如下问题:
File "C:\\Users\\urser\\anaconda3\\lib\\site-packages\\torch\\distributed\\distributed_c10d.py", line 597, in _new_process_group_helper
raise RuntimeError("Distributed package doesn't have NCCL "
RuntimeError: Distributed package doesn't have NCCL built in
从文字上来看,错误提示很明显了,没有NCCL
而windows不支持NCCL backend.
我们看下官方文档:
As of PyTorch v1.8, Windows supports all collective communications backend but NCCL, If the init_method argument of init_process_group()
points to a file it must adhere to the following schema:
而要解决这个问题也很简单,不使用NCCL backend.就可以了。
只需要一行代码就可以解决问题。
以上是关于完美解决windows系统raise RuntimeError(“Distributed package doesn‘t have NCCL “的主要内容,如果未能解决你的问题,请参考以下文章
如何解决“无法打开'raise.c'”错误?(VSCODE,LINUX)
windows10驱动精灵装完驱动后重启一直诊断修复中。。。完美解决
完美解决windows10磁盘占用100%并出现卡顿假死无反应
Window10升级遇到大坑错误代码:0xc000000e完美解决方案
[完美解决]如何在windows安装docker toolbox,使用tensorflow,Jupyter Notebook,各种问题的解决方案