如何修复:horovod.run.common.util.network.NoValidAddressesFound

Posted

技术标签:

【中文标题】如何修复:horovod.run.common.util.network.NoValidAddressesFound【英文标题】:How to fix : horovod.run.common.util.network.NoValidAddressesFound 【发布时间】:2019-08-20 23:05:22 【问题描述】:

我正在尝试使用 2 个 nvidia docker 进行分布式学习。当我尝试使用 2 台主机时,它不起作用。我该如何解决这个问题?

我试过这个命令:

horovodrun -np 3 -H localhost:1 -p 12345  python keras_mnist_advanced.py

它有效,但是当我尝试时:

horovodrun -np 3 -H localhost:1,192.168.0.20:2 -p 12345  python keras_mnist_advanced.py

我收到了这个错误:

启动 horovodrun 任务功能不成功: horovod.run.common.util.network.NoValidAddressesFound:无法连接到任何地址上的 horovodrun 任务服务 #1:'lo': [('127.0.0.1', 30871)], 'docker0': [ ('172.17.0.1', 30871)], 'enp0s31f6': [('192.168.0.20', 30871)]

【问题讨论】:

【参考方案1】:

请查看存储库中提出的这些问题:

1) https://github.com/horovod/horovod/issues/975

2)https://github.com/horovod/horovod/issues/971

【讨论】:

以上是关于如何修复:horovod.run.common.util.network.NoValidAddressesFound的主要内容,如果未能解决你的问题,请参考以下文章

如何修复漏洞

如何修复WMI

PHP网站漏洞怎么修复 如何修补网站程序代码漏洞

如何修复这些漏洞? (npm audit fix 无法修复这些漏洞)

如何修复AppScan漏洞

如何在DOS环境下修复系统