可以为分布式 Tensorflow 虚拟化 NVIDIA GeForce GTX 1070 显卡吗?

Posted

技术标签:

【中文标题】可以为分布式 Tensorflow 虚拟化 NVIDIA GeForce GTX 1070 显卡吗?【英文标题】:Possible to virtualize NVIDIA GeForce GTX 1070 Graphics Card for Distributed Tensorflow? 【发布时间】:2019-02-15 19:01:50 【问题描述】:

我在 Intel Core i7-8700 CPU 上运行 Windows 10,配备 16 GB RAM、1 TB HDD 和专用NVIDIA GeForce GTX 1070 显卡。

我计划启动由我的 Windows 10 PC 托管的 3 个 Ubuntu 实例。 Ubuntu 将运行分布式 Tensorflow (tensorflow-gpu) 代码,该代码将使用 GPU 来训练神经网络。 (提一下,已经I've tried the setup on Windows but failed)

问。 我的 NVIDIA GPU 是否应该在这些虚拟机中虚拟化?

如果是,那么是否需要任何进一步的配置才能做到这一点?

如果没有,有什么建议可以为分布式 TensorFlow 构建这样的实验环境吗?

注意

我已经阅读了this post saying VMs can not pass through host GPU,特别是在 Windows 上的 CUDA。但是是否有任何可用的最新信息,最好是来自 NVIDIA 方面的信息?

谁能分享一些操作方法,以便(可能)在 Windows 上的 ESXI 设置中虚拟化 GPU?好像有几个人在说话here that its possible and done,虽然not officially supported by NVIDIA。

另外,有人成功实现this suggested solution for GPU pass through on Debian-based系统吗?

谢谢。

【问题讨论】:

我认为您的装备功率不足。这是一个相当便宜的配置:/ How to install tensorflow GPU version on VirtualBox Ubuntu OS. And host OS is windows 10的可能重复 感谢@Simo,我了解它非常基础,我不希望在生产中运行它。我很想知道在技术上是否可以虚拟化这张显卡? @Simo 也许不适合认真的工作,但足以开始 在带有 Windows 主机的虚拟化操作系统中,不支持将 GPU 用于 TensorFlow(Nvidia 不支持,例如参见 here)。您可以拥有的最接近的东西是具有启用 GPU 的 Docker 实例的 Linux 主机,使用 nvidia-docker(不完全是虚拟机,但可能足够接近)。 【参考方案1】:

我会考虑@jdehesa 的回答,因为目前似乎没有办法在 Windows 上为 Tensorflow 虚拟化 GPU。感谢@jdehesa

【讨论】:

所以我认为他应该写出扩大他的评论的答案。

以上是关于可以为分布式 Tensorflow 虚拟化 NVIDIA GeForce GTX 1070 显卡吗?的主要内容,如果未能解决你的问题,请参考以下文章

经验 | Pytorch还是Tensorflow?英伟达工程师帮你总结了

为啥 Tensorflow 1.11.0 返回 CUDA_ERROR_NOT_SUPPORTED?

在 windows 上使用 tensorflow 时,GPU 大部分时间都处于空闲状态

TensorFlow如何入门?

当Spark遇上TensorFlow分布式深度学习框架原理和实践

当Spark遇上TensorFlow分布式深度学习框架原理和实践