所需的最低 Cuda 能力为 3.5

Posted

技术标签:

【中文标题】所需的最低 Cuda 能力为 3.5【英文标题】:The minimum required Cuda capability is 3.5 【发布时间】:2016-02-12 14:50:39 【问题描述】:

在 g2.2xlarge EC2 实例上安装 TensorFlow 及其依赖项后,我尝试从入门页面运行 MNIST 示例:

python tensorflow/models/image/mnist/convolutional.py

但我收到以下警告:

I tensorflow/core/common_runtime/gpu/gpu_device.cc:611] Ignoring gpu device 
(device: 0, name: GRID K520, pci bus id: 0000:00:03.0) with Cuda compute 
capability 3.0. The minimum required Cuda capability is 3.5.

这是一个硬性要求吗?我有没有机会在 TensorFlow 的一个分支中发表评论?能够在 AWS 中训练模型真是太好了。

【问题讨论】:

我们只测试了计算能力 >= 3.5 的 TensorFlow。有几个人请求支持 3.0,我们正在关注它:在此处查看关于 GitHub 问题的讨论github.com/tensorflow/tensorflow/issues/25 【参考方案1】:

official installation page 中有一个部分指导您启用 Cuda 3,但您需要从源代码构建 Tensorflow。

$ TF_UNOFFICIAL_SETTING=1 ./configure

# Same as the official settings above

WARNING: You are configuring unofficial settings in TensorFlow. Because some
external libraries are not backward compatible, these settings are largely
untested and unsupported.

Please specify a list of comma-separated Cuda compute capabilities you want to
build with. You can find the compute capability of your device at:
https://developer.nvidia.com/cuda-gpus.
Please note that each additional compute capability significantly increases
your build time and binary size. [Default is: "3.5,5.2"]: 3.0

Setting up Cuda include
Setting up Cuda lib64
Setting up Cuda bin
Setting up Cuda nvvm
Configuration finished

【讨论】:

【参考方案2】:

目前官方仅支持计算能力 >= 3.5 的 GPU。然而,GitHub 用户@infojunkie 提供了a patch,这使得将 TensorFlow 与具有计算能力 3.0 的 GPU 结合使用成为可能。

官方修复正在开发中。同时,查看GitHub issue 上的讨论以添加此支持。

【讨论】:

链接已损坏。【参考方案3】:

有一个简单的技巧。您甚至不必从源代码构建 TF。

在文件tensorflow\python\_pywrap_tensorflow.pyd 中有两个正则表达式3\.5.*5\.2。只需将3.5 都替换为3.0

在 Windows 10、Anaconda 4.2.13、Python 3.5.2、TensorFlow 0.12、CUDA 8、NVidia GTX 660m(CUDA 上限 3.0)上测试。

【讨论】:

该文件在哪里?我只看到一个 _pywrap_tensorflow_internal 文件 @theninjagreg 根据***.com/a/44520245/4501221,您可以按照 _pywrap_tensorflow_internal.pyd 文件的过程进行操作。我的解决方案是 TF 0.12(现在真的很古老),并且该文件可能在下一个版本中被重命名,但是这个技巧应该仍然有效。

以上是关于所需的最低 Cuda 能力为 3.5的主要内容,如果未能解决你的问题,请参考以下文章

CUDA 计算能力 1.0 比 3.5 快

CUDA 计算能力要求

在 WordPress 中查看高级自定义字段所需的能力

使用动态并行回退编译 CUDA - 多种架构/计算能力

如何针对 cublas_device 编译/链接具有不同计算能力的代码?

Java 8 & 缺少所需的能力 Require-Capability: osgi.ee;过滤器="(&(osgi.ee=JavaSE)(版本=1.8))"