CUDA 计算能力之间有啥区别?

Posted

技术标签:

【中文标题】CUDA 计算能力之间有啥区别?【英文标题】:What are the differences between CUDA compute capabilities?CUDA 计算能力之间有什么区别? 【发布时间】:2012-06-13 06:12:15 【问题描述】:

计算能力 2.0 比 1.3、2.1 比 2.0 和 3.0 比 2.1 增加了什么?

【问题讨论】:

The relevant section of the wikipedia article 的概述相当不错。 我投票决定重新开放。我认为这个问题是关于主题的。 这个问题绝对是话题。投票重新开放。 现在 cuda 计算能力 6.1(以及 6.0、5.2)已经发布,我想了解一下新功能。投票重新打开问题以启用新答案和编辑。这个问题绝对是主题,并且对编程有很大影响:一些 CUDA 框架对最小计算能力设置了限制。 【参考方案1】:

计算能力指定不同的架构。一般来说,较新的架构运行 CUDA 程序和图形的速度都比以前的架构快。但请注意,上一代的高端卡可能比后一代的低端卡更快。

来自 CUDA C 编程指南 (v6.0):

【讨论】:

谢谢,这有帮助。很遗憾,他们将计算线和图形线分开了,因为我怀疑这会使计算线变得更加昂贵,因为它们不会受益于大众图形市场所带来的成本优势。 考虑到这一点,即使您的卡支持 3.0,为较低的计算能力(例如 1.1 而不是 3.0)进行编译是否有意义 - 它会运行得更快吗? @user1191840:如果为旧架构编译,为什么它会运行得更快? 不知道为什么,但我认为这就是我观察到的,但还没有回去测试它。我认为这可能只是因为 nvidia 试图限制以后(geforce)卡的计算性能,这可能与计算版本有关。 更多更新信息请参考Compute Capability的官方参考。

以上是关于CUDA 计算能力之间有啥区别?的主要内容,如果未能解决你的问题,请参考以下文章

nvidia/cuda 公开源中的devel和runtime有啥区别

CUDA 计算能力要求

天基计算和云计算有啥区别

Tensorflow:Cuda 计算能力 3.0。所需的最低 Cuda 能力为 3.5

gtx 1660 的cuda计算能力是多少

cuda 多计算能力支持