块中的 CUDA 最大线程数

Posted

技术标签:

【中文标题】块中的 CUDA 最大线程数【英文标题】:CUDA max threads in a block 【发布时间】:2011-07-01 01:43:11 【问题描述】:

我对编程指南感到困惑。它声明如下:

maxThreadsPerBlock: 512 maxThreadsDim: 512, 512, 64。

当一个块中的最大线程数可以是 512 时,最大线程尺寸如何是 512*512*64 ?

【问题讨论】:

***.com/questions/2392250/… 谢尔盖所说的加:developer.download.nvidia.com/compute/cuda/3_1/toolkit/docs/… 【参考方案1】:

X 方向的最大线程数:512(计算能力为 1024 >= 2.0)

Y 方向的最大线程数:512(计算能力为 1024 >= 2.0)

Z方向最大线程数:64

因此您可以启动以下块配置(计算能力 >= 2.0 显示在括号中)

512 x 1 x 1 (1024 x 1 x 1)

128 x 2 x 2 (256 x 2 x 2)

1 x 512 x 1 (1 x 1024 x 1)

1 x 8 x 64 (2 x 8 x 64)

2 x 4 x 64 (4 x 4 x 64)

等等。

一个块中的线程总数不得超过 512(计算能力 = 2.0)。

【讨论】:

感谢您的详细解释 参考:docs.nvidia.com/cuda/cuda-c-programming-guide/…

以上是关于块中的 CUDA 最大线程数的主要内容,如果未能解决你的问题,请参考以下文章

单个 CUDA 内核可以启动的最大线程数

可以在 CUDA 上启动的最大线程数

CUDA - 多处理器、Warp 大小和每个块的最大线程数:确切的关系是啥?

CPU 超过 GPU

你能以编程方式知道 GPU 中每个块的最大块数和线程数吗?

深度学习部署(十三): CUDA RunTime API thread_layout线程布局