块中的 CUDA 最大线程数
Posted
技术标签:
【中文标题】块中的 CUDA 最大线程数【英文标题】:CUDA max threads in a block 【发布时间】:2011-07-01 01:43:11 【问题描述】:我对编程指南感到困惑。它声明如下:
maxThreadsPerBlock: 512 maxThreadsDim: 512, 512, 64。当一个块中的最大线程数可以是 512 时,最大线程尺寸如何是 512*512*64 ?
【问题讨论】:
***.com/questions/2392250/… 谢尔盖所说的加:developer.download.nvidia.com/compute/cuda/3_1/toolkit/docs/… 【参考方案1】:X 方向的最大线程数:512(计算能力为 1024 >= 2.0)
Y 方向的最大线程数:512(计算能力为 1024 >= 2.0)
Z方向最大线程数:64
因此您可以启动以下块配置(计算能力 >= 2.0 显示在括号中)
512 x 1 x 1 (1024 x 1 x 1)
128 x 2 x 2 (256 x 2 x 2)
1 x 512 x 1 (1 x 1024 x 1)
1 x 8 x 64 (2 x 8 x 64)
2 x 4 x 64 (4 x 4 x 64)
等等。
一个块中的线程总数不得超过 512(计算能力 = 2.0)。
【讨论】:
感谢您的详细解释 参考:docs.nvidia.com/cuda/cuda-c-programming-guide/…以上是关于块中的 CUDA 最大线程数的主要内容,如果未能解决你的问题,请参考以下文章