CUDA测量2个_syncthread()点之间的时间[重复]

Posted

技术标签:

【中文标题】CUDA测量2个_syncthread()点之间的时间[重复]【英文标题】:CUDA Measuring the time between 2 _syncthread() point [duplicate] 【发布时间】:2014-05-27 04:40:28 【问题描述】:

我搜索了一下,但我发现的所有东西都只能在 CPU 代码中进行注释,我如何测量内核内部在 1 个线程块的 2 个 _syncthread() 之间的部分时间?可能吗?

【问题讨论】:

【参考方案1】:

一种方法是使用clock()clock64 函数,如in the programming guide 所述。

clock64 上搜索 cuda 标签以获取其用法的更多示例。

【讨论】:

以上是关于CUDA测量2个_syncthread()点之间的时间[重复]的主要内容,如果未能解决你的问题,请参考以下文章

cuda基础---cuda通信机制

无法理解 __syncthreads()

简单直接的CUDA改造

中海达GPS怎么测量2个点之间的距离

等效于 CUDA 中的屏障(CLK_GLOBAL_MEM_FENCE)

Cuda 性能测量 - 经过时间返回零