分析结果不会出现在事件/指标摘要模式 nvprof

Posted

技术标签:

【中文标题】分析结果不会出现在事件/指标摘要模式 nvprof【英文标题】:Profiling Result doesn't appear in event/metric summary mode nvprof 【发布时间】:2016-06-23 17:05:13 【问题描述】:

根据nvprof的事件/摘要模式documentation,输出如下:

==6461== Profiling application: matrixMul 
==6461== Profiling result: 
==6461== Event result: 
//The outputs 

==6461== Metric result: 
//The outputs

default 应显示Profiling result 下 API 调用和内核的延迟、百分比等。所以有两个问题:

    为什么Profiling Result 下没有任何输出? 如何让nvprof 也输出Profiling Result

【问题讨论】:

有很多内核调用的大型程序? @Eric:是的。答案很全面。 【参考方案1】:

为什么 Profiling Result 下没有任何输出?

根据documentation,它声明:

nvprof 以下列一种模式运行。

这些模式是:

3.1.1 摘要模式(默认) 3.1.2 GPU-Trace 和/或 API-Trace 模式 3.1.3 事件/指标汇总模式 3.1.4 事件/指标跟踪模式

您的摘录信息来自3.1.3 事件/指标摘要模式。当您处于此模式时,您不处于任何其他模式,并且其他模式的数据收集(和输出)描述不适用。

如何让nvprof 也输出Profiling Result

如果您想基于每个内核捕获指标信息,请使用 3.1.4 事件/指标跟踪模式。然后输出将出现在Profiling Result 部分。

对于其他组合,不可能让nvprof 在一次运行中显示任意分析数据集合。如果您需要仅在特定模式下可用的输出,则需要在该模式下运行才能获得该输出。您可能需要多次运行nvprof 以获取您想要收集的所有输出信息或数据。 nvvp(可视化分析器)执行此操作(即,将在后台多次运行 nvprof)以便为给定的应用程序视图显示更大范围的数据。

【讨论】:

以上是关于分析结果不会出现在事件/指标摘要模式 nvprof的主要内容,如果未能解决你的问题,请参考以下文章

如何仅通过 nvprof 分析 CUDA 应用程序

为啥 nvprof 没有浮点除法运算的指标?

“nvprof”的结果中的“GPU 活动”和“API 调用”有啥区别?

分析一个CUDA矩阵加法代码,使用nvprof:代码API配置文件,内核没有

分析一个CUDA矩阵加法代码,使用nvprof:代码API配置文件,内核没有

LoadRunner性能测试结果分析