了解 tensorflow 分析结果

Posted

技术标签:

【中文标题】了解 tensorflow 分析结果【英文标题】:Understanding tensorflow profiling results 【发布时间】:2017-04-12 14:32:00 【问题描述】:

This example 展示了如何分析 tensorflow 程序。我已经使用这个工具来分析我的程序,一个简单的 LSTM。结果显示为:

/gpu:0/stream:all Compute(pid 5)

/job:localhost/replica:0/task:0/gpu:0 Compute(pid 3)

我的问题:

a)每一行的含义是什么。

b)特别是/gpu:0/stream:all Compute(pid 5)/job:localhost/replica:0/task:0/gpu:0 Compute(pid 3) 之间的区别。

c)为什么它们的执行时间不同,即0.072ms0.094ms

【问题讨论】:

【参考方案1】:

以下是一位工程师的最新消息:

“/gpu:0/stream:*”时间线是 CUDA 内核执行时间的硬件跟踪。

'/gpu:0' 行是 TF 软件设备在 CUDA 流上对操作进行排队(通常花费几乎为零的时间)

【讨论】:

那么,/gpu:0 行中的数字包括 gpu 内核启动时间?

以上是关于了解 tensorflow 分析结果的主要内容,如果未能解决你的问题,请参考以下文章

Tensorflow - 使用时间线进行分析 - 了解限制系统的因素

观点 | TensorFlow sucks,有人吐槽TensorFlow晦涩难用

TensorFlow学习笔记--网络模型的保存和读取

ArXiv 中最受欢迎的开源框架,TensorFlow 排名第一!

模块“tensorflow”没有属性“GPUOptions”

无法安装旧版本的 tensorflow