VTune:使用 3 个以上端口的高价值是好是坏
Posted
技术标签:
【中文标题】VTune:使用 3 个以上端口的高价值是好是坏【英文标题】:VTune: Is high value for 3+ ports utilized good or bad 【发布时间】:2021-06-29 17:50:27 【问题描述】:在 VTune 分析中,gui 应用程序会针对指标“使用的 3 个以上端口的周期”的高值显示一个危险信号。鉴于使用了更多端口,我认为这应该是一个好主意。为什么/什么时候会是一件坏事?
使用的应用程序是一个简单的矩阵矩阵乘法应用程序。
【问题讨论】:
【参考方案1】:我没有专门使用 VTune,但这可能意味着这是瓶颈(所以我想这就是它选择以红色显示的原因)。是的,这通常是您对 matmul 的要求:保持执行单元的供给。
在其他算法的一般情况下,有时算法优化是可能的,可能会以更高的延迟或较小的查找表换取更少的微指令。将其显示为红色可能会提示您寻找此类优化,因此 VTune 以这种方式工作是有意义的。
在您的情况下,如果使用的这 3 个以上端口不都是 2x 加载/2x FMA / 存储,那么您可能希望的最好结果可能是减少循环开销。
【讨论】:
以上是关于VTune:使用 3 个以上端口的高价值是好是坏的主要内容,如果未能解决你的问题,请参考以下文章