Intel Xeon Phi 上每个时钟周期的乘法次数

Posted

技术标签:

【中文标题】Intel Xeon Phi 上每个时钟周期的乘法次数【英文标题】:Number of multiplications per clock cycle on Intel Xeon Phi 【发布时间】:2013-10-09 22:47:52 【问题描述】:

在英特尔至强融核中,每个内核有 32 个 512 位宽的向量寄存器。每个向量寄存器每个周期可以进行 16 次单精度浮点运算。并且可以在1个周期内完成2个操作(v-pipe 1个,u-pipe 1个)。

我想知道除了在向量寄存器中完成的向量乘法之外,在 1 个时钟周期内可以完成多少次标量乘法。

【问题讨论】:

【参考方案1】:

那里有一些误解。每个核心有 1 个矢量单元。寄存器存储值,它们不计算。因此,您可以在每个内核的每个周期发出 1 512 字节宽的向量操作。您也可以在 1 个周期内进行标量乘法。您不能同时发行两者。使用 u&v 管道,您可以发出一个向量或标量操作,然后在另一个管道中执行内存操作。您也可以在每个周期执行一个融合乘加 (MADD) 指令,这有效地为每个内核每个周期提供 2 个向量操作。

【讨论】:

谢谢。您能否分享一个链接,上面写着,每个核心每个周期 2 个向量操作可以在 Xeon Phi 中完成。而当我们说 2 个向量运算时,是不是意味着它们都是 512 bit 宽向量运算? @sssylvester 你不是说 FMA 而不是 MADD 吗?

以上是关于Intel Xeon Phi 上每个时钟周期的乘法次数的主要内容,如果未能解决你的问题,请参考以下文章

Intel Xeon E5430 有多少个 FPU?

intel xeon phi 常见错误记录

如何检测 Xeon Phi (Knights Landing)

如果在 Xeon Phi 上编译时不知道循环计数,则性能下降

在 xeon-phi 上引导自定义内核

使用 gcc 进行英特尔至强 phi 编程