英特尔 MIC - 固有向量元素的总和

Posted

技术标签:

【中文标题】英特尔 MIC - 固有向量元素的总和【英文标题】:Intel MIC - sum of intrinsic vector elements 【发布时间】:2015-11-26 18:17:11 【问题描述】:

我有一个 __m512d 内在向量,我需要他的元素的总和。有什么简单的方法可以做到这一点?我专注于计算性能,所以我需要快速执行此操作。我的内在知识不足以自己做,所以我需要你的帮助。

谢谢:)

【问题讨论】:

顺便说一句,this question 有点相关。 【参考方案1】:

我想下面的内在应该可以帮助你:

double _mm512_reduce_add_pd (__m512d a)

附:您可以自己在the guide 中寻找有用的内在函数。

【讨论】:

我在这个网站上寻找,但我没有看到这个。非常感谢。

以上是关于英特尔 MIC - 固有向量元素的总和的主要内容,如果未能解决你的问题,请参考以下文章

英特尔至强融核上的 MKL 3D 双精度复数 FFT

英特尔 Fortran 向量化:向量循环成本高于标量

在 Powerpc 上,是不是有任何等效于英特尔的 movemask 内在函数?

使用 task_group 的英特尔线程构建模块性能不佳(新用户)

试图理解 _mm256_permute2x128_si256 的英特尔内在指南解释

英特尔 SSE 的斜坡功能