英特尔 MIC - 固有向量元素的总和
Posted
技术标签:
【中文标题】英特尔 MIC - 固有向量元素的总和【英文标题】:Intel MIC - sum of intrinsic vector elements 【发布时间】:2015-11-26 18:17:11 【问题描述】:我有一个 __m512d 内在向量,我需要他的元素的总和。有什么简单的方法可以做到这一点?我专注于计算性能,所以我需要快速执行此操作。我的内在知识不足以自己做,所以我需要你的帮助。
谢谢:)
【问题讨论】:
顺便说一句,this question 有点相关。 【参考方案1】:我想下面的内在应该可以帮助你:
double _mm512_reduce_add_pd (__m512d a)
附:您可以自己在the guide 中寻找有用的内在函数。
【讨论】:
我在这个网站上寻找,但我没有看到这个。非常感谢。以上是关于英特尔 MIC - 固有向量元素的总和的主要内容,如果未能解决你的问题,请参考以下文章
在 Powerpc 上,是不是有任何等效于英特尔的 movemask 内在函数?
使用 task_group 的英特尔线程构建模块性能不佳(新用户)