将未对齐的双精度数加载到 _m128d 寄存器中

Posted

技术标签:

【中文标题】将未对齐的双精度数加载到 _m128d 寄存器中【英文标题】:Loading unaligned doubles into _m128d register 【发布时间】:2013-11-24 09:50:14 【问题描述】:

我对 SIMD 很陌生,所以如果这恰好是一个微不足道的问题,我深表歉意。

我有一个包含(除其他外)两个双打的课程。我想使用这两个双精度并将它们加载到__m128d 寄存器中,这样我就可以执行一些算术运算。 IE。假设我有我班级的inst1inst2 实例。我现在想将inst1.double1inst1.double2 添加到我的第一个__m128d 寄存器中,并将inst2.double1inst2.double2 添加到我的第二个__m128d 寄存器中(按照寄存器中的顺序) .我该怎么做?

【问题讨论】:

this answer 有帮助吗? 只用_mm_set_pd(inst1.double1, inst1.double2) 【参考方案1】:

您可以使用 _mm_loadu_pd。

解释见:http://msdn.microsoft.com/en-us/library/s1bwk03a%28v=vs.90%29.aspx

【讨论】:

以上是关于将未对齐的双精度数加载到 _m128d 寄存器中的主要内容,如果未能解决你的问题,请参考以下文章

_mm_cmpgt_sd 和其他类似方法有啥意义?

使用intel内在函数加载内存中等距的双精度数?

SSE 将整数加载到 __m128

如何将两个打包的 64 位四字加载到 128 位 xmm 寄存器中

有没有办法根据编译时未知的掩码长度来掩码 __m128i 寄存器的一端?

SSE 向量重新对齐?