2. SIMD使用和介绍

Posted 踟蹰横渡口,彳亍上滩舟。

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了2. SIMD使用和介绍相关的知识,希望对你有一定的参考价值。

2 SIMD指令集使用介绍

**2.1 命名规则

2.1.1 标量运算与矢量运算**
标量运算 _mm_add_ss _mm_sub_ss _mm_mul_ss _mm_div_ss
矢量运算 _mm_add_ps _mm_sub_ps _mm_mul_ps _mm_div_ps
标量(Scalar)运算:例如__m128 _m_add_ss(__m128 a, __m128 b)
在这里插入图片描述
矢量(packed)运算:例如__m128 _m_add_ps(__m128 a, __m128 b)

2.1.2 需字节对齐与无需字节对齐
需字节对齐 _mm_load_ps _mm_store_ps
无需字节对齐 _mm_loadu_ps _mm_storeu_ps

2.1.3 整型与浮点型
整型 _mm_add_epi16 _mm_add_epi32
浮点型 _mm_add_ps _mm_add_pd

2.1.4 饱和(Saturate)运算与非饱和运算
饱和运算 _mm_adds_epi8 _mm_subs_epi8
非饱和运算 _mm_add_epi8 _mm_sub_epi8
饱和度运算意味着超出某个“最大”值的值被设置为“最大”,而低于“最小值”的值被设置为“最小”。例如,如果对无符号字节进行算术运算,则“128 + 128”为“256”(十六进制0x100),有溢出。正常整

以上是关于2. SIMD使用和介绍的主要内容,如果未能解决你的问题,请参考以下文章

SIMD加速计算矩阵(组成原理实验5)

SSE4 1和SSE4 2 Intrinsics各函数介绍

DSP视频教程第11期:插补算法,曲线拟合丝滑顺畅,统计函数和基础函数加速实现,汇集SIMD,饱和和MAC乘累加应用实战(2023-02-12)

GPU架构和CUDA简单介绍(未来继续补充)

借助 SIMD 数据布局模板和数据预处理提高 SIMD 在动画中的使用效率

Linux内核memcpy的不同实现