ARM Neon:用于减法的 VPADAL

Posted

技术标签:

【中文标题】ARM Neon:用于减法的 VPADAL【英文标题】:ARM Neon: VPADAL for subtraction 【发布时间】:2011-11-22 19:32:29 【问题描述】:

我正在使用VPADAL.U32 指令来大大提高我的加法代码速度。但是,我需要用累积和进位来减去一些东西(正是我得到的加法)。

一厢情愿还是真的有可能?

据我所知,我需要减少我的第二个操作数,而不是它的位...执行VPADAL,然后对 1 进行位测试,并从结果进位中减去 1(到要么得到 0 要么 -1 - 我的积累)。

我是不是在某个地方漏掉了一种神秘的技术?

【问题讨论】:

【参考方案1】:

您可以使用 VPADDL 将加数成对相加并将宽度加倍,然后使用 VQSUB 从总数中减去此项。

【讨论】:

以上是关于ARM Neon:用于减法的 VPADAL的主要内容,如果未能解决你的问题,请参考以下文章

是否有 ARM NEON 指令用于该轮向零的有符号右移?

解释 ARM Neon 图像采样

ARM-NEON:基于参数的条件寄存器交换

SSE (Intel) 到 NEON (ARM) 数据类型类似物

可以并行化 ARM NEON 的过滤器吗?

使用 ARM NEON 执行比 C 代码需要更长的时间