对按分量多值 (SIMD) 数组进行排序

Posted

技术标签:

【中文标题】对按分量多值 (SIMD) 数组进行排序【英文标题】:sorting component-wise multi value (SIMD) array 【发布时间】:2015-05-26 09:34:42 【问题描述】:

我正在尝试找到一种O(n∙log(n)) 排序方法来同时对多个数组进行排序,以便多值数组中的元素将代表来自 4 个不同单值数组的元素,并且排序方法将对多值元素进行排序.

例如: 对于给定的 4 个单值数组 AnBnCnDn, 我会设置一个新数组 Qn 这样Qᵢ = [ Aᵢ Bᵢ Cᵢ Dᵢ ].Qᵢ 可以在此过程中更改,以便Qᵢ = [ Aaᵢ Bbᵢ Ccᵢ Ddᵢ ] 其中aᵢbᵢcᵢdᵢ 是索引列表 当然还有Qᵢ ≤ Qᵢ₊₁ = [ Aaᵢ₊₁ Bbᵢ₊₁ Ccᵢ₊₁ Ddᵢ₊₁ ]Aaᵢ ≤ Aaᵢ₊₁Bbᵢ ≤ Bbᵢ₊₁ 等等。 动机当然是使用 SIMD 指令来受益于这种结构来分别对 4 个数组进行排序。

我尝试使用 SIMD 比较器(例如_mm_cmplt_ps)和掩码交换(例如_mm_blendv_ps) 制作传统排序算法的修改版本(快速排序、堆排序、合并排序等) 但我总是遇到理论上决策树中似乎有O(n∙log(n)) 步骤的问题。 因此,决定是否设置枢轴(快速排序)或是否将父级与其其中一个子级交换(堆排序) 对于所有 4 个组件同时在一起是不正确的(因此,下一步 - 向右或向左 - 是不正确的)。

目前我只有 O(n²) 方法有效。

有什么想法吗?

【问题讨论】:

相关:vldb.org/pvldb/1/1454171.pdf @PaulR n 被认为非常大(非常密集的网格的坐标)。我之前处理过这篇文章。它谈到了一般排序(SIMD 结构中的单个数组) @PaulR,这看起来像是我需要阅读的一篇有趣的论文。谢谢! 【参考方案1】:

听起来sorting network 是您所问问题的答案,因为比较器的位置不依赖于数据。 Batcher's bitonic mergesort 是 O(n log2 n)。

【讨论】:

谢谢!这当然是我一直在寻找的

以上是关于对按分量多值 (SIMD) 数组进行排序的主要内容,如果未能解决你的问题,请参考以下文章

使用 SIMD AVX 计算两个排序数组的对称差的大小

PowerShell - 使用排序的对象数组打印 JSON 输出?

双精度数组上的 SIMD?

动态分配 SIMD 向量数组是不是安全?

图的最小生成树,Kruskal算法

图的最小生成树,Kruskal算法