通过后续索引扫描二维数组并不总是更快吗?

Posted

技术标签:

【中文标题】通过后续索引扫描二维数组并不总是更快吗?【英文标题】:Is scanning a two-dimensional array by subsequent indices not always faster? 【发布时间】:2019-05-10 00:27:45 【问题描述】:

假设x 是第一个索引并且y 是第二个(由于缓存未命中较少),垂直扫描二维数组显然更快。

然而,令我惊讶的是,当我需要使用垂直条纹(条纹宽度为 3)来扫描阵列时,如果我垂直处理单个条纹,我得到的结果比我做它时差 5%水平。谁能解释一下这怎么可能?

(edit:实际上“垂直”方法中的数组访问确实更快,但是这种方法使用了更多的循环,这会减慢整体速度比我们从更少的缓存未命中获得的收益要多得多;请参阅答案)。

下面的代码只是一个示例,但是当我在 BenchmarkDotNet 中对扫描线填充算法实现中扫描数组的相同方法进行基准测试时,我得到了相同的性能差异。

这是我的 C# 基准测试:

private void ProcessVerticalStripesHorizontally(int[,] matrix)

    int size = matrix.GetLength(0);
    for (int x = 1; x < size - 1; x++)
    
        for (int y = 0; y < size; y++)
        
            // should be slowe because x is changed often
            var value = matrix[x, y];
            var valueLeft = matrix[x-1, y];
            var valueRight = matrix[x+1, y];
        
    


private void ProcessVerticalStripesVertically(int[,] matrix)

    int size = matrix.GetLength(0);
    for (int x = 1; x < size-1; x++)
    
        // should be faster because x doesn't change often
        for (int y = 0; y < size; y++)
        
            var value = matrix[x, y];
        
        for (int y = 0; y < size; y++)
        
            var valueLeft = matrix[x - 1, y];
        
        for (int y = 0; y < size; y++)
        
            var valueRight = matrix[x + 1, y];
        
    


[Test]
public void AccessToArrayTest()

    int size = 5000;
    var matrix = new int[size, size];
    ProcessVerticalStripesHorizontally(matrix);
    ProcessVerticalStripesVertically(matrix);

    for (int run = 0; run < 5; run++)
    
        Console.WriteLine("run " + run + ": ");

        var stopwatch = Stopwatch.StartNew();
        for (int iteration = 0; iteration < 5; iteration++)
        
            ProcessVerticalStripesHorizontally(matrix);
        
        Console.WriteLine("processing stripes horizontally: " 
        + stopwatch.ElapsedMilliseconds + " ms");

        stopwatch.Restart();
        for (int iteration = 0; iteration < 5; iteration++)
        
            ProcessVerticalStripesVertically(matrix);
        
        Console.WriteLine("processing stripes vertically: " 
        + stopwatch.ElapsedMilliseconds + " ms");
        Console.WriteLine();

    

结果:

run 0: 
processing stripes horizontally: 454 ms
processing stripes vertically: 468 ms

run 1: 
processing stripes horizontally: 441 ms
processing stripes vertically: 456 ms

run 2: 
processing stripes horizontally: 437 ms
processing stripes vertically: 453 ms

run 3: 
processing stripes horizontally: 437 ms
processing stripes vertically: 456 ms

run 4: 
processing stripes horizontally: 441 ms
processing stripes vertically: 449 ms

【问题讨论】:

这看起来像是一个本土基准。我不相信这些,尤其是当涉及到诸如缓存未命中之类的事情时。试试BenchmarkDotNet,尤其是结合performance counters。 嗨,据我所知;基准标记是一件相当复杂的事情,具有巨大的副作用。为了获得正确的基准,您应该排除编译器优化并查看“本机”输出。如果我查看您的代码,我认为优化器会尽量充分利用它。 话虽如此:我不确定您是如何阅读自己的代码并认为除了冗余循环之外,这些代码段实际上是不同的。 如果这段代码得到了适当的优化,它应该是一个很大的空操作,因为没有对读取的值做任何事情。 只有我一个人认为y 在我们将它放在 3 个不同的循环中时变化得更频繁,也许这就是它不同的原因? 【参考方案1】:

通过分析您的代码,我可以看到 ProcessVerticalStripesHorizo​​ntally 方法将有一个 O(n^2) - 它会执行 n*n 个循环。

同时 ProcessVerticalStripesVertically 方法将有 O(n*3n) - 它会执行 n*n*3 次循环。

因此,如果您的矩阵是 100 x 100,我们将有以下内容:

ProcessVerticalStripesHorizo​​ntally 100 * 100 = 10,000 次循环 ProcessVerticalStripesVertically 100 * 100 * 3 = 30,000 次循环

【讨论】:

所以两者都是O(n^2),不幸的是你不能使用Big-O符号来解释实际的运行时性能,只有增长。 你说得对,这些情况下循环次数不同,但访问数组的次数是相同的(水平方法为 100*100*3,水平方法为 100*3*100垂直法)。您是否建议在这种情况下,与访问数组的时间相比,仅迭代时间是有意义的? 编辑:是的,你是对的!当我在基准测试中删除数组访问时只留下空循环,结果发现“水平”方法的总时间约为 45 毫秒,而“垂直方法”的总时间为 128 毫秒乙>。如果我们从总时间中减去这些结果,事实证明,数组访问本身在垂直循环中确实快了 20%,但水平方法通过更少的迭代节省了更多的时间。我只是错误地认为迭代是如此之快以至于我可以忽略它。 @Павле:这解释了很多混乱。记住所有动作都很快。所以var valueLeft = matrix[x - 1, y]; 几乎与为循环增加索引器一样快。所以;循环不能被忽略。话说回来;我仍然认为优化器会创建一个无操作或单循环。

以上是关于通过后续索引扫描二维数组并不总是更快吗?的主要内容,如果未能解决你的问题,请参考以下文章

.NET遍历二维数组-先行/先列哪个更快?

Java数组2----二维数组

Java数组2----二维数组

PHP二维关联数组的遍历方式

将字符串数组分配给二维字符串数组

数组指针是二级指针吗?请解释一下!谢谢!