Java 中的 int[large][small] 或 int[small][large] 之间是不是存在低级差异?

Posted

技术标签:

【中文标题】Java 中的 int[large][small] 或 int[small][large] 之间是不是存在低级差异?【英文标题】:Is there a low-level difference between int[large][small] or int[small][large] in Java?Java 中的 int[large][small] 或 int[small][large] 之间是否存在低级差异? 【发布时间】:2016-06-05 05:19:57 【问题描述】:

这个问题可能需要一些编译器知识才能回答。我目前正在做一个项目,我将在其中创建一个数组,可能是

int[2][veryLargeNumber]

int [veryLargeNumber][2]

逻辑上没有区别,但我认为内存中的形式(以及大小)可能不同(也许问题应该是,编译器是否足够聪明,可以重新排列数组以适应它们)?

【问题讨论】:

似乎第一个选项开销较小,因为它相当于两个大的一维数组,而第二个选项相当于大量的小一维数组。第一个选项需要较少的数组实例 - 2D 数组和 2 个 1-D 数组。第二个选项需要二维数组实例和许多一维数组实例。 我不相信有一个,不。 如果没有指定第二个维度,但在这里你指定它。 @Eran 实际上没有;它是multianewarray,当你有一个“固定维度”多数组时使用 如果您的固定大小为 2,并且这种低级优化非常重要,请选择 int[2N],而不是 int[2][N]int[N][2] @fge multianewarray 为全维度已知情况提供了更短的字节码,但它仍然在每个级别分配单独的数组对象并将它们链接在一起;见docs.oracle.com/javase/specs/jvms/se8/html/…第三段 【参考方案1】:

Java 实际上只实现一维数组。它具有多维类型,但是二维数组实际上是作为数组数组实现的。每个数组有大约 16 个字节的开销。最好使用int[2][x] 以尽量减少开销。

您可以通过使用辅助方法完全避免此问题。

final int[] array = new int[2 * veryLargeNumber];

public int get(int x, int y) 
    return array[idx(x, y)];


public void set(int x, int y, int val) 
    array[idx(x, y)] = val;


private int idx(int x, int y) 
    return x * 2 + y; // or x * veryLargeNumber + y;

为了给自己提供这个,每个对象散列一个唯一的,生成的 hashCode 存储在它的 Object 头中。

从http://ideone.com/oGbDJ0可以看出,每个嵌套数组本身就是一个对象。

int[][] array = new int[20][2];
for (int[] arr : array) 
    System.out.println(arr);

打印 int[] 的内部表示,即 [I 后跟 @ 后跟存储在标头中的 hashCode()。这并不像某些人认为的那样,是对象的地址。地址不能用作 hashCode,因为对象可以随时被 GC 移动(除非你有一个从不移动对象的 JVM)

[I@106d69c
[I@52e922
[I@25154f
[I@10dea4e
[I@647e05
[I@1909752
[I@1f96302
[I@14eac69
[I@a57993
[I@1b84c92
[I@1c7c054
[I@12204a1
[I@a298b7
[I@14991ad
[I@d93b30
[I@16d3586
[I@154617c
[I@a14482
[I@140e19d
[I@17327b6

如果你用-XX:-UseTLAB关闭TLAB,你可以看到使用了多少内存 https://github.com/peter-lawrey/Performance-Examples/blob/master/src/main/java/vanilla/java/memory/ArrayAllocationMain.java

public static void main(String[] args) 

    long used1 = memoryUsed();
    int[][] array = new int[200][2];

    long used2 = memoryUsed();
    int[][] array2 = new int[2][200];

    long used3 = memoryUsed();
    if (used1 == used2) 
        System.err.println("You need to turn off the TLAB with -XX:-UseTLAB");
     else 
        System.out.printf("Space used by int[200][2] is " + (used2 - used1) + " bytes%n");
        System.out.printf("Space used by int[2][200] is " + (used3 - used2) + " bytes%n");
    


public static long memoryUsed() 
    Runtime rt = Runtime.getRuntime();
    return rt.totalMemory() - rt.freeMemory();

打印

Space used by int[200][2] is 5720 bytes
Space used by int[2][200] is 1656 bytes

【讨论】:

错误号multianewarray:p @fge Java 具有多维类型,但它仍然是一个数组数组,并且这些嵌套数组与所有其他对象一样具有 Object 标头。 另一个有趣的点可能是性能,如果你有一个非常大的数组并在一个紧密的循环中访问它,内存局部性可能是一个问题。对于这种情况(如果分析器显示存在性能瓶颈),您可以安排元素以便连续访问它们。 (可能是 x*2 + y 或 y*length + x,具体取决于您的控制流程。 内存地址也不能直接用作hash码,因为64位地址不适合32位整数,2016年32位JVM越来越少了。 @Snowman 即使在 32 位 JVM 中也无法使用该地址,因为对象被 GC 移动并且对象的 hashCode 无法更改。【参考方案2】:

有趣的问题,我跑了一个简单的程序

int N = 100000000;
long start = System.currentTimeMillis();
int[][] a = new int[2][N];
System.out.println(System.currentTimeMillis() - start + " ms");

这导致了160 ms。然后我运行了另一个变体

int N = 100000000;
long start = System.currentTimeMillis();
int[][] a = new int[N][2];
System.out.println(System.currentTimeMillis() - start + " ms");

这导致了30897 ms。所以确实第一个选项似乎好多更好。

【讨论】:

他在询问它是如何在 JNDI 中实现的,以了解哪个代码更有用。 ??这不是他问的答案.. @VikrantKashyap 老实说,我认为这是一个有趣的性能观察。虽然它可能无法直接回答他的问题,但它可能有助于决定走哪条路。 有趣,Sher Alams 的回答支持你的回答。【参考方案3】:
 int[2][veryLargeNumber] 

创建两个包含项目数的数组 而

 int[veryLargeNumber][2] 

创建包含两项的非常大数量的数组。

注意:数组创建有开销。所以更喜欢第一个

【讨论】:

另外,第二个选项会导致更多的内存碎片。访问内存中的随机位置比较慢。【参考方案4】:

简而言之,int[2][veryLargeNumber] 是更好的方法。

Peter (int[] array = new int[2 * veryLargeNumber];) 建议的更好,或者如果内存是您的问题,那么您可以使用 longs 而不是整数 (long[] array = new long[veryLargeNumber];) 和位运算符,或者更好的是,尽可能使用缓存。

小心!在大多数 JDK/JRE 发行版(Sun 和 Oracle)中,[I@106d69c 的表示由 System.identityHashCode() 给出,并且不能保证每个对象都是唯一的。所以你不能依赖System.out.println(array);来检查数组对象的唯一性。

【讨论】:

以上是关于Java 中的 int[large][small] 或 int[small][large] 之间是不是存在低级差异?的主要内容,如果未能解决你的问题,请参考以下文章

多个 Small DOM 操作 vs 一个 large DOM 操作

my-small.inimy-medium.inimy-large.inimy-huge.ini文件的作用

JAVA动手动脑

论文阅读-AAAI2021-Generalize a Small Pre-trained Model to Arbitrarily Large TSP Instances

Android Studio Widget、Text Field、Large、Medium 和 Small Text 丢失了我所拥有的只是提供名称的普通文本。我怎样才能得到它和其他人?

web.xml