Java 中的 int[large][small] 或 int[small][large] 之间是不是存在低级差异?
Posted
技术标签:
【中文标题】Java 中的 int[large][small] 或 int[small][large] 之间是不是存在低级差异?【英文标题】:Is there a low-level difference between int[large][small] or int[small][large] in Java?Java 中的 int[large][small] 或 int[small][large] 之间是否存在低级差异? 【发布时间】:2016-06-05 05:19:57 【问题描述】:这个问题可能需要一些编译器知识才能回答。我目前正在做一个项目,我将在其中创建一个数组,可能是
int[2][veryLargeNumber]
或
int [veryLargeNumber][2]
逻辑上没有区别,但我认为内存中的形式(以及大小)可能不同(也许问题应该是,编译器是否足够聪明,可以重新排列数组以适应它们)?
【问题讨论】:
似乎第一个选项开销较小,因为它相当于两个大的一维数组,而第二个选项相当于大量的小一维数组。第一个选项需要较少的数组实例 - 2D 数组和 2 个 1-D 数组。第二个选项需要二维数组实例和许多一维数组实例。 我不相信有一个,不。 会如果没有指定第二个维度,但在这里你指定它。 @Eran 实际上没有;它是multianewarray
,当你有一个“固定维度”多数组时使用
如果您的固定大小为 2,并且这种低级优化非常重要,请选择 int[2N]
,而不是 int[2][N]
或 int[N][2]
。
@fge multianewarray
为全维度已知情况提供了更短的字节码,但它仍然在每个级别分配单独的数组对象并将它们链接在一起;见docs.oracle.com/javase/specs/jvms/se8/html/…第三段
【参考方案1】:
Java 实际上只实现一维数组。它具有多维类型,但是二维数组实际上是作为数组数组实现的。每个数组有大约 16 个字节的开销。最好使用int[2][x]
以尽量减少开销。
您可以通过使用辅助方法完全避免此问题。
final int[] array = new int[2 * veryLargeNumber];
public int get(int x, int y)
return array[idx(x, y)];
public void set(int x, int y, int val)
array[idx(x, y)] = val;
private int idx(int x, int y)
return x * 2 + y; // or x * veryLargeNumber + y;
为了给自己提供这个,每个对象散列一个唯一的,生成的 hashCode 存储在它的 Object 头中。
从http://ideone.com/oGbDJ0可以看出,每个嵌套数组本身就是一个对象。
int[][] array = new int[20][2];
for (int[] arr : array)
System.out.println(arr);
打印 int[]
的内部表示,即 [I
后跟 @
后跟存储在标头中的 hashCode()。这并不像某些人认为的那样,是对象的地址。地址不能用作 hashCode,因为对象可以随时被 GC 移动(除非你有一个从不移动对象的 JVM)
[I@106d69c
[I@52e922
[I@25154f
[I@10dea4e
[I@647e05
[I@1909752
[I@1f96302
[I@14eac69
[I@a57993
[I@1b84c92
[I@1c7c054
[I@12204a1
[I@a298b7
[I@14991ad
[I@d93b30
[I@16d3586
[I@154617c
[I@a14482
[I@140e19d
[I@17327b6
如果你用-XX:-UseTLAB
关闭TLAB,你可以看到使用了多少内存
https://github.com/peter-lawrey/Performance-Examples/blob/master/src/main/java/vanilla/java/memory/ArrayAllocationMain.java
public static void main(String[] args)
long used1 = memoryUsed();
int[][] array = new int[200][2];
long used2 = memoryUsed();
int[][] array2 = new int[2][200];
long used3 = memoryUsed();
if (used1 == used2)
System.err.println("You need to turn off the TLAB with -XX:-UseTLAB");
else
System.out.printf("Space used by int[200][2] is " + (used2 - used1) + " bytes%n");
System.out.printf("Space used by int[2][200] is " + (used3 - used2) + " bytes%n");
public static long memoryUsed()
Runtime rt = Runtime.getRuntime();
return rt.totalMemory() - rt.freeMemory();
打印
Space used by int[200][2] is 5720 bytes
Space used by int[2][200] is 1656 bytes
【讨论】:
错误号multianewarray
:p
@fge Java 具有多维类型,但它仍然是一个数组数组,并且这些嵌套数组与所有其他对象一样具有 Object 标头。
另一个有趣的点可能是性能,如果你有一个非常大的数组并在一个紧密的循环中访问它,内存局部性可能是一个问题。对于这种情况(如果分析器显示存在性能瓶颈),您可以安排元素以便连续访问它们。 (可能是 x*2 + y 或 y*length + x,具体取决于您的控制流程。
内存地址也不能直接用作hash码,因为64位地址不适合32位整数,2016年32位JVM越来越少了。
@Snowman 即使在 32 位 JVM 中也无法使用该地址,因为对象被 GC 移动并且对象的 hashCode 无法更改。【参考方案2】:
有趣的问题,我跑了一个简单的程序
int N = 100000000;
long start = System.currentTimeMillis();
int[][] a = new int[2][N];
System.out.println(System.currentTimeMillis() - start + " ms");
这导致了160 ms
。然后我运行了另一个变体
int N = 100000000;
long start = System.currentTimeMillis();
int[][] a = new int[N][2];
System.out.println(System.currentTimeMillis() - start + " ms");
这导致了30897 ms
。所以确实第一个选项似乎好多更好。
【讨论】:
他在询问它是如何在 JNDI 中实现的,以了解哪个代码更有用。 ??这不是他问的答案.. @VikrantKashyap 老实说,我认为这是一个有趣的性能观察。虽然它可能无法直接回答他的问题,但它可能有助于决定走哪条路。 有趣,Sher Alams 的回答支持你的回答。【参考方案3】: int[2][veryLargeNumber]
创建两个包含项目数的数组 而
int[veryLargeNumber][2]
创建包含两项的非常大数量的数组。
注意:数组创建有开销。所以更喜欢第一个
【讨论】:
另外,第二个选项会导致更多的内存碎片。访问内存中的随机位置比较慢。【参考方案4】:简而言之,int[2][veryLargeNumber]
是更好的方法。
Peter (int[] array = new int[2 * veryLargeNumber];
) 建议的更好,或者如果内存是您的问题,那么您可以使用 longs 而不是整数 (long[] array = new long[veryLargeNumber];
) 和位运算符,或者更好的是,尽可能使用缓存。
小心!在大多数 JDK/JRE 发行版(Sun 和 Oracle)中,[I@106d69c
的表示由 System.identityHashCode()
给出,并且不能保证每个对象都是唯一的。所以你不能依赖System.out.println(array);
来检查数组对象的唯一性。
【讨论】:
以上是关于Java 中的 int[large][small] 或 int[small][large] 之间是不是存在低级差异?的主要内容,如果未能解决你的问题,请参考以下文章
多个 Small DOM 操作 vs 一个 large DOM 操作
my-small.inimy-medium.inimy-large.inimy-huge.ini文件的作用
论文阅读-AAAI2021-Generalize a Small Pre-trained Model to Arbitrarily Large TSP Instances
Android Studio Widget、Text Field、Large、Medium 和 Small Text 丢失了我所拥有的只是提供名称的普通文本。我怎样才能得到它和其他人?