Java核心技术int和Integer的区别

Posted 2021-09-16 sysu_lluozh

tags:

篇首语：本文由小常识网(cha138.com)小编为大家整理，主要介绍了Java核心技术int和Integer的区别相关的知识，希望对你有一定的参考价值。

Java虽然号称是面向对象的语言，但是原始数据类型仍然是重要的组成元素，所以需要掌握原始数据类型和包装类等Java语言特性

探讨的问题：

int和Integer有什么区别？
谈谈Integer的值缓存范围

一、典型回答

int是常说的整形数字，是Java的8个原始数据类型(Primitive Types：boolean、byte、short、char、int、float、double、long)之一

Java语言虽然号称一切都是对象，但原始数据类型是例外

Integer是int对应的包装类，它有一个int类型的字段存储数据，并且提供了基本操作，比如数学运算、int和字符串之间转换等
在Java 5中，引入了自动装箱和自动拆箱功能(boxing/unboxing)，Java可以根据上下文自动进行转换，极大地简化了相关编程

关于Integer的值缓存，涉及Java 5 中另一个改进
构建Integer对象的传统方式是直接调用构造器，直接new一个对象。但是根据实践发现大部分数据操作都是集中在有限的、较小的数值范围，因此，在Java 5中新增了静态工厂方法valueOf，在调用它的时候会利用一个缓存机制，带来了明显的性能改进
按照Javadoc，这个值默认缓存是-128到127之间

二、考点分析

这个问题涵盖了Java里的两个基础要素：原始数据类型、包装类
谈到这里，可以非常自然地扩展到自动装箱、自动拆箱机制，进而考察封装类的一些设计和实践。坦白说，理解基本原理和用法已经足够日常工作需求，但是要落实到具体场景，还是有很多问题需要仔细思考才能确定

可以结合其他方面，考察以上知识点的掌握程度和思考逻辑，比如：

Java使用的不同阶段：编译阶段、运行时，自动装箱/自动拆箱是发生在什么阶段？
使用静态工厂方法valueOf会使用到缓存机制，那么自动装箱的时候，缓存机制起作用吗？
为什么需要原始数据类型，Java的对象似乎也很高效，应用中具体会产生哪些差异？
根据Integer源码分析类或某些方法的设计要点

三、知识扩展

3.1 理解自动装箱/拆箱

自动装箱实际上算是一种语法糖
什么是语法糖？可以简单理解为Java平台对语法自动进行了一些转换，保证不同的写法在运行时等价，它们发生在编译阶段，也就是生成的字节码是一致的

比如整数，javac自动把装箱转换为Integer.valueOf()，把拆箱替换为Integer.intValue()，这似乎这也顺道回答了另一个问题，既然调用的是Integer.valueOf，自然能够得到缓存的好处

如何程序化的验证上面的结论呢？

写一段简单的程序包含下面两句代码，然后反编译一下
当然，这是一种从表现倒推的方法，大多数情况下还是直接参考规范文档会更加可靠，毕竟软件承诺的是遵循规范，而不是保持当前行为

Integer integer = 1;
int unboxing = integer ++;

反编译输出：

1: invokestatic  #2                  // Method
java/lang/Integer.valueOf:(I)Ljava/lang/Integer;
8: invokevirtual #3                  // Method
java/lang/Integer.intValue:()I

这种缓存机制并不是只有Integer才有，同样存在于其他的一些包装类，比如：

Boolean
缓存了true/false对应实例，确切说，只会返回两个常量实例Boolean.TRUE/FALSE
Short
缓存了-128到127之间的数值
Byte
数值有限，所以全部都被缓存
Character
缓存范围’\\u0000’到’\\u007F’

自动装箱/自动拆箱似乎很酷，在编程实践中，有什么需要注意的吗？

原则上，建议避免无意中的装箱、拆箱行为，尤其是在性能敏感的场合
创建10万个Java对象和10万个整数的开销可不是一个数量级的，不管是内存使用还是处理速度，光是对象头的空间占用就已经是数量级的差距

避免无意中的装箱/拆箱操作，具体实现起来就是在代码中将需要拆箱装箱的操作用代码表示出来，而不是等着java自动拆装箱

其实可以把这个观点扩展开，使用原始数据类型、数组甚至本地代码实现等，在性能极度敏感的场景往往具有比较大的优势，用其替换掉包装类、动态数组(如ArrayList)等可以作为性能优化的备选项
一些追求极致性能的产品或者类库，会极力避免创建过多对象。当然，在大多数产品代码里并没有必要这么做，还是以开发效率优先

以经常会使用到的计数器实现为例，下面是一个常见的线程安全计数器实现

class Counter {
    private final AtomicLong counter = new AtomicLong();  
    public void increase() {
        counter.incrementAndGet();
    }
}

如果利用原始数据类型，可以将其修改为：

 class CompactCounter {
    private volatile long counter;
    private static final AtomicLongFieldUpdater<CompactCounter> updater = AtomicLongFieldUpdater.newUpdater(CompactCounter.class, "counter");
    public void increase() {
        updater.incrementAndGet(this);
    }
}

3.2 源码分析

接下来分析Integer的源码

整体看一下Integer的职责：

主要包括各种基础的常量，比如最大值、最小值、位数等
各种静态工厂方法valueOf()
获取环境变量数值的方法
各种转换方法，比如转换为不同进制的字符串(如8进制)
反过来的解析方法

进一步来看一些有意思的地方

3.2.1 缓存

继续深挖缓存
Integer的缓存范围虽然默认是-128到127，但是在特别的应用场景，比如明确知道应用会频繁使用更大的数值，这时候应该怎么办呢？

缓存上限值实际是可以根据需要调整的，JVM提供了参数设置：

-XX:AutoBoxCacheMax=N

这些实现，都体现在java.lang.Integer源码之中，并实现在IntegerCache的静态初始化块里

private static class IntegerCache {
     static final int low = -128;
     static final int high;
     static final Integer cache[];
     static {
         // high value may be configured by property
         int h = 127;
         String integerCacheHighPropValue =                VM.getSavedProperty("java.lang.Integer.IntegerCache.high");
         ...
         // range [-128, 127] must be interned (JLS7 5.1.7)
         assert IntegerCache.high >= 127;
     }
     ...
  }

3.2.2 字符串不可变

在分析字符串的设计实现时，提到过字符串是不可变的，保证了基本的信息安全和并发编程中的线程安全

如果看包装类里存储数值的成员变量value，可以发现不管是Integer还是Boolean等，都被声明为private final，所以，它们同样是不可变类型

这种设计是可以理解的，或者说是必须的选择
想象一下这个应用场景，比如Integer提供了getInteger()方法，用于方便地读取系统属性，可以用属性来设置服务器某个服务的端口，如果轻易地把获取到的Integer对象改变为其他数值，这会带来产品可靠性方面的严重问题

3.2.3 Integer等包装类定义常量

Integer等包装类，定义了类似SIZE或者BYTES这样的常量，这反映了什么样的设计考虑呢？

如果使用过其他语言(如C或C++)，类似整数的位数其实是不确定的，可能在不同的平台(如32 位或64位平台)，存在非常大的不同
那么，在32位JDK或者64位JDK里，数据位数会有不同吗？或者说，这个问题可以扩展为使用 32位JDK开发编译的程序，运行在64位JDK上，需要做什么特别的移植工作吗？

其实，这种移植对于Java来说相对要简单些，因为原始数据类型是不存在差异的，这些明确定义在Java语言规范里面，不管是32位还是64位环境，开发者无需担心数据的位数差异

对于应用移植，虽然存在一些底层实现的差异，比如64位HotSpot JVM里的对象要比32位 HotSpot JVM大(具体区别取决于不同JVM实现的选择)，但是总体来说并没有行为差异，应用移植还是可以做到宣称的一次书写，到处执行，应用开发者更多需要考虑的是容量、能力等方面的差异

3.3 原始类型线程安全

前面提到了线程安全设计，那原始数据类型操作是不是线程安全的呢？

这里可能存在着不同层面的问题：

原始数据类型的变量，显然要使用并发相关手段才能保证线程安全
如果有线程安全的计算需要，建议考虑使用类似AtomicInteger、AtomicLong这样的线程安全类
部分比较宽的数据类型(如float、double)，甚至不能保证更新操作的原子性，可能出现程序读取到只更新了一半数据位的数值