JVM技术专题攻克你的技术盲点之Java的常量池们「 原理篇」

Posted 浩宇の天尚

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了JVM技术专题攻克你的技术盲点之Java的常量池们「 原理篇」相关的知识,希望对你有一定的参考价值。

每日一句

没有失败的成功是永远不会长久,也永远不算"真正"的成功。

什么是常量

用final修饰的成员变量表示常量,值一旦给定就无法改变

  • final修饰的变量有三种:静态变量、实例变量和局部变量,分别表示三种类型的常量

JVM中的方法区

JVM的方法区里存放着类的版本,字段,方法,接口和常量池。常量池里存储着字面量和符号引用

Java中的常量池

实际上分为两种形态:静态常量池和运行时常量池

静态常量池

静态常量池,即class文件中的常量池,class文件中的常量池不仅仅包含字符串(数字)字面量,还包含类、方法的信息,占用class文件绝大部分空间

class常量池

  • 当java文件被编译成class文件之后,会在class文件中生成我们所说的class常量池。

  • class文件中除了包含类的版本、字段、方法、接口等描述信息外,还有一项信息就是常量池(constant pool table),用于存放编译器生成的【各种字面量】(文本字符串、被声明为final的常量、基本数据类型的值)和【符号引用】(类和接口的全限定名、字段的名称和描述符、方法的名称和描述符),这部分内容将在类加载后进入方法区的运行时常量池中存放。

常量池中存放的符号信息,在JVM执行指令时需要依赖使用。常量池中的所有项都具有如下通用格式:

cp_info 
    u1 tag;     //表示cp_info的单字节标记位
    u1 info[];  //两个或更多的字节表示这个常量的信息,信息格式由tag的值确定

支持的类型信息如下:

以CONSTANT_Class为例,它用于表示类或者接口,格式如下:

CONSTANT_Class_info 
 u1 tag;
 u2 name_index;
  • CONSTANT_Class_info类型是由一个tag和一个name_index组成。

    • tag:这个值为CONSTANT_Class (7),代表着属于一个类的引用(CONSTANT_Fieldref代表字段引用)

    • name_index中的index表示它是一个索引,引用的是CONSTANT_UTF8_info

  • CONSTANT_Utf8_info用于表示字符常量的值,结构如下所示:

CONSTANT_Utf8_info 
 u1 tag;
 u2 length;
 u1 bytes[length];

  • tag表示为:CONSTANT_Utf8(1),代表着属于一个字符串值得引用

  • length:指明了bytes[]数组的长度bytes[]数组引用了上一个length作为其长度字符常量采用改进过的UTF-8编码表示。

多余说一句:对于静态常量池我们需要知道它存在于编译器,如果说与运行时有关的话,可以说运行时中的常量是JVM加载class文件之后进行分配的


运行时常量池

运行时常量池,运行时常量池是方法区的一部分,则是jvm虚拟机在完成类装载操作后,将class文件中的常量池载入到内存中,并保存在方法区中,我们常说的常量池,就是指方法区中的运行时常量池

  • 运行时常量池相对于Class文件常量池的另外一个重要特征是具备动态性,Java语言并不要求常量一定只有编译期才能产生,也就是并非预置入Class文件中常量池的内容才能进入方法区运行时常量池,运行期间也可能将新的常量放入池中,这种特性被开发人员利用比较多的就是String类的intern()方法。

  • 当类加载到内存中后,JVM就会将class常量池中的内容存放到运行时常量池中,由此可知,运行时常量池也是每个类都有一个

    • 运行时常量池用来动态获取类信息,包括:class文件元信息描述、编译后的代码数据、引用类型数据、类文件常量池的其他数据等

    • class常量池中存的是字面量和符号引用,也就是说他们存的并不是对象的实例,而是对象的符号引用值,加载阶段:将每个class常量池中的符号引用值转存到运行时常量池中。

    • 之后经过解析(resolve)之后,也就是把符号引用替换为直接引用,解析的过程会去查询字符串常量池,也就是我们上面所说的string pool,以保证运行时常量池所引用的字符串与字符串常量池中所引用的是一致的

字符串常量池(string pool)

字符串常量池里的内容是在类加载完成,经过验证,准备阶段之后在堆中生成字符串对象实例,然后将该字符串对象实例的引用值存到string pool中记住:在jdk1.8后string pool中存的是引用值而不是具体的实例对象,具体的实例对象是在堆中开辟的一块空间存放的)。string pool在每个HotSpot VM的实例只有一份,被所有的类共享。

  • 字符串池里的内容是在类加载完成,经过验证、准备阶段之后存放在字符串常量池中。关于字符串常量池的具体实现我们这里先不展开,后面用专门的文章来进行讲解。

  • 字符串常量池的处理机制我们前面文章已经讲到,只会存储一份,被所有的类共享。基本流程是:创建字符串之前检查常量池中是否存在,如果存在则获取其引用,如果不存在则创建并存入,返回新对象引用

不同版本的字符串常量池

字符串常量池随着JDK版本的演化所在的位置也在不断的变化,下面我们会专门用图讲解一下。

在JDK1.7字符串常量池和静态变量被从方法区拿到了堆中,运行时常量池剩下的还在方法区, 也就是hotspot中的永久代。

在JDK8 hotspot移除了永久代用元空间(Metaspace)取而代之, 这时候字符串常量池还在堆,运行时常量池还在方法区,只不过方法区的实现从永久代变成了元空间(Metaspace)

常量池的好处

常量池是为了避免频繁的创建和销毁对象而影响系统性能,其实现了对象的共享。

例如字符串常量池,在编译阶段就把所有的字符串文字放到一个常量池中。

  1. 节省内存空间:常量池中所有相同的字符串常量被合并,只占用一个空间

  2. 节省运行时间:比较字符串时,比equals()快。对于两个引用变量,只用判断引用是否相等,也就可以判断实际值是否相等

实际案例

String s1=new String("abc"); 

首先你要理解常量池, 这是一个特殊的共享区域,literate(符号引用), Class这些可以在内存中共享的不经常改变的东西,都可以放在这里。

  • 上面的代码会有两个String被创建,一个是你的Class被ClassLoader加载时,你的"abc"被作为常量读入,在字符串常量池里创建了一个共享的"abc"

  • 然后,当调用到new String(“abc”)的时候,会在heap里创建这个new String(“abc”);

考虑类加载阶段和实际执行时。

类加载对一个类只会进行一次。"abc"在类加载时就已经创建并驻留了(如果该类被加载之前已经有"abc"字符串被驻留过则不需要重复创建,直接使用驻留的"abc"实例)。驻留的字符串是放在全局共享的字符串常量池中的

"abc"字面量对应的String实例已经固定了,不会再被重复创建。所以这段代码将常量池中的对象复制一份放到heap中,并且把heap中的这个对象的引用交给s1持有

总结一下

  • 静态变量(静态常量池)处于编译器,存在于class文件内,可通过javap verbose命令查看字符串合并时查看的是静态常量池里面的内容;

  • 字符串常量池曾经属于运行时常量池的一部分,位于方法区,但随着JVM版本的演变,二者已经分开。在JDK8以后字符串常量池位于堆中,而运行时常量池位于方法区

以上是关于JVM技术专题攻克你的技术盲点之Java的常量池们「 原理篇」的主要内容,如果未能解决你的问题,请参考以下文章

Java盲点攻克「TestNG专题」摒弃JUnit单元测试,带你学会使用TestNG测试框架(上篇)

Java技术专题-JVM研究系列(26)让你完全攻克内存溢出(OOM)这一难题

JVM技术专题让你完全攻克内存溢出(OOM)这一难题「案例篇」

深度剖析 | JVM深层系列[HotSpotVM研究系列] JVM调优的"标准参数"的各种陷阱和坑点分析(攻克盲点及混淆点)「 1 」

深度剖析 | JVM深层系列[HotSpotVM研究系列] JVM调优的“标准参数“的各种陷阱和坑点分析(攻克盲点及混淆点)「 1 」

Java盲点攻克「时间与时区系列」让我们一起完全吃透对于时区和日期相关的功能开发原理