一文理解JVM的类加载系统
Posted 纵横千里,捭阖四方
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了一文理解JVM的类加载系统相关的知识,希望对你有一定的参考价值。
类装载系统是研究JVM的基础,其功能是将字节码文件加载到内存中,然后对其进行执行校验、初步的初始化等工作,之后再交给JVM内存结构来创建对象和完成预定的服务。因此,类加载过程是JVM启动的第一步,也是我们理解JVM的第一步。本文,我们主要介绍以下内容:
目录
1.类加载系统介绍
我们平时写的Java文件,例如经典的”Hello world“程序:
public class HelloLoader
public static void main(String[] args)
System.out.println("Hello world....");
该类是如何一步步被加载的呢?加载的过程如下所示:
第一步:加载阶段,字节码文件会以文件流的形式输入,JVM会读取并加载这些字节码文件。
第二步:链接阶段,对字节码进行验证、初步的处理,并将常量池内的符号引用转换为直接引用等等。
第三步:初始化阶段,这一阶段主要是创建对象了。
每个阶段又有更具体的功能,如下图所示:
接下来,我们先介绍每个组件的功能,然后再从源码等角度来看整个系统是如何工作的。我们再看一下HelloLoader.class文件加载的完整图示:
1.1 类加载器子系统
首先说明一点,随着JVM的发展,能够处理的不仅仅是Java程序了,其他语言的程序只要编译出来的是字节码符合JVM的规范就可以被装载和使用,例如Groovy等等,如下图。
类加载器子系统作用:
-
类加载器子系统负责从文件系统或者网络中加载Class文件,class文件在文件开头有特定的文件标识。
-
ClassLoader只负责class文件的加载,至于它是否可以运行,则由执行引擎决定。
-
加载的类信息存放于一块称为方法区的内存空间。除了类的信息外,方法区中还会存放运行时常量池信息,可能还包括字符串字面量和数字常量(这部分常量信息是Class文件中常量池部分的内存映射)
class file(在下图中就是Car.class文件)存在于本地硬盘上,可以理解为设计师画在纸上的模板,而最终这个模板在执行的时候是要加载到JVM当中来根据这个文件实例化出n个一模一样的实例。class file加载到JVM中,被称为DNA元数据模板(在下图中就是内存中的Car Class),放在方法区。在.class文件–>JVM–>最终成为元数据模板,此过程就要一个运输工具(类装载器Class Loader),扮演一个快递员的角色。
首先是执行 main() 方法(静态方法)就需要先加载main方法所在类 HelloLoader。加载成功之后,则进行链接、初始化等操作。完成后调用 HelloLoader 类中的静态方法 main。如果失败了则抛出异常。
接下来我们就具体看一下每个步骤的工作。
1.1.1 加载阶段
这里的加载是加载器里更具体的文件加载了:
-
通过一个类的全限定名获取定义此类的二进制字节流,其实就是个读文件的操作。
-
将这个字节流所代表的静态存储结构转化为内存结构。
-
在内存中生成一个代表这个类的java.lang.Class对象,这个对象就是字节流本身,作为方法区这个类的各种数据的访问入口。
常见的class文件来源:
-
从本地系统中直接加载
-
通过网络获取,典型场景:Web Applet
-
从zip压缩包中读取,成为日后jar、war格式的基础
-
运行时计算生成,使用最多的是:动态代理技术
-
从加密文件中获取,典型的防Class文件被反编译的保护措施
1.1.2 链接阶段
链接分为三个子阶段:验证 -> 准备 -> 解析。
第一步:验证(Verify)
-
目的在于确保Class文件的字节流中包含信息符合当前虚拟机要求,保证被加载类的正确性,不会危害虚拟机自身安全。
-
主要包括四种验证,文件格式验证,元数据验证,字节码验证,符号引用验证。
编译好的class文件是不能直接打开的,在windows下我们可以使用UE,在mac下可以使用sublime等直接打开编译好的class文件。高级一点的工具可以使用 BinaryViewer软件查看字节码文件,会发现文件开头均为 CAFE BABE ,如果出现不合法的字节码文件,那么将会验证不通过。
例如,上图中我们打开了两个编译好的class文件,可以看到其开头都是cafe babe。
第二步:准备(Prepare)
-
为类变量(static变量)分配内存并且设置该类变量的默认初始值,即零值。
-
这里不包含用final修饰的static,因为final在编译的时候就会分配好了默认值,准备阶段会显式初始化。
-
注意:这里不会为实例变量分配初始化,类变量会分配在方法区中,而实例变量是会随着对象一起分配到Java堆中。
代码:变量a在准备阶段会赋初始值,但不是1,而是0,只有到了初始化阶段会被赋值为1。
public class HelloApp
private static int a = 1;
public static void main(String[] args)
System.out.println(a);
第三步:解析(Resolve)
将常量池内的符号引用转换为直接引用的过程符号引用就是一组符号来描述所引用的目标。
符号引用的字面量形式明确定义在《java虚拟机规范》的class文件格式中。
符号引用
-
反编译 class 文件后可以查看符号引用,下面带# 的就是符号引用
直接引用就是直接指向目标的指针、相对偏移量或一个间接定位到目标的句柄。
解析动作主要针对类或接口、字段、类方法、接口方法、方法类型等。对应常量池中的CONSTANT Class info、CONSTANT Fieldref info、CONSTANT Methodref info等。
1.1.3 初始化阶段
类在什么时候初始化呢?一般来说主要在下面几种情况下:
-
创建类的实例
-
访问某个类或接口的静态变量,或者对该静态变量赋值
-
调用类的静态方法
-
反射(比如:Class.forName(“com.lqc.Test”))
-
初始化一个类的子类
-
Java虚拟机启动时被标明为启动类的类
-
JDK7开始提供的动态语言支持:java.lang.invoke.MethodHandle实例的解析结果REF_getStatic、REF putStatic、REF_invokeStatic句柄对应的类没有初始化,则初始化
除了以上七种情况,其他使用Java类的方式都被看作是对类的被动使用,都不会导致类的初始化,即不会执行初始化阶段。
1.2 初始化与静态变量的初始化
初始化阶段本质上就是执行类构造器方法<clinit>()
的过程。<clinit>()
方法中的指令按语句在源文件中出现的顺序执行的。此方法不需定义,是javac编译器自动收集类中的所有类变量的赋值动作和静态代码块中的语句合并而来。也就是说,当我们代码中包含static变量的时候,就会有clinit方法。
IDEA 中安装 JClassLib Bytecode viewer 插件,可以很方便的看字节码,下面我们通过例子来解释。
查看下面这个代码的字节码,可以发现有一个<clinit>()
方法。
public class ClassInitTest
private static int num = 2;
public static void main(String[] args)
System.out.println("init ...");
当我们代码中包含static变量的时候,就会有一个clinit方法。如果在idea中集成了JClassLib,我们可以清楚地看到加或者不加static变量的区别。
如果没有 static 变量,此时可以看到只有一个init方法,
添加了static变量之后,会发现此时就多了一个cinit()方法:
虽然两者看起来都是初始化代码,但是执行的功能并不一样,前者是指令是invokespecial用来加载基类java/lang/Object的,而后者指令是putstatic,是处理变量的。如果是静态代码块会怎么样呢?看个例子:
从上面可以清楚的看到,先将变量num赋值为1,然后再赋值为3。
到此,装载子系统的基本信息就结束。
以上是关于一文理解JVM的类加载系统的主要内容,如果未能解决你的问题,请参考以下文章