Java编译期和运行期 & JVM

Posted qinhao517

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了Java编译期和运行期 & JVM相关的知识,希望对你有一定的参考价值。

 Java整个编译以及运行的过程相当繁琐,本文通过一个简单的程序来简单的说明整个流程。      

首先两张图,描述编译和执行的过程:

 

Java代码编译是由Java源码编译器来完成,流程图如下所示:

技术分享图片

Java字节码的执行是由JVM执行引擎来完成,流程图如下所示:

技术分享图片

 

          如下图,Java程序从源文件创建到程序运行要经过两大步骤:1、源文件由编译器编译成字节码(ByteCode)  2、字节码由java虚拟机解释运行。因为java程序既要编译同时也要经过JVM的解释运行,所以说Java被称为半解释语言( "semi-interpreted" language)。

技术分享图片
图1   java程序编译运行过程

 

        下面通过以下这个java程序,来说明java程序从编译到最后运行的整个流程。代码如下:

 

Java代码  技术分享图片
  1. //MainApp.java  
  2. public class MainApp {  
  3.     public static void main(String[] args) {  
  4.         Animal animal = new Animal("Puppy");  
  5.         animal.printName();  
  6.     }  
  7. }  
  8. //Animal.java  
  9. public class Animal {  
  10.     public String name;  
  11.     public Animal(String name) {  
  12.         this.name = name;  
  13.     }  
  14.     public void printName() {  
  15.         System.out.println("Animal ["+name+"]");  
  16.     }  
  17. }  

 

        第一步(编译): 创建完源文件之后,程序会先被编译为.class文件。Java编译一个类时,如果这个类所依赖的类还没有被编译,编译器就会先编译这个被依赖的类,然后引用,否则直接引用,这个有点象make。如果java编译器在指定目录下找不到该类所其依赖的类的.class文件或者.java源文件的话,编译器话报“cant find symbol”的错误。

        编译后的字节码文件格式主要分为两部分:常量池和方法字节码。常量池记录的是代码出现过的所有token(类名,成员变量名等等)以及符号引用(方法引用,成员变量引用等等);方法字节码放的是类中各个方法的字节码。下面是MainApp.class通过反汇编的结果,我们可以清楚看到.class文件的结构:
技术分享图片图2  MainApp类常量池  
技术分享图片
图3  MainApp类方法字节码
         

最后生成的class文件由以下部分组成:

  • 结构信息。包括class文件格式版本号及各部分的数量与大小的信息
  • 元数据。对应于Java源码中声明与常量的信息。包含类/继承的超类/实现的接口的声明信息、域与方法声明信息和常量池
  • 方法信息。对应Java源码中语句和表达式对应的信息。包含字节码、异常处理器表、求值栈与局部变量区大小、求值栈的类型记录、调试符号信息

  第二步(运行):java类运行的过程大概可分为两个过程:1、类的加载  2、类的执行。需要说明的是:JVM主要在程序第一次主动使用类的时候,才会去加载该类。也就是说,JVM并不是在一开始就把一个程序就所有的类都加载到内存中,而是到不得不用的时候才把它加载进来,而且只加载一次。
        下面是程序运行的详细步骤:
  1. 在编译好java程序得到MainApp.class文件后,在命令行上敲java AppMain。系统就会启动一个jvm进程,jvm进程从classpath路径中找到一个名为AppMain.class的二进制文件,将MainApp的类信息加载到运行时数据区的方法区内,这个过程叫做MainApp类的加载。
  2. 然后JVM找到AppMain的主函数入口,开始执行main函数。
  3. main函数的第一条命令是Animal  animal = new Animal("Puppy");就是让JVM创建一个Animal对象,但是这时候方法区中没有Animal类的信息,所以JVM马上加载Animal类,把Animal类的类型信息放到方法区中。
  4. 加载完Animal类之后,Java虚拟机做的第一件事情就是在堆区中为一个新的Animal实例分配内存, 然后调用构造函数初始化Animal实例,这个Animal实例持有着指向方法区的Animal类的类型信息(其中包含有方法表,java动态绑定的底层实现)的引用。
  5. 当使用animal.printName()的时候,JVM根据animal引用找到Animal对象,然后根据Animal对象持有的引用定位到方法区中Animal类的类型信息的方法表,获得printName()函数的字节码的地址。
  6. 开始运行printName()函数。
技术分享图片
 图4   java程序运行过程
特别说明:java类中所有public和protected的实例方法都采用动态绑定机制,所有私有方法、静态方法、构造器及初始化方法<clinit>都是采用静态绑定机制。而使用动态绑定机制的时候会用到方法表,静态绑定时并不会用到。

Ps:

 方法重载:这个是发生在编译时的。方法重载也被称为编译时多态,因为编译器可以根据参数的类型来选择使用哪个方法。

1
2
3
4
public class {
     public static void evaluate(String param1);  // method #1
     public static void evaluate(int param1);   // method #2
}

如果编译器要编译下面的语句的话:

1
evaluate(“My Test Argument passed to param1”);

它会根据传入的参数是字符串常量,生成调用#1方法的字节码

 

方法覆盖:这个是在运行时发生的。方法重载被称为运行时多态,因为在编译期编译器不知道并且没法知道该去调用哪个方法。JVM会在代码运行的时候做出决定。

1
2
3
4
5
6
7
8
9
10
11
12
public class A {
   public int compute(int input) {          //method #3
        return 3 * input;
   }       
}
 
public class extends A {
   @Override
   public int compute(int input) {          //method #4
        return 4 * input;
   }       
}

子类B中的compute(..)方法重写了父类的compute(..)方法。如果编译器遇到下面的代码:

1
2
3
public int evaluate(A reference, int arg2)  {
     int result = reference.compute(arg2);
}

编译器是没法知道传入的参数reference的类型是A还是B。因此,只能够在运行时,根据赋给输入变量“reference”的对象的类型(例如,A或者B的实例)来决定调用方法#3还是方法#4.

 








以上是关于Java编译期和运行期 & JVM的主要内容,如果未能解决你的问题,请参考以下文章

ClassLoader Java中类加载出现在哪个阶段,编译期和运行期? 类加载和类装载是一样的吗

ARC在编译期和运行期做了什么

ARC在编译期和运行期做了什么

Java开发环境

深入理解java的反射机制

java的反射机制,理解一下