深入理解JAVA虚拟机第三部分.虚拟机执行子系统.1.类文件结构

Posted 翔鹤岭

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了深入理解JAVA虚拟机第三部分.虚拟机执行子系统.1.类文件结构相关的知识,希望对你有一定的参考价值。

无关性

无关性的体现有两个方面:

  1、平台无关性:可在不同的操作系统和机器指令集上执行,可在不同厂商的虚拟机平台上执行。

  2、语言无关性:用不同编程语言写出的代码编译生成的文件都可以运行。

实现思想:

  面向接口,定义虚拟机和编译器之间的接口规范。也就是编译后文件的存储格式——字节码(ByteCode)。

 

任意一种编程语言,只要生成符合存储格式规范的Class文件,就可以被任意虚拟机执行。

 

 

Class文件结构

Class文件结构是在Java虚拟机规范》中定义的。

Class文件的存储结构类似于C语言的struct。

Class文件是一组以8位字节为基础单位的二进制流,各个数据项目严格按照顺序紧凑地排列在Class文件之中,中间没有添加任何分隔符,这使得整个Class文件中存储的内容几乎全部是程序运行的必要数据,没有空隙存在。 当遇到需要占用8位字节以上空间的数据项时,则会按照高位在前[1]的方式分割成若干个8位字节进行存储。
Class文件中只有两种类型:无符号数和表。表是无符号数和表表的集合。

 

 

Magic Number : 每个Class文件的头4个字节称为魔数(Magic Number),它的唯一作用是确定这个文件是否为一个能被虚拟机接受的Class文件。 固定为 0xCAFEBABE

5和第6个字节是次版本号(Minor Version),第7和第8个字节是主版本号(Major Version) 

常量池(constant_pool主要存放两大类常量:字面量(Literal)和符号引用(Symbolic References)。
  字面量比较接近于Java语言层面的常量概念,如文本字符串、 声明为final的常量值等。

  符号引用则属于编译原理方面的概念,包括了下面三类常量:类和接口的全限定名(Fully Qualified Name),字段的名称和描述符(Descriptor),方法的名称和描述符

  访问标志(access_flags用于识别一些类或者接口层次的访问信息,包括:这个Class是类还是接口;是否定义为public类型;是否定义为abstract类型;如果是类的话,是否被声明为final等。  类索引(this_class)和父类索引(super_class接口索引集合(interfaces字段表(field_info)用于描述接口或者类中声明的变量。

  方法表集合 (methods)

  属性表(attribute_infoClass文件、 字段表、 方法表都可以携带自己的属性表集合,以用于描述某些场景专有的信息。

 

Code属性

首先,这是一个属性,位于属性表里面。

Java程序方法体中的代码经过Javac编译器处理后,最终变字节码指令存储在Code属性内。

Code属性是Class文件中最重要的一个属性,如果把一个Java程序中的信息分为代码(Code,方法体里面的Java代码)和元数据(Metadata,包括类、 字段、 方法定义及其他信息)两部分,那么在整个Class文件中,Code属性用于描述代码,所有的其他数据项目都用于描述元数据。 

字节码指令

Java虚拟机的指令由一个字节长度的、 代表着某种特定操作含义的数字(称为操作码,Opcode)以及跟随其后的零至多个代表此操作所需参数(称为操作数,Operands)而构成。

由于Java虚拟机采用面向操作数栈而不是寄存器的架构(这两种架构的区别和影响将在第8章中探讨),所以大多数的指令都不包含操作数,只有一个操作码。

单字节的优势:短小精悍,存储小,传输快。缺点:解析慢,扩展少。

Java虚拟机的指令集中,大多数的指令都包含了其操作所对应的数据类型信息。  如:iload,fload,dload。

大多数对于booleanbyteshortchar类型数据的操作,实际上都是使用相应的int类型作为运算类型

 

操作类型:加载和存储指令 ,运算指令 ,类型转换指令 ,对象创建与访问指令 ,操作数栈管理指令 ,控制转移指令 ,方法调用和返回指令 ,异常处理指令 ,同步指令 。

一个字节码指令的例子:

void onlyMe(Foo f){
synchronized(f){
doSomething();
} 
}

 编译后生成的字节码:

Method void onlyMe(Foo)
0 aload_1//将对象f入栈
1 dup//复制栈顶元素(即f的引用)
2 astore_2//将栈顶元素存储到局部变量表Slot 2中
3 monitorenter//以栈顶元素(即f)作为锁,开始同步
4 aload_0//将局部变量Slot 0(即this指针)的元素入栈
5 invokevirtual#5//调用doSomething()方法
8 aload_2//将局部变量Slow 2的元素(即f)入栈
9 monitorexit//退出同步
10 goto 18//方法正常结束,跳转到18返回
13 astore_3//从这步开始是异常路径,见下面异常表的Taget 13
14 aload_2//将局部变量Slow 2的元素(即f)入栈
15 monitorexit//退出同步
16 aload_3//将局部变量Slow 3的元素(即异常对象)入栈
17 athrow//把异常对象重新抛出给onlyMe()方法的调用者
18 return//方法正常返回
Exception table:
FromTo Target Type
4 10 13 any
13 16 13 any

 

是不是很像汇编? 这样理解也应该可以:字节码就是虚拟机上的汇编语言。

 

再总结一下

class文件格式,是在JVM虚拟机和各种语言编译器之间的接口。

只要符合这个接口规范,任何语言的任何编译器,编出来的class文件,都可以在任何JVM虚拟机上运行。

 

Class文件分两部分:1、元数据,2、字节码指令集。

这些内容与硬件、 操作系统及具体的Java虚拟机实现之间是完全独立的,虚拟机实现者可能更愿意把它们看做是程序在各种Java平台实现之间互相安全地交互的手段。

 

虚拟机实现的方式主要有以下两种:
将输入的Java虚拟机代码在加载或执行时翻译成另外一种虚拟机的指令集。     -- 好处:适应于各种硬件环境。
将输入的Java虚拟机代码在加载或执行时翻译成宿主机CPU的本地指令集(即JIT代码生成技术)。  -- 好处:提升热点函数的执行速度。  HotSpot的命名即来于此。

 

以上是关于深入理解JAVA虚拟机第三部分.虚拟机执行子系统.1.类文件结构的主要内容,如果未能解决你的问题,请参考以下文章

深入理解Java虚拟机的目录

深入理解JAVA虚拟机第二部分.内存自动管理机制.3.垃圾收集器与内存分配策略

企业级项目实战讲解!深入理解java虚拟机第三版下载

又到一年金三银四!深入理解java虚拟机第三版百度云

深入理解JAVA虚拟机第二部分.内存自动管理机制.2.HotSpot虚拟机对象探秘

深入Java虚拟机中的Stack和Heap