JVM-内存与垃圾回收篇!女朋友看了都想当架构师的超详细保姆级笔记!呕心沥血之作!看完还不会你砍我!
Posted 是阿岚呐
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了JVM-内存与垃圾回收篇!女朋友看了都想当架构师的超详细保姆级笔记!呕心沥血之作!看完还不会你砍我!相关的知识,希望对你有一定的参考价值。
1. JVM与Java体系结构
1.1 Java虚拟机
- Java虚拟机是一台执行Java字节码的虚拟计算机,它拥有独立的运行机制,其运行的Java字节码也未必由Java语言编译而成。
- JVM平台的各种语言可以共享Java虚拟机带来的跨平台性、优秀的垃圾回器,以及可靠的即时编译器。
- Java技术的核心就是Java虚拟机(JVM,Java Virtual Machine),因为所有的Java程序都运行在Java虚拟机内部。
- Java虚拟机就是二进制字节码的运行环境,负责装载字节码到其内部,解释/编译为对应平台上的机器指令执行。每一条Java指令,Java虚拟机规范中都有详细定义,如怎么取操作数,怎么处理操作数,处理结果放在哪里。
- 特点:一次编译、到处运行、自动垃圾回收功能
1.2 JVM
JVM位置
JVM是运行在操作系统上的,与硬件没有直接的交互
整体结构
Java代码执行流程
架构模型
-
基于栈式架构:
-
设计和实现更简单,适用于资源受限的系统;
-
避开了寄存器的分配难题:使用零地址指令方式分配。
-
指令流中的指令大部分是零地址指令,其执行过程依赖于操作栈。指令集更小,编译器容易实现
-
不需要硬件支持,可移植性更好,更好实现跨平台
-
-
基于寄存器式架构:
- 典型的应用是x86的二进制指令集:比如传统的Pc以及android的Davlik虚拟机。
- 指令集架构则完全依赖硬件,可移植性差
- 性能优秀和执行更高效;
- 花费更少的指令去完成一项操作。
- 在大部分情况下,基于寄存器架构的指令集往往都以一地址指令、二地址指令和三地址指令为主,而基于栈式架构的指令集却是以零地址指令为主。
-
总结:
- 由于跨平台性的设计,Java的指令都是根据栈来设计的。不同平台CPU架构不同,所以不能设计为基于寄存器的。优点是跨平台,指令集小,编译器容易实现,缺点是性能下降,实现同样的功能需要更多的指令。
- 栈式架构优缺点:跨平台性、指令集小、指令多;执行性能比寄存器差
生命周期
-
虚拟机的启动
Java虚拟机的启动是通过引导类加载器(bootstrap class loader)创建一个初始类(initial class)来完成的,这个类是由虚拟机的具体实现指定的。
-
虚拟机的执行
一个运行中的Java虚拟机有着一个清晰的任务:执行Java程序。程序开始执行时他才运行,程序结束时他就停止。执行一个所谓的Java程序的时候,真真正正在执行的是一个叫做Java虚拟机的进程。
-
虚拟机的退出
- 程序正常执行结束
- 程序在执行过程中遇到了异常或错误而异常终止
- 由于操作系统出现错误而导致Java虚拟机进程终止
某线程调用Runtime类或system类的exit方法,或Runtime类的halt方法,并且Java’安全管理器也允许这次exitihalt操作。 - 除此之外,JNI( Java Native Interface)规范描述了用JN工Invocation API来加载或卸载Java虚拟机时,Java虚拟机的退出情况。
2. 类加载子系统
2.1 内存结构概述
2.2 类加载器及加载过程
-
类加载器子系统负责从文件系统或者网络中加载class文件,class文件在文件开头有特定的文件标识。
-
classLoader只负责class文件的加载,至于它是否可以运行,则由ExecutionEngine(执行引擎)决定。
-
加载的类信息存放于一块称为方法区的内存空间。除了类的信息外,方法区中还会存放运行时常量池信息,可能还包括字符串字面量和数字常量(这部分常量信息是Class文件中常量池部分的内存映射)
2.3.1 过程1: Loading
过程
- 通过一个类的全限定名获取定义此类的二进制字节流
- 将这个字节流所代表的静态存储结构转化为方法区的运行时数据结构
- 在内存中生成一个代表这个类的java.lang.class对象,作为方法区这个类的各种数据的访问入口
加载.class文件的方式
- 从本地系统中直接加载
- 通过网络获取,典型场景:web Applet
- 从zip压缩包中读取,成为日后jar、war格式的基础
- 运行时计算生成,使用最多的是:动态代理技术
- 由其他文件生成,典型场景:JSP应用
- 从专有数据库中提取.class文件,比较少见
- 从加密文件中获项,典型的防class文件被反编译的保护措施
2.3.2 过程2: Linking
2.3.3 过程3: Initalization
案例1
案例2
2.3 类加载器分类
-
JVM支持两种类型的类加载器,分别为引导类加载器(Bootstrap ClassLoader)和自定义类加载器(User-Defined ClassLoader)。
-
从概念上来讲,自定义类加载器一般指的是程序中由开发人员自定义的一类类加载器,但是Java虚拟机规范却没有这么定义,而是将所有派生于抽象类ClassLoader的类加教器都划分为自定义类加载器。
-
对于用户自定义类来说:默认使用系统类加载器进行加载!
Java的核心内库都是引导类加载器进行加载的!
2.3.1 三种类加载器
引导类加载器跟ClassLoader没任何关系,它是c语言编写。
引导类加载器
- 这个类加载使用C/C++语言实现的,嵌套在JVM内部。
- 它用来加载Java的核心库(JAA_HOME/jre/lib/rt.jar、resources.jar或sun.boot.class.path路径下的内容),用于提供JVM自身需要的类
- 并不继承自java.lang.classLoader,没有父加载器。
- 加载扩展类和应用程序类加载器,并指定为他们的父类加载器。
- 出于安全考虑,Bootstrap启动类加载器只加载包名为java、javax、sun等开头的类
扩展类加载器
- Java语言编互,由sun.misc.Launcher$ExtClassLoader实现。
- 派生于classLoader类
- 父类加载器为启动类加载器
- 从java.ext.dirs系统属性所指定的目录中加载类库,或从JDK的安装目录的jre/lib/ext子目录(扩展目录)下加载类库。如果用户创建的JAR放在此目录下,也会自动由扩展类加载器加载。
应用程序类加载器(系统类加载器)
- java语言编写,由sun.misc.Launcher$AppclassLoader实现
- 派生于classLoader类
- 父类加载器为扩展类加载器
- 它负责加载环境变量classpath或系统属性java.class.path指定路径下的类库
- 该类加载是程序中默认的类加载器,一般来说,Java应用的类都是由它来完成加载
- 通过classLoader#getSystemClassLoader()方法可以获取到该类加载器
2.3.2 用户自定义加载器
为什么需要用户自定义加载器
- 隔离加载类
- 修改类加载的方式
- 扩展加载源
- 防止源码泄漏
用户自定义类加载器实现步骤
- 开发人员可以通过继承抽象类java.lang.classLoader类的方式,实现自己的类加载器,以满足一些特殊的需求
- 在JDK1.2之前,在自定义类加载器时,总会去继承classLoader类并重写loadclass()方法,从而实现自定义的类加载类,但是在JDK1.2之后已不再建议用户去覆盖loadclass ()方法,而是建议把自定义的类加载逻辑写在findclass()方法中。
- 在getClassFromCustomPath类中加载自定义路径的指定类,如果指定路径的字节码文件进行了加密,则需要在此方法中进行解密操作
- 在编写自定义类加载器时,如果没有太过于复杂的需求,可以直接继承URLClassLoader类,这样就可以避免自己去编写findClass()方法及其获取字节码流的方式,使自定义类加载器编写更加简洁。
2.3.3 类加载器的常用方法
2.4 双亲委派机制
介绍
Java虚拟机对class文件采用的是按需加载的方式,也就是说当需要使用该类时才会将它的class文件加载到内存生成class对象。而且加载某个类的class文件时,Java虚拟机采用的是双亲委派模式,即把请求交由父类处理,它是一种任务委派模式。
工作原理
- 如果一个类加载器收到了类加载请求,它并不会自己先去加载,而是把这个请求委托给父类的加载器去执行;
- 如果父类加载器还存在其父类加载器,则进一步向上委托,依次递归,请求最终将到达顶层的启动类加载器;
- 如果父类加载器可以完成类加载任务,就成功返回,倘若父类加载器无法完成此加载任务,子加载器才会尝试自己去加载,这就是双亲委派模式。
沙箱安全机制
创建一个包java.lang,在里面自定义一个类String,那么这个类的全限定名就是java.lang.String,然后在测试类中new一个String,请问这个String,是自定义的还是java核心api中的?
答案:核心api中的String
原因:自定义类String,如果一运行,根据双亲委派机制,会首先由系统类加载器将其传递到扩展类加载器,然后再传递到引导类加载器,引导类加载器对java开头的都会进行加载,但是加载的还是api中的String,并不会加载自定义类的,这样可以保证对java核心源代码的保护,这就是沙箱保护机制!
例子
我们想要将SPI接口加载到内存,于是一直委派到引导类加载器进行加载,然后里面接口的实现类也需要加载,但实现类的加载被反向委派到系统类加载器加载,具体由当前的线程上下文加载器(一种系统类加载器)进行加载。
双亲委派机制的优点
- 避免类的重复加载
- 保护程序安全,防止核心API被随意篡改!
- 上例中的String
- 我们如果定义java.lang.XXX随便一个类,进行执行,会报错,就是因为是java.lang包下,无权限。
2.5 其他知识
几个概念
-
在JVM中表示两个class对象是否为同一个类存在两个必要条件:
- 类的完整类名必须一致,包括包名。
- 加载这个类的ClassLoader(指classLoader实例对象)必须相同。
-
换句话说,在JVM中,即使这两个类对象(class对象)来源同一个class文件,被同一个虚拟机所加载,但只要加载它们的classLoader实例对象不同,那么这两个类对象也是不相等的。
类的主动使用和被动使用
主动使用:
- 创建类的实例
- 访问某个类或接口的静态变量,或者对该静态变量赋值
- 调用类的静态方法
- 反射(比如:Class.forName ( “com.atguigu.Test” ))
- 初始化一个类的子类
- Java虚拟机启动时被标明为启动类的类
- JDK 7开始提供的动态语言支持:
java . lang.invoke.MethodHandle实例的解析结果
REF_getstatic、REF_putstatic、REF_invokestatic句柄对
应的类没有初始化,则初始化
3. 运行时数据区
3.1 内部结构
(方法区和堆是有垃圾回收的)
3.2 线程
几个概念
- 线程是一个程序里的运行单元。JVM允许一个应用有多个线程并行的执行。
- 在Hotspot JVM里,每个线程都与操作系统的本地线程直接映射。当一个Java线程准备好执行以后,此时一个操作系统的本地线程也同时创建。Java线程执行终止后,本地线程也会回收。
- 操作系统负责所有线程的安排调度到任何一个可用的CPU上。一旦本地线程初始化成功,它就会调用Java线程中的run()方法。
3.3 程序计数器(PC寄存器)
概述
- PC寄存器用来存储指向下一条指令的地址,即将要执行的指令代码。由执行引擎读取下一条指令。
- 它是一块很小的内存空间,几乎可以忽略不记。也是运行速度最快的存储区域。
- 在JVM规范中,每个线程都有它自己的程序计数器,是线程私有的,生命周期与线程的生命周期保持一致。
- 任何时间一个线程都只有一个方法在执行,也就是所谓的当前方法。程序计数器会存储当前线程正在执行的Java方法的JVM指令地址;或者,如果是在执行native方法,则是未指定值((undefned)。
- 它是程序控制流的指示器,分支、循环、跳转、异常处理、线程恢复等基础功能都需要依赖这个计数器来完成。
- 字节码解释器工作时就是通过改变这个计数器的值来选取下一条需要执行的字节码指令。
- 它是唯一一个在Java虚拟机规范中没有规定任何outOtMemoryError情况的区域。
例子
class A {
public static void main(String[] args){
int i = 20;
int j = 20;
int k = i + j;
String s = "abc";
Sytem.out.println(i);
Sytem.out.println(k);
}
}
两个问题
-
使用PC寄存器存储字节码指令地址有什么用呢?
答:因为CPU需要不停地切换各个线程,这时候切换回来以后,就得知道接着从哪开始继续执行,即需要明确下一条应该执行什么样的字节码指令。
-
PC寄存器为什么会被设定为线程私有?
答:我们都知道所谓的多线程在一个特定的时间段内只会执行其中某一个线程的方法,CPU会不停地做任务切换,这样 必然导致经常中断或恢复,如何保证分毫无差呢?为了能够准确地记录各个线程正在执行的当前字节码指令地址,最好的办法自然是为每一个线程都分配一个PC寄存器,这样一来各个线程之间便可以进行独立计算,从而不会出现相互千扰的情况。
3.4 虚拟机栈
3.4.1 概述
概述
- 由于跨平台性的设计,Java的指令都是根据栈来设计的。不同平台CPU架构不同.所以不能设计为基干寄存器的。
- 优点是跨平台,指令集小,编译器容易实现,缺点是性能下降,实现同样的功能需要更多的指令。
- 内存中的栈和堆:
- 栈是运行时的单位,而堆是存储的单位。
- 即:栈解决程序的运行问题,即程序如何执行,或者说如何处理数据。堆解决的是数据存储的问题,即数据怎么放、放在哪儿。
- 基本内容:
- Java虚拟机栈,早期也叫Java栈,每个线程在创建时都会创建一个虚拟机栈(一个线程对应一个栈),其内部保存一个个的栈帧,对应着一次次的Java方法调用。是线程私有的。
- 生命周期:生命周期和线程一致。
- 作用:主管Java程序的运行,它保存方法的局部变量(8种基本数据类型、对象引用地址)、部分结果,并参与方法的调用和返回。
- 优点:
- 栈是一种快速有效的分配存储方式,访问速度仅次于程序计数器。
- JVM直接对Java栈的操作只有两个:
每个方法执行,伴随着进栈(入伐、压栈)
执行结束后的出栈工作 - 对于栈来说不存在垃圾回收问题
举例
public class A{
public static void main(String[] args){
A test = new A();
test.B();
}
public void B(){
int i = 10;
int j = 20;
C();
}
public void C(){
int k = 30;
int m = 40;
}
}
3.4.2 常见异常及设置栈大小
概念
-
Java虚拟机规范允许Java栈的大小是动态的或者是固定不变的。
-
如果采用固定大小的Java虚拟机栈,那每一个线程的Java虚拟机栈容量可以在线程创建的时候独立选定。如果线程请求分配的栈容量超过Java虚拟机栈允许的最大容量,Java虚拟机将会抛出一个stackoverflowError异常。
-
如果Java虚拟机栈可以勤态扩展,并且在尝试扩展的时候无法中请到足够的内存,或者在创建新的线程时没有足够的内存去创建对应的虚拟机栈,那Java虚拟机将会抛出一个OutOfMemoryError异常。
-
我们可以使用参数**「-Xss+具体大小」**来设置线程的最大栈空间,栈的大小直接决定了函数调用的最大可达深度。
3.4.3 存储结构和运行原理
栈中存储什么?
- 每个线程都有自己的栈,栈中的数据都是以栈帧的格式存在。
- 在这个线程上正在执行的每个方法都各自对应一个栈帧。
- 栈帧是一个内存区块,是一个数据集,维系着方法执行过程中的各种数据信息。
运行原理
-
JVM直接对Java栈的操作只有两个,就是对栈帧的压栈和出栈,遵循“先进后出”、“后进先出”原则。
-
在一条活动线程中,一个时间点上,只会有一个活动的栈帧。即只有当前正在执行的方法的栈帧(栈顶栈帧)是有效的,这个栈帧被称为当前栈帧,与当前栈帧相对应的方法就是当前方法,定义这个方法的类就是当前类 。
-
执行引擎运行的所有字节码指令只针对当前栈帧进行操作。如果在该方法中调用了其他方法,对应的新的栈帧会被创建出来,放在栈的顶端,成为新的当前帧。
-
不同线程中所包含的栈帧是不允许存在相互引用的,即不可能在一个栈帧之中引用另外一个线程的栈帧。
-
如果当前方法调用了其他方法,方法返回之际,当前栈帧会传回此方法的执行结果给前一个栈帧,接着,虚拟机会丢弃当前栈帧,使得前一个栈帧重新成为当前栈帧。
-
Java方法有两种返回函数的方式,一种是正常的函数返回,使用return指令;另外一种是抛出异常。不管使用哪种方式,都会导致栈帧被弹出。
3.4.4 栈帧的内部结构
- 局部变量表(Local variables)
- 操作数栈(operand stack)(或表达式栈)
- 动态链接(Dynamic Linking)(或指向运行时常量池的方法引用)
- 方法返回地址(Return Address)(或方法正常退出或者异常退出的定义)
- 一些附加信息
3.4.4.1 局部变量表
介绍
- 局部变量表也被称之为局部变量数组或本地变量表
- 定义为一个数字数组,主要用于存储方法参数和定义在方法体内的局部变量这些数据类型包括各类基本数据类型、对象引用(reference),以及returnAddress类型。
- 由于局部变量表是建立在线程的栈上,是线程的私有数据,因此不存在数据安全问题
- 局部变量表所需的容量大小是在编译期确定下来的,并保存在方法的Code属性的maximum local variables数据项中。在方法运行期间是不会改变局部变量表的大小的。
- 方法嵌套调用的次数由栈的大小决定。一般来说,栈越大,方法嵌套调用次数越多。对一个函数而言,它的参数和局部变量越多,使得局部变量表膨胀它的伐帧就越大,以满足方法调用所需传递的信息增大的需求。进而函数调用就会占用更多的栈空间,导致其嵌套调用次数就会减少。
- 局部变量表中的变量只在当前方法调用中有效。在方法执行时,虚拟机通过使用局部变量表完成参数值到参数变量列表的传递过程。当方法调用结束后,随着方法栈帧的销毁,局部变量表也会随之销毁。
(下面LocalariableTable表详解)
3.4.4.2 变量槽Slot的理解
介绍
-
参数值的存放总是在局部变量数组的index0开始,到数组长度-1的索引结束。
-
局部变量表,最基本的存储单元是slot(变量槽)
-
局部变量表中存放编译期可知的各种基本数据类型(8种),引用类型(reference),returnAddress类型的变量。
-
在局部变量表里,32位以内的类型只占用一个slot(包括returnAddress类型),64位的类型(long和double)占用两个slot。
- byte 、 short 、 char在存储前被转换为int,boolean也被转换为int,0表示false ,非0表示true。
- long和double则占据两个slot。
-
JVM会为局部变量表中的每一个Slot都分配一个访问索引,通过这个索引即可成功访问到局部变量表中指定的局部变量值
-
当一个实例方法被调用的时候,它的方法参数和方法体内部定义的局部变量将会按照声明顺序被复制到局部变量表中的每一个slot上
-
如果需要访问局部变量表中一个64bit的局部变量值时,只需要使用前一个索引即可。(比如:访问long或double类型变量)
-
如果当前帧是由构造方法或者实例方法创建的,那么该对象引用this将套存放在index为0的slot处,其余的参数按照参数表顺序继续排列。(由于这一条的存在,因此在实际编码中,静态方法中是不可能用this的)
public static void A(){ int count = 10; System.out.println(count); //因为this变量不存在当前方法的局部变量表中 System.out.println(this.count) // this会爆红 }
-
栈帧中的局部变量表中的槽位是可以重用的,如果一个局部变量过了其作用域,那么在其作用域之后申明的新的局部变量就很有可能会复用过期局部变量的槽位,从而达到节省资源的目的。
-
在栈帧中,与性能调优关系最为密切的部分就是前面提到的局部变量表。在方法执行时,虚拟机使用局部变量表完成方法的传递。
-
局部变量表中的变量也是重要的垃圾回收根节点,只要被局部变量表中直接或间接引用的对象都不会被回收。
类变量和局部变量的区别
- 类变量有两次初始化的机会,第一次是在类加载子系统中的prepare阶段,执行系统初始化,对类变量设置零值,另一次则是在initialization阶段,赋予程序员在代码中定义的初始值,因此我们可以不显式赋值,这样它的初值默认就是为0。
- 而局部变量不存在系统初始化过程,因此我们必须人为地初始化它,给它赋初值,否则就会报错。
public class A {
public static int a;
public static void main(String[] args) {
int b;
// System.out.println(a); // 0
System.out.println(b); // 报错
}
}
3.4.4.3 操作数栈
介绍
-
每一个独立的栈帧中除了包含局部变量表以外,还包含一个后进先出的操作数栈,也可以称之为表达式栈。
-
操作数栈,在方法执行过程中,根据字节码指令,往栈中写入数据或提取数据,即入栈/出栈。
- 某些字节码指令将值压入操作数栈,其余的字节码指令将操作数取出栈。使用它们后再把结果压入栈。
- 比如:执行复制、交换、求和等操作
-
操作数栈,主要用于保存计算过程的中间结果,同时作为计算过程中变量临时的存储空间。
-
操作数栈就是JVM执行引擎的一个工作区,当一个方法刚开始执行的时候,一个新的栈帧也会随之被创建出来,这个方法的操作数栈是空的。
-
每一个操作数栈都会拥有一个明确的栈深度用于存储数值,其所需的最大深度在编译期就定义好了,保存在方法的code属性中,为max_stack的值。
-
栈中的任何一个元素都是可以任意的Java数据类型。
- 32bit的类型占用一个栈单位深度
- 64bit的类型占用两个栈单位深度
-
操作数栈并非采用访问索引的方式来进行数据访问的,而是只能通过标准的入栈和出栈操作来完成一次数据访问。
-
如果被调用的方法带有返回值的话,其返回值将会被压入前栈帧的操作数栈中,并更新PC寄存器中下一条需要执行的字节码指令。
-
操作数栈中元素的数据类型必须与字节码指令的序列严格匹配,这由编译器在编译器期间进行验证,同时在类加载过程中的类检验阶段的数据流分析阶段要再次验证。
-
另外,我们说Java虚拟机的解释引擎是基于栈的执行引擎,其中的栈指的就是操作数栈。
工作流程
public class A {
public static void main(String[] args) {
byte i = 15;
int j = 8;
int k = i + j;
}
}
3.4.4.4 栈顶缓存技术
介绍
前面提过,基于栈式架构的虚拟机所使用的零地址指气更加紧凑,但完成一项操作的时候必然需要使用更多的入栈和出栈指令,这同时也就意味着将需要更多的指令分派(instruction dispatch)次数和内存读/写次数。
由于操作数是存储在内存中的,因此频繁地执行内存读/写操作必然会影响执行速度。为了解决这个问题,HotSpot JVM的设计者们提出了栈顶缓存(ToS,Top-of-stack Cashing)技术,将栈顶元素全部缓存在物理CPU的寄存器中,以此降低对内存的读/写次数,提升执行引擎的执行效率。
3.4.4.5 动态链接
介绍
- 每一个栈帧内部都包含一个指向运行时常量池中该栈帧所属方法的引用。包含这个引用的目的就是为了支持当前方法的代码能够实现动态链接,比如: invokedynamic指令
- 在Java源文件被编译到字节码文件中时,所有的变量和方法引用都作为符号引用(Symbolic Reference)保存在class文件的常量池里。比如:描述一个方法调用了另外的其他方法时,就是通过常量池中指向方法的符号引用来表示的,那么动态链接的作用就是为了将这些符号引用转换为调用方法的直接引用。
- 为什么需要常量池呢?
常量池的作用,就是为了提供一些符号和常量,便于指令的识别。
3.4.4.6 方法的调用
静态绑定和动态绑定
- 在JVM中,将符号引期转换为调用方法的直接引用与方法的绑定机制相关。
- 静态链接:当一个字节码文件被装载进JVM内部时,如果被调用的目标方法在编译期可知且运行期保持不变时。这种情况下将调用方法的符号引用转换为直接引用的过程称之为静态链接。
- 动态链接:如果被调用的方法在编译期无法被确定下来,也就是说,只能够在程序运行期将调用方法的符号引用转换为直接引用,由于这种引用转换过程具备动态性,因此也就被称之为动态链接。
- 对应的方法的绑定机制为:早期绑定Early Binding)和晚期绑定。绑定是一个字段、方法或者类在符号引用被替换为直接引用的过程,这仅仅发生一次。|
- 早期绑定:
早期绑定就是指被调用的目标方法如果在编译期可知,且运行期保持不变时即可将这个方法与所属的类型进行绑定,这样一来,由于明确了被调用的目标方法究竟是哪一个,因此也就可以使用静态链接的方式将符号引用转换为直接引用。 - 晚期绑定:
如果被调用的方法在编译期无法被确定下来,只能够在程序运行期根据实际的类型绑定相关的方法,这种绑定方式也就被称之为晚期绑定。 - 随着高级语言的横空出世,类似于Java一样的基于面向对象的编程语言如今越来越多,尽管这类编程语言在语法风格上存在一定的差别,但是它们彼此之间始终保持着一个共性,那就是都支持封装、继承和多态等面向对象特性,既然这一类的编程语言具备多态特性,那么自然也就具备早期绑定和晚期绑定两种绑定方式。
- Java中任何一个普通的方法其实都具备虚函数的特征,它们相当于C++语言中的虚函数(C++中则需要使用关键字virtual来显式定义)。如果在Java程序中不希望某个方法拥有虚函数的特征时,则可以使用关键字final来标记这个方法。
虚方法和非虚方法
- 非虚方法:
- 如果方法在编译期就确定了具体的调用版本,这个版木在运行时是不可变的这样的方法称为非虚方法。
- 静态方法、私有方法、final方法、实例构造器、父类方法都是非虚方法。
- 其他方法称为虚方法。
- 虚拟机中提供了以下几条方法调用指令:
前四条指令固化在虚拟机内部,方法的调用执行不可人为千预,而invokedynamic指令则支持由用户确定方法版本。其中invokestatic指令和invokespecial指令调用的方法称为非虚方法,其余的(final修饰的除外)称为虚方法。- 普通调用指令:
- invokestatic:调用静态方法,解析阶段确定唯一方法版本
- invokevirtual:调用所有虚方法
- invokeinterface:调用接口方法
- invokespecial:调用方法、私有及父类方法,解析阶段确定唯一方法版本
- 动态调用指令
- invokeynamic:动态解析出需要调用的方法,然后执行
- 普通调用指令:
- 例子:一个类Father,有方法A()打印内容3,,子类Son继承Father,有一个测试方法test(Father f),方法内容为f.A();此时由于既不确定传入的f是父类Father实例对象还是子类Son实例对象,也不确定子类是否重写了父类方法,假设传入的是子类实例对象son,如果重写了,打印内容是2,f.A()就是另外一种重写后的结果即son.A()即打印2,如果没有重写,就是父类方法的结果打印3。在这种编译期无法确定代码结果,而只能在运行期才能确定的方法A(),被称为虚方法。
invokedynamic指令的使用
-
JVM字节码指令集一直比较稳定,一直到Java7中才增加了一个invokedynamic指令,这是Java为了实现『动态类型语言』支持而做的一种改进。
-
但是在Java7中并没有提供直接生成invokedynamic指令的方法,需要借助ASM这种底层字节码工具来产生invokedynamic指令。直到Java8的Lambda表达式的出现,invokedynamic指令的生成,在Java中才有了直接的生成方式。
-
Java7中增加的动态语言类型支持的本质是对Java虚拟机规范的修改,而不是对Java语言规则的修改,这一块相对来讲比较复杂,增加了虚拟机中的方法调用,最直接的受益者就是运行在Java平台的动态语言的编译器。
-
动态类型语言和静态类型语言两者的区别就在于对类型的检查是在编译期还是在运行期,满足前者就是静态类型语言,反之是动态类型语言。说的再直白一点就是,静态类型语言是判断变量自身的类型信息;动态类型语言是判断变量值的类型信息,变量没有类型信息,变量值才有类型信息,这是动态语言的一个重要特征。
// Java中,由于直接申明了变量info为String类型,所以我们知道值qwe是String类型的,这就是静态类型语言的特征 String info = "qwe"
// JS中,var只能申明变量,但不具备申明变量类型的功能,我们只有在看到值的时候,才知道它的类型。 var info = "qwe" var info = 10
/* Python中,同样只能在看到值的时候,才知道它的类型 这种判断变量值的类型信息,就是动态类型语言 /* info = 130.5 info = "name"
方法重写的本质
- 找到操作数栈顶的第一个元素所执行的对象的实际类型,记作 C。
- 如果在类型c中找到与常量中的描述符合简单名称都相符的方法,则进行访问权限校验,如果通过则返回这个方法的直接引用,查找过程结束;如果不通过,则返回java.lang.IllegalAccessError异常。
- 否则,按照继承关系从下往上依次对己的各个父类进行第⒉步的搜索和验证过程。
- 如果始终没有找到合适的方法,则抛出java.lang.AbstractMethodError异常。
- 1llegalAccessError:
程序试图访问或修改一个属性或调用一个方法,这个属性或方法,你没有权限访问。一般的,这个会引起编译器异常。这个错误如果发生在运行时,就说明一个类发生了不兼容的 - 在面向对象的编程中,会很频繁的使用到动态分派,如果在每次动态分派的过程中都要重新在类的方法元数据中搜索合适的目标的话就可能影响到执行效率。因此,为了提高性能,JVM采用在类的方法区建立一个虚方法表(非虚方法不会出现在表中)来实现。使用索引表来代替查找。
- 每个类中都有一个虚方法表,表中存放着各个方法的实际入口。
- 虚方法表会在类加载的链接阶吐被创建并开始初始化,类的变量初始值准备完成之后,JVM会把该类的方法表也初始化完毕。
3.4.4.7 方法返回地址
概念
-
存放调用该方法的pc寄存器的值。
-
一个方法的结束,有两种方式:
- 正常执行完成
- 出现未处理的异常,非正常退出
-
无论通过哪种方式退出,在方法退出后都返回到该方法被调用的位置。方法正常退出时,调用者的pc寄存器的值作为返回地址,即调用该方法的指令的下一条指令的地址。而通过异常退出的,返回地址是要通过异常表来确定,栈帧中一般不会保存这部分信息。
-
本质上,方法的退出就是当前栈帧出栈的过程。此时,需要恢复上层方法的局部变量表、操作数栈、将返回值压入调用者栈帧的操作数栈、设置PC寄存器值等,让调用者方法继续执行下去。
-
正常完成出口和异常完成出口的区别在于:通过异常完成出口退出的不会给他的上层调用者产生任何的返回值。
-
当一个方法开始执行后,只有两种方式可以退出这个方法:
- 执行引擎遇到任意一个方法返回的字节码指令(return),会有返回值传递给上层的方法调用者,简称正常完成出口
- 一个方法在正常调用完成之后究竟需要使用哪一个返回指令还需要根据方法返回值的实际数据类型而定。
- 在字节码指令中,返回指令包含ireturn(当返回值是boolean、byte、char.short和int类型时使用)、lreturn. freturn、dreturn以及areturn,另外还有一个return指令供声明为void的方法、实例初始化方法、类和接口的初始化方法使用。
- 在方法执行的过程中遇到了异常(Exception),并且这个异常没有在方法内进行处理,也就是只要在本方法的异常表中没有搜索到匹配的异常处理器,就会导致方法退出。简称异常完成出口。方法执行过程中抛出异常时的异常处理,存储在一个异常处理表,方便在发生异常的时候找到处理异常的代码。
- 执行引擎遇到任意一个方法返回的字节码指令(return),会有返回值传递给上层的方法调用者,简称正常完成出口
3.4.4.8 一些附加信息
介绍
栈帧中还允许携带与Java虚拟机实现相关的一些附加信息。例如,对程序调试提供支持的信息。
3.4.5 一些面试题
面试题
-
举例栈溢出的情况?
答:OOM
-
调整栈大小,就能保证不出现溢出吗?
答:不能,如果在大代码量的情况下,例如递归调用,只能说推迟出现溢出的时间,但也不能绝对避免
-
分配的栈内存越大越好吗?
答:栈内存越大,使得OOM的概率越低,但是挤占其它栈的空间
-
垃圾回收是否会涉及到虚拟机栈?
答:不会
-
方法中定义的局部变量是否安全?
答:不一定,如果局部变量的生成和销毁都在方法内部,则是安全的,如果不是,在多线程的情况下就不一定安全。
3.5 本地方法栈
本地方法接口的理解
- 简单地讲,一个Native Method就是一个Java调用非Java代码的接口。一个Native Method是这样一个Java方法:该方法的实现由非Java语言实现,比如C。这个特征并非Java所特有,很多其它的编程语言都有这一机制,比如在C++中,你可以用extern "c"告知C++编译器去调用一个c的函数。
- 在定义一个native method时,并不提供实现体(有些像定义一个Javainterface) ,因为其实现体是由非java语言在外面实现的。
- 本地接口的作用是融合不同的编程语言为J
以上是关于JVM-内存与垃圾回收篇!女朋友看了都想当架构师的超详细保姆级笔记!呕心沥血之作!看完还不会你砍我!的主要内容,如果未能解决你的问题,请参考以下文章
JVM-内存与垃圾回收篇!女朋友看了都想当架构师的超详细保姆级笔记!呕心沥血之作!看完还不会你砍我!
JVM-内存与垃圾回收篇!女朋友看了都想当架构师的超详细保姆级笔记!呕心沥血之作!看完还不会你砍我!