Java二进制指令代码解析

Posted 2020-09-20 zengkefu

tags:

篇首语：本文由小常识网(cha138.com)小编为大家整理，主要介绍了Java二进制指令代码解析相关的知识，希望对你有一定的参考价值。

http://www.blogjava.net/DLevin/archive/2011/09/13/358497.html

http://blog.csdn.net/sum_rain/article/details/39892219

http://www.blogjava.net/DLevin/archive/2011/09/13/358497.html

Java二进制指令代码解析

小注：去年在看《深入解析JVM》书的时候做的一些记录，同时参考了《Java虚拟机规范》。只是对指令的一些列举，加入了一些自己的理解。可以用来查询。

Java二进制指令代码解析

Java源码在运行之前都要编译成为字节码格式（如.class文件），然后由ClassLoader将字节码载入运行。在字节码文件中，指令代码只是其中的一部分，里面还记录了字节码文件的编译版本、常量池、访问权限、所有成员变量和成员方法等信息（详见Java字节码格式详解）。本文主要简单介绍不同Java指令的功能以及在代码中如何解析二进制指令。

Java指令是基于栈的体系结构，大部分的指令默认的操作数在栈中。映像中ARM是基于寄存器的操作指令，而x86好像是混合寄存器和存储器的，发现基于栈的操作指令确实简单，学起来很快。不过不知道这种操作的效率怎么样，以我自己的推测应该是不太好的。对这方面不太了解，随便扯几句。

Java总共有200多条指令，不过很多都是重复的。我的理解，网络是Java一个非常重要的特性，而且Java在设计之初就认为字节码是要在网络中传输的，为了减少网络传输流量，字节码就要尽量设计精简、紧凑。因而Java增加了很多重复指令，比如尽量减少操作数，因而我们会发现Java的很多指令都是没有操作数的；并且指令中的操作数基本上都是当无法将值放到栈中的数据，比如局部变量的索引号和常量池中的索引号。

还有一点需要注意的是，在运行过程中，所有boolean、byte、char、short都是以int类型值存在，因而对这些类型的指令操作很少。然而好像sun实现的虚拟机中。这些类型的数组据说不是以int类型的形式保存的，这个很奇怪。我的理解，以字对齐方式的操作效率会比较高，因而做了这种转换，以空间换时间。

Java指令集（按功能分类）

常量入栈指令
操作码（助记符）	操作数	描述（栈指操作数栈）
aconst_null		null值入栈。
iconst_m1		-1(int)值入栈。
iconst_0		0(int)值入栈。
iconst_1		1(int)值入栈。
iconst_2		2(int)值入栈。
iconst_3		3(int)值入栈。
iconst_4		4(int)值入栈。
iconst_5		5(int)值入栈。
lconst_0		0(long)值入栈。
lconst_1		1(long)值入栈。
fconst_0		0(float)值入栈。
fconst_1		1(float)值入栈。
fconst_2		2(float)值入栈。
dconst_0		0(double)值入栈。
dconst_1		1(double)值入栈。
bipush	valuebyte	valuebyte值带符号扩展成int值入栈。
sipush	valuebyte1 valuebyte2	(valuebyte1 << 8) \| valuebyte2 值带符号扩展成int值入栈。
ldc	indexbyte1	常量池中的常量值（int, float, string reference, object reference）入栈。
ldc_w	indexbyte1 indexbyte2	常量池中常量（int, float, string reference, object reference）入栈。
ldc2_w	indexbyte1 indexbyte2	常量池中常量（long, double）入栈。

局部变量值转载到栈中指令
操作码（助记符）	操作数	描述（栈指操作数栈）
(wide)aload	indexbyte	从局部变量indexbyte中装载引用类型值入栈。
aload_0		从局部变量0中装载引用类型值入栈。
aload_1		从局部变量1中装载引用类型值入栈。
aload_2		从局部变量2中装载引用类型值入栈。
aload_3		从局部变量3中装载引用类型值入栈。
(wide)iload	indexbyte	从局部变量indexbyte中装载int类型值入栈。
iload_0		从局部变量0中装载int类型值入栈。
iload_1		从局部变量1中装载int类型值入栈。
iload_2		从局部变量2中装载int类型值入栈。
iload_3		从局部变量3中装载int类型值入栈。
(wide)lload	indexbyte	从局部变量indexbyte中装载long类型值入栈。
lload_0		从局部变量0中装载int类型值入栈。
lload_1		从局部变量1中装载int类型值入栈。
lload_2		从局部变量2中装载int类型值入栈。
lload_3		从局部变量3中装载int类型值入栈。
(wide)fload	indexbyte	从局部变量indexbyte中装载float类型值入栈。
fload_0		从局部变量0中装载float类型值入栈。
fload_1		从局部变量1中装载float类型值入栈。
fload_2		从局部变量2中装载float类型值入栈。
fload_3		从局部变量3中装载float类型值入栈。
(wide)dload	indexbyte	从局部变量indexbyte中装载double类型值入栈。
dload_0		从局部变量0中装载double类型值入栈。
dload_1		从局部变量1中装载double类型值入栈。
dload_2		从局部变量2中装载double类型值入栈。
dload_3		从局部变量3中装载double类型值入栈。
aaload		从引用类型数组中装载指定项的值。
iaload		从int类型数组中装载指定项的值。
laload		从long类型数组中装载指定项的值。
faload		从float类型数组中装载指定项的值。
daload		从double类型数组中装载指定项的值。
baload		从boolean类型数组或byte类型数组中装载指定项的值（先转换为int类型值，后压栈）。
caload		从char类型数组中装载指定项的值（先转换为int类型值，后压栈）。
saload		从short类型数组中装载指定项的值（先转换为int类型值，后压栈）。

将栈顶值保存到局部变量中指令
操作码（助记符）	操作数	描述（栈指操作数栈）
(wide)astore	indexbyte	将栈顶引用类型值保存到局部变量indexbyte中。
astroe_0		将栈顶引用类型值保存到局部变量0中。
astore_1		将栈顶引用类型值保存到局部变量1中。
astore_2		将栈顶引用类型值保存到局部变量2中。
astore_3		将栈顶引用类型值保存到局部变量3中。
(wide)istore	indexbyte	将栈顶int类型值保存到局部变量indexbyte中。
istore_0		将栈顶int类型值保存到局部变量0中。
istore_1		将栈顶int类型值保存到局部变量1中。
istore_2		将栈顶int类型值保存到局部变量2中。
istore_3		将栈顶int类型值保存到局部变量3中。
(wide)lstore	indexbyte	将栈顶long类型值保存到局部变量indexbyte中。
lstore_0		将栈顶long类型值保存到局部变量0中。
lstore_1		将栈顶long类型值保存到局部变量1中。
lstore_2		将栈顶long类型值保存到局部变量2中。
lstroe_3		将栈顶long类型值保存到局部变量3中。
(wide)fstore	indexbyte	将栈顶float类型值保存到局部变量indexbyte中。
fstore_0		将栈顶float类型值保存到局部变量0中。
fstore_1		将栈顶float类型值保存到局部变量1中。
fstore_2		将栈顶float类型值保存到局部变量2中。
fstore_3		将栈顶float类型值保存到局部变量3中。
(wide)dstore	indexbyte	将栈顶double类型值保存到局部变量indexbyte中。
dstore_0		将栈顶double类型值保存到局部变量0中。
dstore_1		将栈顶double类型值保存到局部变量1中。
dstore_2		将栈顶double类型值保存到局部变量2中。
dstore_3		将栈顶double类型值保存到局部变量3中。
aastore		将栈顶引用类型值保存到指定引用类型数组的指定项。
iastore		将栈顶int类型值保存到指定int类型数组的指定项。
lastore		将栈顶long类型值保存到指定long类型数组的指定项。
fastore		将栈顶float类型值保存到指定float类型数组的指定项。
dastore		将栈顶double类型值保存到指定double类型数组的指定项。
bastroe		将栈顶boolean类型值或byte类型值保存到指定boolean类型数组或byte类型数组的指定项。
castore		将栈顶char类型值保存到指定char类型数组的指定项。
sastore		将栈顶short类型值保存到指定short类型数组的指定项。

wide指令
操作码（助记符）	操作数	描述（栈指操作数栈）
wide		使用附加字节扩展局部变量索引（iinc指令特殊）。

通用（无类型）栈操作指令
操作码（助记符）	操作数	描述（栈指操作数栈）
nop		空操作。
pop		从栈顶弹出一个字长的数据。
pop2		从栈顶弹出两个字长的数据。
dup		复制栈顶一个字长的数据，将复制后的数据压栈。
dup_x1		复制栈顶一个字长的数据，弹出栈顶两个字长数据，先将复制后的数据压栈，再将弹出的两个字长数据压栈。
dup_x2		复制栈顶一个字长的数据，弹出栈顶三个字长的数据，将复制后的数据压栈，再将弹出的三个字长的数据压栈。
dup2		复制栈顶两个字长的数据，将复制后的两个字长的数据压栈。
dup2_x1		复制栈顶两个字长的数据，弹出栈顶三个字长的数据，将复制后的两个字长的数据压栈，再将弹出的三个字长的数据压栈。
dup2_x2		复制栈顶两个字长的数据，弹出栈顶四个字长的数据，将复制后的两个字长的数据压栈，再将弹出的四个字长的数据压栈。
swap		交换栈顶两个字长的数据的位置。Java指令中没有提供以两个字长为单位的交换指令。

类型转换指令
操作码（助记符）	操作数	描述（栈指操作数栈）
i2f		将栈顶int类型值转换为float类型值。
i2l		将栈顶int类型值转换为long类型值。
i2d		将栈顶int类型值转换为double类型值。
f2i		将栈顶float类型值转换为int类型值。
f2l		将栈顶float类型值转换为long类型值。
f2d		将栈顶float类型值转换为double类型值。
l2i		将栈顶long类型值转换为int类型值。
l2f		将栈顶long类型值转换为float类型值。
l2d		将栈顶long类型值转换double类型值。
d2i		将栈顶double类型值转换为int类型值。
d2f		将栈顶double类型值转换为float类型值。
d2l		将栈顶double类型值转换为long类型值。
i2b		将栈顶int类型值截断成byte类型，后带符号扩展成int类型值入栈。
i2c		将栈顶int类型值截断成char类型值，后带符号扩展成int类型值入栈。
i2s		将栈顶int类型值截断成short类型值，后带符号扩展成int类型值入栈。

整数运算
操作码（助记符）	操作数	描述（栈指操作数栈）
iadd		将栈顶两int类型数相加，结果入栈。
isub		将栈顶两int类型数相减，结果入栈。
imul		将栈顶两int类型数相乘，结果入栈。
idiv		将栈顶两int类型数相除，结果入栈。
irem		将栈顶两int类型数取模，结果入栈。
ineg		将栈顶int类型值取负，结果入栈。
ladd		将栈顶两long类型数相加，结果入栈。
lsub		将栈顶两long类型数相减，结果入栈。
lmul		将栈顶两long类型数相乘，结果入栈。
ldiv		将栈顶两long类型数相除，结果入栈。
lrem		将栈顶两long类型数取模，结果入栈。
lneg		将栈顶long类型值取负，结果入栈。
(wide)iinc	indexbyte constbyte	将整数值constbyte加到indexbyte指定的int类型的局部变量中。

浮点运算
操作码（助记符）	操作数	描述（栈指操作数栈）
fadd		将栈顶两float类型数相加，结果入栈。
fsub		将栈顶两float类型数相减，结果入栈。
fmul		将栈顶两float类型数相乘，结果入栈。
fdiv		将栈顶两float类型数相除，结果入栈。
frem		将栈顶两float类型数取模，结果入栈。
fneg		将栈顶float类型值取反，结果入栈。
dadd		将栈顶两double类型数相加，结果入栈。
dsub		将栈顶两double类型数相减，结果入栈。
dmul		将栈顶两double类型数相乘，结果入栈。
ddiv		将栈顶两double类型数相除，结果入栈。
drem		将栈顶两double类型数取模，结果入栈。
dneg		将栈顶double类型值取负，结果入栈。

逻辑运算——移位运算
操作码（助记符）	操作数	描述（栈指操作数栈）
ishl		左移int类型值。
lshl		左移long类型值。
ishr		算术右移int类型值。
lshr		算术右移long类型值。
iushr		逻辑右移int类型值。
lushr		逻辑右移long类型值。

逻辑运算——按位布尔运算
操作码（助记符）	操作数	描述（栈指操作数栈）
iand		对int类型按位与运算。
land		对long类型的按位与运算。
ior		对int类型的按位或运算。
lor		对long类型的按位或运算。
ixor		对int类型的按位异或运算。
lxor		对long类型的按位异或运算。

控制流指令——条件跳转指令
操作码（助记符）	操作数	描述（栈指操作数栈）
ifeq	branchbyte1 branchbyte2	若栈顶int类型值为0则跳转。
ifne	branchbyte1 branchbyte2	若栈顶int类型值不为0则跳转。
iflt	branchbyte1 branchbyte2	若栈顶int类型值小于0则跳转。
ifle	branchbyte1 branchbyte2	若栈顶int类型值小于等于0则跳转。
ifgt	branchbyte1 branchbyte2	若栈顶int类型值大于0则跳转。
ifge	branchbyte1 branchbyte2	若栈顶int类型值大于等于0则跳转。
if_icmpeq	branchbyte1 branchbyte2	若栈顶两int类型值相等则跳转。
if_icmpne	branchbyte1 branchbyte2	若栈顶两int类型值不相等则跳转。
if_icmplt	branchbyte1 branchbyte2	若栈顶两int类型值前小于后则跳转。
if_icmple	branchbyte1 branchbyte2	若栈顶两int类型值前小于等于后则跳转。
if_icmpgt	branchbyte1 branchbyte2	若栈顶两int类型值前大于后则跳转。
if_icmpge	branchbyte1 branchbyte2	若栈顶两int类型值前大于等于后则跳转。
ifnull	branchbyte1 branchbyte2	若栈顶引用值为null则跳转。
ifnonnull	branchbyte1 branchbyte2	若栈顶引用值不为null则跳转。
if_acmpeq	branchbyte1 branchbyte2	若栈顶两引用类型值相等则跳转。
if_acmpne	branchbyte1 branchbyte2	若栈顶两引用类型值不相等则跳转。

控制流指令——比较指令
操作码（助记符）	操作数	描述（栈指操作数栈）
lcmp		比较栈顶两long类型值，前者大，1入栈；相等，0入栈；后者大，-1入栈。
fcmpl		比较栈顶两float类型值，前者大，1入栈；相等，0入栈；后者大，-1入栈；有NaN存在，-1入栈。
fcmpg		比较栈顶两float类型值，前者大，1入栈；相等，0入栈；后者大，-1入栈；有NaN存在，-1入栈。
dcmpl		比较栈顶两double类型值，前者大，1入栈；相等，0入栈；后者大，-1入栈；有NaN存在，-1入栈。
dcmpg		比较栈顶两double类型值，前者大，1入栈；相等，0入栈；后者大，-1入栈；有NaN存在，-1入栈。

控制流指令——无条件跳转指令
操作码（助记符）	操作数	描述（栈指操作数栈）
goto	branchbyte1 branchbyte2	无条件跳转到指定位置。
goto_w	branchbyte1 branchbyte2 branchbyte3 branchbyte4	无条件跳转到指定位置（宽索引）。

控制流指令——表跳转指令
操作码（助记符）	操作数	描述（栈指操作数栈）
tableswitch	<0-3bytepad> defaultbyte1 defaultbyte2 defaultbyte3 defaultbyte4 lowbyte1 lowbyte2 lowbyte3 lowbyte4 highbyte1 highbyte2 highbyte3 highbyte4 jump offsets...	通过索引访问跳转表，并跳转。
lookupswitch	<0-3bytepad> defaultbyte1 defaultbyte2 defaultbyte3 defaultbyte4 npairs1 npairs2 npairs3 npairs4 match offsets	通过键值访问跳转表，并跳转。

控制流指令——异常和finally
操作码（助记符）	操作数	描述（栈指操作数栈）
athrow		抛出异常。
jsr	branchbyte1 branchbyte2	跳转到子例程序。
jsr_w	branchbyte1 branchbyte2 branchbyte3 branchbyte4	跳转到子例程序（宽索引）。
(wide)ret	indexbyte	返回子例程序。

对象操作指令
操作码（助记符）	操作数	描述（栈指操作数栈）
new	indexbyte1 indexbyte2	创建新的对象实例。
checkcast	indexbyte1 indexbyte	类型强转。
instanceof	indexbyte1 indexbyte2	判断类型。
getfield	indexbyte1 indexbyte2	获取对象字段的值。
putfield	indexbyte1 indexbyte2	给对象字段赋值。
getstatic	indexbyte1 indexbyte2	获取静态字段的值。
putstatic	indexbyte1 indexbyte2	给静态字段赋值。

数组操作指令
操作码（助记符）	操作数	描述（栈指操作数栈）
newarray	atype	创建type类型的数组。
anewarray	indexbyte1 indexbyte2	创建引用类型的数组。
arraylength		获取一维数组的长度。
multianewarray	indexbyte1 indexbyte2 dimension	创建dimension维度的数组。

方法调用指令
操作码（助记符）	操作数	描述（栈指操作数栈）
invokespecial	indexbyte1 indexbyte2	编译时方法绑定调用方法。
invokevirtual	indexbyte1 indexbyte2	运行时方法绑定调用方法。
invokestatic	indexbyte1 indexbyte2	调用静态方法。
invokeinterface	indexbyte1 indexbyte2 count 0	调用接口方法。

方法返回指令
操作码（助记符）	操作数	描述（栈指操作数栈）
ireturn		返回int类型值。
lreturn		返回long类型值。
freturn		返回float类型值。
dreturn		返回double类型值。
areturn		返回引用类型值。
return		void函数返回。

线程同步指令
操作码（助记符）	操作数	描述（栈指操作数栈）
monitorenter		进入并获得对象监视器。
monitorexit		释放并退出对象监视器。

参考《深入解析JVM》 2010年10月6日

以上是关于Java二进制指令代码解析的主要内容，如果未能解决你的问题，请参考以下文章