抖音Android包体积优化探索:从Class字节码入手精简DEX体积
Posted 涂程
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了抖音Android包体积优化探索:从Class字节码入手精简DEX体积相关的知识,希望对你有一定的参考价值。
作者:魏馥檀,王鹏飞
前言
众所周知,应用安装包的体积会十分影响用户的应用下载速度和安装速度。据 GoolgePlay 平台对外发布相关的包大小对转化率影响的数据,我们可以看到随着包大小的增加,安装转化率总体呈下降的趋势。
因此对于我们的应用来说,为了提升我们用户下载的转化率(即下载安装激活用户与潜在用户的比例),我们对包体积必须给予一定的优化和管控。
我们应用商店中提供给用户下载的安装包,是 android 定义的 APK 格式,其实质则是一个包含应用所有所需资源的 zip 包,它包含了如下所示的几个组成部分:
这其中最主要的组成部分便是 DEX 文件,它们都是由 Java/Kotlin 代码编译而成。过去的两年中,抖音的 DEX 的个数从 8 个涨到了 21 个,DEX 的总大小从 26M 涨到了 48M,增长十分迅猛。诚然,随着抖音的快速发展,业务复杂度的提高,代码量级一定是在增加的,但如何在业务无感的情况下,对代码进行通用优化,也是我们一个很重要的优化方向。
在介绍具体优化手段之前,我们首先需要了解下针对 DEX 整体上的优化思路。
DEX 通用优化思路
在 AGP 的构建过程中,Java 或 Kotlin 源代码在经过编译之后会生成 Class 字节码文件,在这个阶段 AGP 提供了 Transform 来做字节码的处理,我们非常熟悉的 Proguard 就是在这个阶段工作的,之后 Class 文件经由 dexBuilder 生成一堆较小的 DEX 文件,再经由 mergeDex 合并成最终的 DEX 文件,然后打入 APK 中。具体过程如下图所示:
因此,我们针对 DEX 文件的优化时机可以从分别从三个阶段切入,分别是.kt 或.java 源文件、class 文件、DEX 文件:
- 在源文件进行处理也就是手动改造代码,这种方式对程序设计本身有侵入,并且有较强的局限性;
- 在 class 字节码阶段对开发者无感知,而且基本上能完成大多数的优化,但对于像跨 DEX 引用优化这样涉及 DEX 格式本身的优化无法完成;
- 在 DEX 文件阶段进行优化是最理想的,在这个阶段我们除了能对 DEX 字节码本身进行优化,也可对 DEX 文件格式进行操作。
优化的手段总体上来说也就是冗余去除、内容精简、格式优化等方式。
由于早期抖音 class 字节码修改工具建设比较成熟,我们很多包体积的优化都是通过修改 class 字节码完成的,随着优化的深入,后期也有很多优化是在 DEX 文件阶段处理的。关于 DEX 阶段相关的优化我们后续会有相关文章介绍,这里主要介绍 Class 字节码阶段进行的相关优化,主要分为两大类:
- 单纯去除无用的代码指令,包括去除冗余赋值,无副作用代码删除等
- 除了能减少代码指令数量外,同时减少方法和字段的数量,从而有效减少 DEX 的数量。我们知道 DEX 中引用方法数、引用字段数等不能超过 65535,超过之后就需要新开一个 DEX 文件,因此减少 DEX 中方法数、字段数可以减少 DEX 文件数量,像短方法内联、常量字段消除、R 常量内联就属于这类优化。
接下来我们会针对每一项优化的背景、优化思路和收益进行详细介绍。
去除冗余赋值
在我们平时的代码开发中,我们可能会写出以下的代码:
class MyClass
private boolean aBoolean = false;
private static boolean aBooleanStatic = false;
private void boo()
if (!aBoolean)
System.out.println("in aBoolean false!");
if (!aBooleanStatic)
System.out.println("in aBooleanStatic false!");
我们常常为了保证一个 Class 的成员变量的初始满足我们期望的值,手动对其进行一次赋值,如上述代码里的 aBoolean 和 aBooleanStatic。这是一种逻辑上非常安全的做法,但这真是必须的吗?
其实 Java 官方在虚拟机规范(https://docs.oracle.com/javase/specs/jvms/se7/html/jvms-2.html#jvms-2.3)中定义了,Class对象在虚拟机中加载时,所有的静态字段(也就是静态成员变量,下面统称为Field)都会首先加载一个默认值
2.3. Primitive Types and Values
…
The integral types are:
byte
, whose values are 8-bit signed two’s-complement integers, and whose default value is zero
short
… whose default value is zero
int
… whose default value is zero
long
… whose default value is zero
char
… whose default value is the null code point ('\\u0000'
)The floating-point types are:
float
… whose default value is positive zero
double
… whose default value is positive zero2.4. Reference Types and Values
…The
null
reference initially has no run-time type, but may be cast to any type. The default value of areference
type isnull
.
总结来说,在 Java 中的基本类型和引用类型的 Field 都会在 Class 被加载的同时赋予一个默认值,byte
、short
、int
、long
、float
、double
类型都会被赋为 0, char 类型会被赋为'\\u0000'
,引用类型会被赋为 null。
我们将开头那段代码通过命令行java -p -v
转化为字节码:
public com.bytedance.android.dexoptimizer.MyClass();
Code:
0: aload_0
1: invokespecial #1 // Method java/lang/Object."<init>":()V
4: aload_0
5: iconst_0
6: putfield #2 // Field aBoolean:Z
9: return
static ;
Code:
0: iconst_0
1: putstatic #6 // Field aBooleanStatic:Z
4: return
private void boo();
Code:
0: aload_0
1: getfield #2 // Field aBoolean:Z
4: ifne 15
7: getstatic #4 // Field java/lang/System.out:Ljava/io/PrintStream;
10: ldc #5 // String in aBoolean false!
12: invokevirtual #6 // Method java/io/PrintStream.println:(Ljava/lang/String;)V
15: aload_0
16: getfield #3 // Field aBooleanStatic:Z
19: ifne 30
22: getstatic #4 // Field java/lang/System.out:Ljava/io/PrintStream;
25: ldc #7 // String in aBooleanStatic false!
27: invokevirtual #6 // Method java/io/PrintStream.println:(Ljava/lang/String;)V
30: return
通过上述字节码发现,虽然 JVM 会在运行时将 aBoolean 赋值为 0,但是我们在字节码中仍然会再赋值一次 0 给到 aBoolean,aBooleanStatic 同理。
public com.bytedance.android.dexoptimizer.MyClass();
Code:
0: aload_0
1: invokespecial #1 // Method java/lang/Object."<init>":()V
4: aload_0
5: iconst_0
6: putfield #2 // Field aBoolean:Z
9: return
以上标红部分出现了重复赋值,去除了不影响运行时逻辑。因此,我们考虑在 Class 字节码处理阶段,将这种冗余的字节码移除来获取包大小收益。
优化思路
理解了问题产生的原因后,就很容易得到对应的解决方案。首先,能够被优化的 Field 赋值,需要满足这三个条件:
- Field 是属于其直接定义的 Class 的,而非在父类定义过的;
- Field 赋值是在 Class 的
clinit
、init
方法中,这样做很大程度是为了降低复杂度(因为只在这两个方法中调用的 private 方法也是能做这样的优化,但分析这样的方法复杂度很高); - Field 赋值是默认值,当出现多个赋值时,在非默认赋值后的赋值都无法被优化。
我们结合下面的代码,具体说明一下各种情况是否可以被优化:
Class MyClass
// 可以优化,直接定义的,且是默认值
private boolean aBoolean = false;
// 不可优化,因为赋值为非默认值
private boolean bBoolean = true;
// 可以优化,直接定义的,且是默认值
private static boolean aBooleanStatic = false;
static
// 可以优化,第一处出现,且是默认值
aBooleanStatic = false;
// 其他代码
...
// 可以优化,前面没有非默认值赋值,且是默认值
aBooleanStatic = false;
// 其他代码
...
// 不可优化,因为赋值为非默认值
aBooleanStatic = true;
// 其他代码
...
// 不可优化,因为之前出现了非默认值的赋值
aBooleanStatic = false;
private void boo()
// 不可优化,因为函数为非clinit或init
aBoolean = false;
具体实现上,我们的优化思路是这样的:
-
遍历 Class 所有方法,找到
<clinit>
和<init>
方法,从上往下进行字节码指令遍历 -
遍历这两种方法的所有字节码指令,找到所有的 putfield 指令,将 putfield 指令的目标 ClassName 和 FieldName 使用
-
连接,构建一个唯一的 Key,如果 -
putfield 目标 Class 不是当前 Class,跳过
-
putfield 前的 load 指令不为
iconst_0
,fconst_0
,dconst_0
,lconst_0
,aconst_null
,并将该 putfield 所关联的唯一的 Key 放入已经遍历过的 Key 的集合中 -
putfield 前的 load 指令为
iconst_0
,fconst_0
,dconst_0
,lconst_0
,aconst_null
,且该 putfield 所关联的唯一的 Key 没有在遍历过的 Key 的集合出现过,则标记为可清除的字节码指令 -
遍历完成后,删除所有被标记为可清除的字节码指令
我们用一个简单的例子来说明下我们的思路:
public com.bytedance.android.dexoptimizer.MyClass(); // 1. 判断是<init>方法,进入优化逻辑
Code: // 2. 从上往下进行代码遍历
0: aload_0
1: invokespecial #Method java/lang/Object."<init>":()V
4: aload_0
5: iconst_0
6: putfield #Field MyClass.aBoolean:Z. // 3.发现是该Class的域,且赋值为iconst_0,标记往上三个指令可以删除
7: aload_0
8: iconst_1
9: putfield #Field MyClass.aBoolean:Z // 4.发现是该Class的域,且赋值不为iconst_0,则在遍历过的Key的集合中添加MyClass-aBoolean,继续往下
10: aload_0
11: iconst_0
12: putfield #Field MyClass.aBoolean:Z // 5.发现是该Class的域,但在遍历过的Key的集合中发现存在MyClass-aBoolean,继续往下
15: return
最终发现上述字节码中,标红的部分可以删除,删除对应的字节码指令,优化完成。
使用抖音之前开源的字节码处理框架 ByteX,可以比较方便地获取 Field 的 Class,遍历 Class 的所有方法,以及所有方法的字节码。我们也已经将此方案进行了开源,有兴趣的同学可以前往查看详细代码:
- https://github.com/bytedance/ByteX/blob/master/field-assign-opt-plugin
删除无副作用代码
冗余赋值是利用了虚拟机在类加载时为字段默认赋值的特性,从而删除多余的的赋值指令,而我们代码中本身也有一些对线上包是没有作用的,最常见的就是日志打印,除了占用包体积之外,还会造成性能问题以及安全风险,因此一般都会将其移除掉,接下来我们以 Log.i 调用为例来介绍如何删除代码中的无用函数调用。比如下面代码中的日志打印语句:
public static void click()
clickSelf();
Log.i("Logger", "click time:" + System.currentTimeMillis());
一开始我们尝试了 proguard 的 -assumenosideeffects,这个指令需要我们假定要删除的方法调用没有任何的副作用,并且从程序分析的角度来说这个方法是不会修改堆上某个对象或者栈上方法参数的值。使用如下配置,proguard 就会在 optimize 阶段帮我们删除 Log 相关的方法调用。
-assumenosideeffects class android.util.Log
public static boolean isLoggable(java.lang.String, int);
public static int v(...);
public static int i(...);
public static int w(...);
public static int d(...);
public static int e(...);
但是这种删除并不彻底,它只会删除方法调用指令本身,比如上面的代码中删除 Log.i 方法调用之后,会遗留一个 StringBuilder 对象的创建:
public static void click()
clickSelf();
new StringBuilder("click time:")).append(System.currentTimeMillis();
这个对象的创建我们人为判断的话也是无用的,但是仅从简单的静态程序指令分析的角度并不能判定其是无用的,因此 proguard 并没有将其删除。
既然 assumenosideeffects 删除不干净,我们就自己来实现更加彻底的优化方案。
优化思路
public static void click();
Code:
0: invokestatic #6 // Method clickSelf:()V
3: ldc #7 // String Logger
5: new #8 // class java/lang/StringBuilder
8: dup
9: invokespecial #9 // Method java/lang/StringBuilder."<init>":()V
12: ldc #10 // String click time:
14: invokevirtual #11 // Method java/lang/StringBuilder.append:(Ljava/lang/String;)Ljava/lang/StringBuilder;
17: invokestatic #12 // Method java/lang/System.currentTimeMillis:()J
20: invokevirtual #13 // Method java/lang/StringBuilder.append:(J)Ljava/lang/StringBuilder;
23: invokevirtual #14 // Method java/lang/StringBuilder.toString:()Ljava/lang/String;
26: invokestatic #2 // Method android/util/Log.i:(Ljava/lang/String;Ljava/lang/String;)I
29: pop
如上可以看到一行Log.i("Logger", "click time:" + System.currentTimeMillis());
在编译完成之后会生成多条指令(从 ldc 到 pop),除了目标方法 Log.i 调用 invokestatic 指令外,还有很多参数创建和入栈指令。
我们要删除相关方法的调用的话,主要是就是找到这行代码所产生的起始指令和终止指令,然后起始到终止位置之间的指令就是我们要删除的全部指令。
1. 查找终止指令位置
终止指令的查找相对简单,主要就是找到要删除的目标方法调用指令,再根据方法的返回值类型确定是否要包含其后的 pop 或 pop2 指令。
比如上述代码我们通过遍历就能找到目标方法调用invokestatic #2
的位置,因为 Log.i 的返回值类型是 int,终止指令就是下一条的 pop。
注意 pop 指令的作用是主动让 int 类型的值出栈,也就是不会使用该方法的返回值,只有这种情况下我们才能安全删除目标方法,否则不能删除。当然如果方法的返回值类型是 void,就不会有 pop 指令。
2. 查找起始指令位置
起始指令的查找则需要我们对于 java 字码指令设计有基本的认识: java 字节码指令是基于堆栈设计的,每一条字节码指令会对应操作数栈的若干参数的入栈和出栈,并且一个完整独立代码/代码块执行前和执行后操作数栈应该是一样的。
因此我们找到终止指令后,倒序遍历指令,根据指令的作用进行反向的入栈和出栈操作,当我们的栈中 size 减为 0 时,就找到了起始指令的位置。注意在入栈时候要记录参数的类型,并在出栈时候做类型匹配校验。如上面的示例:
- pop 指令效果是单 slot 参数(像 int,float)出栈 ,那我们就在栈存入一个 slot 类型的参数
- invokestatic 要看方法的参数和返回值,正常效果是对应方法的参数从右至左依次出栈,方返回值 int 入栈。我们就根据方法返回值出栈一个 int 类型的参数,发现栈顶目前是 slot,类型匹配。然后按照方法参数从左至右依次入栈两个 String 类型的参数。
- invokevirtual 指令正常方法调用参数依次从右至左依次出栈,然后 this 对象出栈,最后方法返回值 String 入栈。我们弹出栈顶一个参数,发现其和 String 匹配,然后依次入栈 this 对应的类型 StringBuilder,这里调用的是 toString 方法没有参数就不用再入栈。
- 中间其他的指令类似,直到 ldc 指令,本身是向栈中放入一个 int,float 或 String 常量,我们这里弹出一个参数,发现其是 String 匹配,并且此时栈的大小变为 0,也就找到了起始指令的位置。
方案缺陷
不过上述方案存在两个缺陷:
- 因为分析只在单个方法内分析,针对 Log 方法封装的情况,必须需要配置封装方法作为目标方法,才能删除完全删除,比如下面的方法需要配置 AccountLog.d 才能删除其调用处的 StringBuilder 创建。
object AccountLog
@JvmStatic
fun d(tag: String, msg: String) = Log.d(tag, msg)
- 可能会误删除一些有用的指令,因为无法认为 Log.i 的两个参数的构建指令都是没有用的,我们只能确定 StringBuilder 的创建是没用的,但是一些其他的方法调用可能会改变一些对象的状态,因此存在一定风险。
Proguard 方案
在我们上述方案在线上运行一年之后,尝试针对上述弊端进行优化,然后发现 proguard 还提供了 assumenoexternalsideeffects 指令,它可以让我们指定没有任何外部副作用的方法。
指定了以后,它只会修改调用这个方法的实例本身,但不会修改其他的对象。通过如下的配置可以删除无用的 StringBuilder 创建。
-assumenoexternalsideeffects class java.lang.StringBuilder
public java.lang.StringBuilder();
public java.lang.StringBuilder(int);
public java.lang.StringBuilder(java.lang.String);
public java.lang.StringBuilder append(java.lang.Object);
public java.lang.StringBuilder append(java.lang.String);
public java.lang.StringBuilder append(java.lang.StringBuffer);
public java.lang.StringBuilder append(char[]);
public java.lang.StringBuilder append(char[], int, int);
public java.lang.StringBuilder append(boolean);
public java.lang.StringBuilder append(char);
public java.lang.StringBuilder append(int);
public java.lang.StringBuilder append(long);
public java.lang.StringBuilder append(float);
public java.lang.StringBuilder append(double);
public java.lang.String toString();
-assumenoexternalreturnvalues public final class java.lang.StringBuilder
public java.lang.StringBuilder append(java.lang.Object);
public java.lang.StringBuilder append(java.lang.String);
public java.lang.StringBuilder append(java.lang.StringBuffer);
public java.lang.StringBuilder append(char[]);
public java.lang.StringBuilder append(char[], int, int);
public java.lang.StringBuilder append(boolean);
public java.lang.StringBuilder append(char);
public java.lang.StringBuilder append(int);
public java.lang.StringBuilder append(long);
public java.lang.StringBuilder append(float);
public java.lang.StringBuilder append(double);
不过,这个配置只适用于 Log 里只传入 String 的情况。如果是int Log.w (String tag, Throwable tr)
这种情况,就无法把Throwable
参数也一起去掉。那还是应该采用我们自己实现的插件才能优化干净。
此优化对抖音包体积收益,约为 520KB。
短方法内联
上面介绍的两个优化是从去除无用的指令的角度出发,开篇 DEX 优化思路中我们有讲过,减少定义方法或者字段数从而减少 DEX 数量也是我们常用优化思路之一,短方法内联就是精简代码指令的情况下,同时减少定义方法数。
在和海外竞品的对比过程中,我们发现单个 DEX 文件中的定义方法数远比竞品要多,进一步对 DEX 进行分析,发现抖音的 DEX 中有大量的 access,getter-setter 方法,而竞品中几乎没有。因此我们打算针对短方法做一些内联优化,减少定义方法数。
在介绍优化方案前,先来了解下内联的基础知识,内联作为最常见的代码优化手段,被称为优化之母。一些语言像 C++、Kotlin 提供了 inline 关键字给程序员做函数的内联,而 Java 语言本身并没有给程序员提供控制或建议 inline 的机会,甚至 javac 编译过程中也没有做方法内联。为了便于理解,我们通过一个简单的例子来看内联是如何工作的,如下代码中 callMethod 调用 print 函数:
public class InlineTest
public static void callMethod(int a)
int result = a + 5;
print(result);
public static void print(int result)
System.out.println(result);
在内联之后 inlineMethod 的内容直接被展开到 callMethod 中, 从字节码的角度看变化如下:
内联前:
public static void callMethod(int);
Code:
0: iload_0
1: iconst_5
2: iadd
3: istore_1
4: iload_1
5: invokestatic #2 // Method print:(I)V
8: return
内联后:
public static void callMethod(int);
Code:
0: iload_0
1: iconst_5
2: iadd
3: dup
4: istore_0
5: istore_0
6: getstatic #5 // Field java/lang/System.out:Ljava/io/PrintStream;
9: iload_0
10: invokevirtual #6 // Method java/io/PrintStream.println:(I)V
13: return
从执行时间的角度看,减少了一次函数调用,从而提升了执行性能。从空间占用角度看,减少了一处函数声明,从而减少了代码体积。
那是不是所有的方法都适合内联呢?
显然不是的,对于单次调用的方法说内联能同时取得时间和空间的收益;对于多次调用的的方法则需要考虑方法本身的长短,比如上面的 print 方法展开之后的指令是比 invokestatic 指令本身要长很多的,但是像 access、getter-setter 方法本身比较短就很适合内联。
access 方法内联
public class Foo
private int mValue;
private void doStuff(int value)
System.out.println("Value is " + value);
private class Inner
void stuff()
Foo.this.doStuff(Foo.this.mValue);
如上述代码,大家都知道 Java 可以在内部类 Foo$Inner 中直接访问外部类 Foo 的私有成员,但是 JVM 并没有什么内部类外部类的概念,认为一个类直接访问另一个类的私有成员是非法的。编译器为了能实现这种语法糖,会在编译期生成以下静态方法:
static int Foo.access$100(Foo foo)
return foo.mValue;
static void Foo.access$200(Foo foo, int value)
foo.doStuff(value);
内部类对象创建时候会传入外部类的引用,这样当内部类需要访问外部类的mValue
或调用doStuff()
方法时,会通过调用这些静态方法来实现。这里需要生成静态的方法的原因,是因为被访问的成员是私有的,而私有访问控制更多地是在源码层面去约束,防止破坏程序的设计。在字节码层面只要不破坏语法逻辑,因此我们完全可以将这些私有成员改成 public 的,直接删除掉编译器生成的桥接静态方法。
优化思路
具体的优化分为分为以下几步:
- 收集字节码中的 access 方法。
<以上是关于抖音Android包体积优化探索:从Class字节码入手精简DEX体积的主要内容,如果未能解决你的问题,请参考以下文章