为啥 proguard 不混淆方法体?

Posted

技术标签:

【中文标题】为啥 proguard 不混淆方法体?【英文标题】:Why proguard does not obfuscate method body?为什么 proguard 不混淆方法体? 【发布时间】:2015-10-09 02:06:21 【问题描述】:

我正在使用 ProGuard 来混淆我的 .jar 程序。一切正常,除了 ProGuard 不会混淆方法体中的局部变量这一事实。这是一个例子:

原始:

混淆:

以黄色突出显示的变量名应该被混淆,但事实并非如此。我怎样才能混淆它们(让它们重命名为 a、b、c 等?)

这是我的 ProGuard 配置:http://pastebin.com/sb3DMRcC(上述方法不是来自排除的类之一)。

【问题讨论】:

“混淆”的代码是真正的Java代码还是已经反编译的Java代码?我的理解是,字节码文件根本不记录方法参数和局部变量的名称。 (如果这是 ProGuard 发出的源代码,请尝试编译它。然后反编译 .class 文件……或使用 javap 查看它。) @StephenC 是反编译的Java代码。我混淆了 .jar 文件(使用 proguard,在编译 .jar 之后),然后反编译了较早混淆的 .jar。 .jar 文件(字节码)存储了几乎所有来自原始源代码的数据(除了 cmets 和语法格式)。 【参考方案1】:

为什么 proguard 不混淆方法体?

因为它不能。 编译时根本不存储方法参数和局部变量的名称。 您看到的名称是由您的反编译器生成的。

对于编译后的代码,有两种方法可以在本地(即在方法内)存储数据:

在操作数堆栈上 在局部变量中

操作数栈实际上只是一个栈。 请参阅 Java VM 规范中的 Table 7.2 以了解堆栈运算符。 您可以弹出值 (pop)、复制顶部值 (dup)、交换顶部两个值 (swap) 以及稍微改变行为 (pop2, dup_x1, dup_x2, dup2, dup2_x1, dup2_x2)。 大多数(如果不是所有)产生返回值的指令都会将该值放入堆栈。

对于这个问题,重要的是如何引用堆栈中的内容,这与任何其他堆栈一样: 相对于顶部位置,并基于使用的指令。 没有指定的数字或名称,它只是当前存在的任何东西。

现在,对于所谓的“局部变量”:

将它们更多地视为ArrayList,而不是 Java 中的变量。 因为这正是您访问它们的方式:按索引。 对于变量 0 到 3,有特殊指令(即单字节),因为它们经常使用,所有其他变量只能通过双字节指令访问,其中第二个字节是索引。 再次参见Table 7.2,“加载”和“存储”。 两个表中的前五个条目是每个数据类型的宽(双字节)存储/加载指令(请注意,对于单个值,booleancharbyteshort 都转换为int,只留下intfloatObject作为单槽值,longdouble作为双槽值),接下来的20条指令是直接访问寄存器0的指令到 3,最后 8 条指令用于访问数组索引(请注意,在数组内部,booleanbytecharshort 转换为 int,以不要浪费空间,这就是为什么还有三个指令(不是四个,因为 bytechar 具有相同的大小)。

最大堆栈大小和局部变量的数量都是有限的,并且必须在每个方法的Code 属性的标题中给出,如Section 4.7.3(max_stackmax_locals)中定义的那样。

不过,关于局部变量的有趣之处在于,它们可以兼作方法参数,这意味着局部变量的数量永远不会低于方法参数的数量。 请注意,在为 Java VM 计算值时,longdouble 类型的变量被视为两个值,因此需要两个“槽”。 另请注意,对于非静态方法,参数 0 将是 this,这需要另一个“插槽”。

话虽如此,让我们看一些代码!

例子:

class Test

    public static void main(String[] myArgs) throws NumberFormatException
    
        String myString = "42";
        int myInt = Integer.parseInt(myString);
        double myDouble = (double)myInt * 42.0d;
        System.out.println(myDouble);
    

这里我们有三个局部变量myStringmyIntmyDouble,加上一个参数myArgs。 另外,我们还有两个常量"42"42.0d,还有很多外部引用:

java.lang.String[] - 类 java.lang.NumberFormatException - 类 java.lang.String - 类 java.lang.Integer.parseInt - 方法 java.lang.System.out - 字段 java.io.PrintStream.println - 方法

还有一些导出:Testmain,以及编译器将为我们生成的默认构造函数。

所有常量、引用和导出都将导出到Constant Pool - 局部变量和参数名称不会。

编译和反汇编类(使用javap -c Test)产生:

Compiled from "Test.java"
class Test 
  Test();
    Code:
       0: aload_0
       1: invokespecial #1                  // Method java/lang/Object."<init>":()V
       4: return

  public static void main(java.lang.String[]) throws java.lang.NumberFormatException;
    Code:
       0: ldc           #2                  // String 42
       2: astore_1
       3: aload_1
       4: invokestatic  #3                  // Method java/lang/Integer.parseInt:(Ljava/lang/String;)I
       7: istore_2
       8: iload_2
       9: i2d
      10: ldc2_w        #4                  // double 42.0d
      13: dmul
      14: dstore_3
      15: getstatic     #6                  // Field java/lang/System.out:Ljava/io/PrintStream;
      18: dload_3
      19: invokevirtual #7                  // Method java/io/PrintStream.println:(D)V
      22: return

除了默认构造函数,我们可以看到我们的main方法,一步一步来。 请注意如何使用astore_1aload_1 访问myString,使用istore_2iload_2 访问myInt,以及使用dstore_3dstore_3myDouble 访问myDouble。@987654385可以在任何地方访问,因此也没有字节码处理它,但是在方法的开头,对 String 数组的引用将位于局部变量 1 中,该变量很快就会被对 "42" 的引用覆盖。

javap 也会显示常量池,如果你将-v 标志传递给它,但它并没有真正为输出添加任何值,因为来自常量池的所有相关信息都显示在 cmets 中。

但是现在,让我们看看反编译器产生了什么!

JD-GUI 0.3.5(JD-Core 0.6.2):

import java.io.PrintStream;

class Test

  public static void main(String[] paramArrayOfString)
    throws NumberFormatException
  
    String str = "42";
    int i = Integer.parseInt(str);
    double d = i * 42.0D;
    System.out.println(d);
  

南河 0.5.28:

class Test

    public static void main(final String[] array) throws NumberFormatException 
        System.out.println(Integer.parseInt("42") * 42.0);
    

注意导出到常量池的所有内容是如何保持不变的,而 JD-GUI 只是为局部变量选择一些名称,而 Procyon 会完全优化它们。 参数的名称 - paramArrayOfStringarray(与原始的 myArgs 相比)是一个完美的例子,它表明不再有“正确”的名称,反编译器只需要依赖一些取名字的模式。

我不知道反编译代码中的“真实”名称来自何处,但我相当肯定它们不包含在 jar 文件中。 可能是您的 IDE 的功能?

【讨论】:

谢谢!有史以来最好的答案!

以上是关于为啥 proguard 不混淆方法体?的主要内容,如果未能解决你的问题,请参考以下文章

Java 混淆 - ProGuard/yGuard/其他? [关闭]

如何在 Android 中使用 Proguard 不混淆接口方法及其参数?

Android 代码混淆之proguard

为 Proguard 指定类名以避免混淆

使用 ProGuard 来混淆 jar 或 war 文件的内容

Android proguard代码混淆