麻省理工18年春软件构造课程阅读13“调试”

Posted 李秋豪

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了麻省理工18年春软件构造课程阅读13“调试”相关的知识,希望对你有一定的参考价值。

本文内容来自MIT_6.031_sp18: Software Construction课程的Readings部分,采用CC BY-SA 4.0协议。

由于我们学校(哈工大)大二软件构造课程的大部分素材取自此,也是推荐的阅读材料之一,于是打算做一些翻译工作,自己学习的同时也能帮到一些懒得看英文的朋友。另外,该课程的阅读资料中有的练习题没有标准答案,所给出的“正确答案”为译者所写,有错误的地方还请指出。

(更新:从第10章开始只翻译正确答案)




译者:李秋豪

审校:

V1.0 Sun Apr 22 17:13:43 CST 2018


本次课程的目标

今天的课程旨在告诉你如何系统的进行调试(systematic debugging)。

有时候你除了调试别无选择——特别是bug只在整合整个系统后才出现,或者是由用户使用后报告的(一般很难定位bug的位置)。对于这些情况,我们就可以使用系统的策略来提高调试的效率。

关于调试有一本很好的书: Why Programs Fail,本次阅读材料的很大部分素材都来自于它。


复现bug

首先我们要做的是找到一个小、能够重复产生bug/failure的测试用例。如果这个bug是在回归测试中发现的,那么很幸运,你已经有了这样的测试用例。但如果这个bug是由用户报告的,你可能需要一些努力才能复现它。特别是对于GUI和多线程程序,bug的产生可能依赖于事件的事件和线程的执行,其复现会变得很困难。

然而,你为找到测试用例所付出的努力都会是值得的,因为你在后面搜寻bug和修复bug的时候都会不断用到它。另外,当你成功修复bug后,应该将复现bug的测试用例添加到测试套件中进行回归测试,确保bug不会再次发生。当你有针对bug的测试用例后,让测试通过就变成了你的目标。

下面给出了一个例子。假设你写了这样一个方法:

/**
 * Find the most common word in a string.
 * @param text string containing zero or more words, where a word
 *     is a string of alphanumeric characters bounded by nonalphanumerics.
 * @return a word that occurs maximally often in text, ignoring alphabetic case.
 */
public static String mostCommonWord(String text) {
    ...
}

一个用户将莎士比亚的戏剧作为输入调用了这个方法,比如说mostCommonWord(allShakespearesPlaysConcatenated), 并且发现这个方法并没有像 "the""a" 这样的英语单词,而是返回了意料之外的"e".

莎士比亚的戏剧有超过100000行的规模以及超过800000个单词的丰富度,所以这样的输入会让普通的调试变得非常困难,例如使用print或者断点来调试。所以我们的第一个工作就是减少输入的规模,同事确保程序会产生相同或相似的bug,这有很多思路:

  • 只使用原输入的前一半,bug还会发生吗?(二分查找!这总是一个不错的主意)
  • 戏剧中单行的输入会有同样的bug吗?
  • 戏剧中单章的输入会有同样的bug吗?

一旦你找到了小的测试用例,接下来就使用这个测试用例来修复bug,然后用原输入再次测试,确保你修复了相同的bug。

阅读小练习

Reducing a bug to a test case

假设用户报告说 mostCommonWord("chicken chicken chicken beef") 返回 "beef" 而非 "chicken".

为了在调试前缩短和简化输入,以下哪一个输入是值得尝试的?

  • [x] mostCommonWord("chicken chicken beef")

  • [ ] mostCommonWord("Chicken Chicken Chicken beef")

  • [ ] mostCommonWord("chicken beef")

  • [ ] mostCommonWord("a b c")

  • [x] mostCommonWord("b b c")

注意,选出所有可能的选项而不只是最简单的那个(因为最简单的测试用例可能不会复现bug!)

Regression testing

假设你将输入 "chicken chicken chicken beef" 简化为了 "c c b" (依然能够触发bug)。随后你利用这个测试修复了bug,然后观察到 "c c b""chicken chicken chicken beef" 都可以返回正确的答案。

现在你应该在测试用例套件中加上哪一个测试用例?

  • [ ] assertEquals("chicken", mostCommonWord("chicken chicken chicken beef"))
  • [x] assertEquals("c", mostCommonWord("c c b"))
  • [ ] assertEquals("c", mostCommonWord("c b"))
  • [ ] you shouldn’t change the test suite, because you haven’t changed the spec

用科学的方法发现bug

为了找到bug和它产生的原因,你可以使用以下方法:

  1. 研究数据. 通过推敲产生bug的测试用例,产生的错误结果,失败的断言检查及其对应的栈情况。
  2. 提出假设. 针对刚刚的研究提出假设:bug大概是在什么位置,不可能在什么位置,大概是什么原因。首先做一个大致的假设总是有帮助的。
  3. 进行试验. 针对你的假设进行试验。试验时记得对过程进行观察——例如放置“探针”收集数据(对系统的影响越小越好)。
  4. 重复之前步骤. 分析刚刚试验的数据,结合你已经知道和推理出来的结论,做出新的假设。这通常意味着你将bug的范围缩小或者产生的原因明确了。

上述的4个步骤并不一定对每一个bug都是需要的。如果你设计符合“快速失败”,那么bug很可能就在异常附近,栈踪迹也会帮助你很快发现错误的位置。那么什么时候需要使用上面提到的调试方法呢?一个不错的判断方法就是“十分钟规则”。如果你利用非系统的/ad-hoc(译者注:指临时决定的)手段调试超过10分钟,那么你就需要利用科学系统的方法重头开始调试了。

作为这种转变的一部分,你也需要将你的调试过程从脑袋中拿出来——它的“内存”很有限——并开始做笔记(纸上或者电脑上),内容包括:

  • 假设. 基于现在你知道到的,对bug的位置和原因提出假设。
  • 试验. 你将会怎么对假设进行试验。
  • 预言. 基于你的假设,试验的结果会是什么?
  • 观察. 试验的最终结果是什么。

这些笔记应该和你之前上过的科学课的笔记很像。在接下来的几节中,我们会介绍在调试代码时会用到的各种类型的假设、试验。

阅读小练习

Scientific method

基于我们上面讲过的“科学调试方法”,判断以下各个陈述应该属于调试的哪一个阶段?

用户报告 mostCommonWord("chicken chicken chicken beef") 返回 "beef" 而不是 "chicken".

--> 研究数据

并不是造成错误的原因,真正应该在意的是它们出现的次数。

--> 提出假设

运行测试用例 mostCommonWord("a a a b").

--> 进行试验


1. 研究数据

栈踪迹(stack trace)是异常中很重要的一个信息,因为它们会告诉你关于bug位置和原因的各种信息。

在栈踪迹中,顶部是最近一次的调用,最早的调用在底部。有时候顶部的调用是你自己的代码,但是异常也可能是由你的代码调用的库函数抛出的,这时顶部的调用就不是你的代码了。与此相似,底部的调用即可能是你的 main 方法,也可能是最终调用你的方法的系统代码。

总之,你的代码(bug最可能发生的地方)经常会出现在栈踪迹的中间部分。

阅读小练习

Reading a stack trace

假设你在运行Java程序后收到了一个异常,并得到了以下栈踪迹:

java.lang.NullPointerException
  at java.util.Objects.requireNonNull(Objects.java:203)
  at java.util.AbstractSet.removeAll(AbstractSet.java:169)
  at turtle.TurtleSoup.drawPersonalArt(TurtleSoup.java:29)
  at turtle.TurtleSoupTest.testPersonalArt(TurtleSoupTest.java:39)
  at sun.reflect.NativeMethodAccessorImpl.invoke0(Native Method)
  at sun.reflect.NativeMethodAccessorImpl.invoke(NativeMethodAccessorImpl.java:62)
  at sun.reflect.DelegatingMethodAccessorImpl.invoke(DelegatingMethodAccessorImpl.java:43)
  at java.lang.reflect.Method.invoke(Method.java:498)
  at org.junit.runners.model.FrameworkMethod$1.runReflectiveCall(FrameworkMethod.java:50)
  at org.junit.internal.runners.model.ReflectiveCallable.run(ReflectiveCallable.java:12)
  at org.junit.runners.model.FrameworkMethod.invokeExplosively(FrameworkMethod.java:47)
  at org.junit.internal.runners.statements.InvokeMethod.evaluate(InvokeMethod.java:17)
  at org.junit.runners.ParentRunner.runLeaf(ParentRunner.java:325)
  at org.junit.runners.BlockJUnit4ClassRunner.runChild(BlockJUnit4ClassRunner.java:78)
  at org.junit.runners.BlockJUnit4ClassRunner.runChild(BlockJUnit4ClassRunner.java:57)
  at org.junit.runners.ParentRunner$3.run(ParentRunner.java:290)
  at org.junit.runners.ParentRunner$1.schedule(ParentRunner.java:71)
  at org.junit.runners.ParentRunner.runChildren(ParentRunner.java:288)
  at org.junit.runners.ParentRunner.access$000(ParentRunner.java:58)
  at org.junit.runners.ParentRunner$2.evaluate(ParentRunner.java:268)
  at org.junit.runners.ParentRunner.run(ParentRunner.java:363)
  at org.eclipse.jdt.internal.junit4.runner.JUnit4TestReference.run(JUnit4TestReference.java:86)
  at org.eclipse.jdt.internal.junit.runner.TestExecution.run(TestExecution.java:38)
  at org.eclipse.jdt.internal.junit.runner.RemoteTestRunner.runTests(RemoteTestRunner.java:459)
  at org.eclipse.jdt.internal.junit.runner.RemoteTestRunner.runTests(RemoteTestRunner.java:678)
  at org.eclipse.jdt.internal.junit.runner.RemoteTestRunner.run(RemoteTestRunner.java:382)
  at org.eclipse.jdt.internal.junit.runner.RemoteTestRunner.main(RemoteTestRunner.java:192)

哪一行代码真正抛出了这个异常?

文件名: Objects.java

行数: 203

当异常被抛出时,你的代码所执行的最后一句是什么?

文件名: TurtleSoup.java

行数: 29

你的代码的入口点是什么?即你的代码被第一次调用是在哪里?

方法名称: testPersonalArt


2. 提出假设

我们知道,异常抛出的地方并不一定是bug的起源位置,即有bug的代码可能会将错误结果传给正常代码,正常代码在执行后才会抛出异常。所以你的假设应该是针对bug的起源位置以及它产生的原因。

一个很有帮助的方法就是将你的程序想象成一个数据流,或者是一个算法的几个步骤。现在让我们思考一下 mostCommonWord() 这个例子(通过三个帮助方法明确了步骤):

/**
 * Find the most common word in a string.
 * ...
 */
public static String mostCommonWord(String text) {
    List<String> words = splitIntoWords(text);
    Map<String,Integer> frequencies = countOccurrences(words);
    String winner = findMostFrequent(frequencies);
    return winner;
}

mostCommonWord() 的数据流如下图所示:

dataflow

假设我们在 countOccurrences()中得到了一个异常。那么我们可以在分析错误的时候将 countOccurrences()以后的数据流排除在外,例如我们没有必要去 findMostFrequent()中检查bug,因为异常以后的控制流在异常发生时还没有执行到。

基于已知的信息,我们可以逆序对错误的原因进行假设:

  • bug在 countOccurrences之中:它的输入合法但是却抛出了异常。
  • bug存在于 splitIntoWordscountOccurrences的连接中:这两个方法都遵守了契约,但前者的后置条件没有满足后者的前置条件,所以产生了bug。
  • bug存在于 splitIntoWords中:它的输入合法但是却抛出了异常
  • bug存在于 mostCommonWord的输入:即text未能满足这个方法的前置条件。

应该从哪一个假设开始呢?调试是一个搜索的过程,所以你可以使用二分查找来加速这个过程——先将数据流对半分开,例如假设bug存在于第一个方法和第二个方法的连接中,然后利用下面会提到方法(例如打印状态、断点、断言)来对假设进行试验。最后通过试验的结果判断bug存在于前半部分还是后半部分。

切片

上面 mostCommonWord() 的数据流就是一个切片(slicing)的例子。它意思是说找到程序中计算出特定值的那个片段(slice)。当你的程序报错时——即程序计算出了一个错误的值,对应的片段就是那些(帮助)计算出错误的值的代码。bug就存在于这个片段之中,也就是你的搜索范围。

对于切片操作有自动化工具,不过它们还不是很有效。但是程序员也会自然的进行切片——在脑海里——对bug可能存在或不可能存在的地方做出假设。这对于程序审查是很有用的技巧,我们接下来就对它加深一下理解。

这里有一个例子。假设x是一个整型局部变量,它的值不应该为负。但是在某一个时候调试的print语句输出了错误的结果:

int x = 0; // must be >= 0
...
System.out.println("x=" + x);  // prints a negative number

产生错误结果的片段会是哪一个呢?让我们对...部分做一下研究,找出合理的代码。

首先我们要找出直接对x赋值的语句:

int x = 0; // must be >= 0
...
    x += bonus;
...
System.out.println("x=" + x);  // prints a negative number

由于 bonus 会对x的结果产生影响,所以和它相关的代码也应该在片段之中:

int x = 0; // must be >= 0
final int bonus = getBonus();
...
    x += bonus;
...
System.out.println("x=" + x);  // prints a negative number

所以现在 getBonus() 也应该在片段之中,因为它负责计算 bonus

片段也应该包括能够影响已有片段的分支控制语句:

int x = 0;
final int bonus = getBonus();
...
  if (isWorthABonus(s)) {
    x += bonus;
  }
...
System.out.println("x=" + x);  // prints a negative number

if 语句控制了 x += bonus 是否会被执行,而这也让方法 isWorthABonus()成为了片段的一部分,而 s 又是该方法的参数,所以和s有关的语句也属于片段:

int x = 0;
final int bonus = getBonus();
...
for (final Sale s : salesList) {
  ...
  if (isWorthABonus(s)) {
    x += bonus;
  }
  ...
}
...
System.out.println("x=" + x);  // prints a negative number

for 不仅决定了s值,间接决定了 x += bonus是否会被执行,也影响了 x += bonus会被执行了次数。

现在,由于 for 语句使用到了 salesList,所以我们也应该将其包含到片段之中,我们发现 salesList是一个参数:

int calculateTotalBonus(final List<Sale> salesList) {
  ...
  int x = 0;
  final int bonus = getBonus();
  ...
  for (final Sale s : salesList) {
    ...
    if (isWorthABonus(s)) {
      x += bonus;
    }
    ...
  }
  ...
  System.out.println("x=" + x);  // prints a negative number
  ...
}

我们可以继续深入,分析 salesList 是如何生成并传入的,但是现在先停下来。我们已经找到了这个方法内计算x语句的片段(代码)。接下来要做的就是研究这个片段中的代码并提出有用的假设:

  • x+=bonus 赋值语句:可能是由于 bonus 为负数,所以 x+=bonus 最终的结果为负了。这个假设也间接指明了 getBonus() 返回了负的结果。
  • if 分支控制:可能 isWorthABonus() 返回太多次true,导致 x 的加法溢出,产生了负的结果。
  • for 循环语句:可能是这个循环的次数过多,最终导致 x 的加法溢出,产生了负的结果。
  • 方法的参数:可能 salesList传入了一个不好的值,里面有太多的“sales”。

通过小心的切片操作(阅读代码),我们成功分析出了哪一些代码是可能存在bug的,哪一些是不会对bug产生贡献的。例如上面的 ... 在查找bug时就可排除在外。

值得一提的是,我们的设计可以帮助(或者阻碍)我们进行切片。其中一个良好的设计就是使用不变性(immutability)。例如在上面对 bonus进行切片时,我们看到它的声明是final int bonus = getBonus(), 我们立即意识到这是一个不变索引指向的不变对象,所以我们也不用再寻找 bonus的代码片段了。这会大大节省我们的时间。不过,当我们看到 final Sale s时,虽然s的索引不可能改变,但是Sale是一个可变类型,所以我们依然要注意s的改造者的使用。

另一个良好的设计就是将作用域最小化。上面的例子中所有的变量都是局部变量,而且作用域都是最小的,所以我们的搜索范围也会跟着减少。相反,如果我们是用的实例成员,那么搜索范围将扩大到整个类,如果使用的是全局变量,那么搜索范围将扩大到整个程序。

阅读小练习

Slicing

在以下代码中,哪些行属于 tax 对应的切片片段?

double total = 0.0;
double tax = 0.0;
double taxRate = 0.06;
for (final Item item : items) {
  total += item.getPrice();
  if (isOutOfStateCustomer) {
    taxRate /= 2;
  }
  if (item.isTaxable()) {
    tax += item.getPrice() * taxRate;
  }
}
total += tax;
return total;
  • [ ] double total = 0.0;

  • [x] double tax = 0.0;

  • [x] double taxRate = 0.06;

  • [x] for (final Item item : items) {

  • [ ] total += item.getPrice();

  • [x] if (isOutOfStateCustomer) {

  • [ ] taxRate /= 2;

  • [x] if (item.isTaxable()) {

  • [x] tax += item.getPrice() * taxRate;

  • [ ] total += tax;

  • [ ] return total;

Slicing 2

在以下代码中,哪些行属于 a 对应的切片片段?

int[] incrementAll(int[] a) {
  int[] b = a;
  for (int i = 0; i < a.length; ++i) {
    ++b[i];
  }
  return b;
}
  • [x] int[] incrementAll(int[] a) {

  • [x] int[] b = a;

  • [x] for (int i = 0; i < a.length; ++i) {

  • [x] ++b[i];

  • [ ] return b;

译者注:这里注意别名

Delta(Δ)调试法

这种调试方法主要是用到了测试用例之间的区别,即如果两个相似的测试用例测试后有不同的结果,那么bug很可能就是由它们的差别部分导致的。例如 mostCommonWords("c c b")测试工作正常,但是 mostCommonWords("c c, b") 却失败了,那么问题很可能就出在c,c之间的差别上。

这种调试方法由于看重于成功与失败的差异,被称作 delta 调试 。delta调试也有自动化的工作,不过现在还没有广泛的应用。

假设的优先级

当你在对bug的位置和原因提出假设时,心里应该有一个大致的构想,哪一个区域的产生bug的可能性大,哪一个区域可能性小。例如,对于已经被良好测试过并长期使用过的模块,我们就会认为它出现bug的可能性很低。Java的编译器,JVM,操作系统,Java库设置硬件都应该比你写的代码更加可信(译者注:当然你也可能是Linus这样的天才...),因为它们都经过大量的调试和测试。在没有好的理由前,你不应该怀疑这些(底层)的模块和平台。

阅读小练习

Priorities

假设你正在调试 quadraticRoots 方法:

/**
 * Solves quadratic equation ax^2 + bx + c = 0.
 * 
 * @param a quadratic coefficient, requires a != 0
 * @param b linear coefficient
 * @param c constant term
 * @return a list of the real roots of the equation
 */
public static List<Double> quadraticRoots(int a, int b, int c) { ... }

将下面的行为做一个优先级排序,即你应该先进行什么假设:

ArrayList替换为 LinkedList. --> 4

在方法中嵌入一些 println() 语句打印出计算过程的中间值 --> 3

写出能够使bug复现的测试用例 --> 1

使用覆盖率工具检查是否有测试没有覆盖到的代码 --> 2


3. 进行试验

你提出的假设应该有前置条件,例如“我认为x在这个时刻有一个不合法的值”或者“我认为这一行代码永远不会被执行”。而你的试验应该去测试这个前置条件是否被满足。最好的试验应该像“探针(probe)”一样,在最小化对系统的影响下观察系统的状态。

一个常见的探针就是print语句。它的一个优点就是几乎能在所有的编程语言中实现。缺点在于你必须记住在试验完成后去掉这些print。要注意的是,不要在多个print中输出同样或者没有描述性的语句,例如在很多位置都仅仅输出hi!,你很可能就会不知道到底是哪一个位置在输出,与此相反, start of calculateTotalBonus这样的输出就很有意义,也很清楚。

另一种常用的探针是断言检查,它会测试变量的值或者对象的内部状态。在上面的例子中,x不允许为负数,我们就可以插入 assert(x >= 0); 语句。断言的优点在于你不需要自己去检查状态,而且断言不会在调试和测试完成后残留在程序中。它的缺点在于Java默认是关闭断言的,所以有时间你会发现断言检查总是通过,其实是它们没有被执行。我们在之前的阅读中谈到过断言相关的问题。

第三种探针是调试器(debugger)中的断点,它会使程序在特定的地方停下来,并允许你进行单步执行或检查此时程序的各种状态。调试器是一种很强大的工具,你应该花一些时间去学习它。

阅读小练习

Probes

下面是一个已经被调试过的程序,不过里面还残留了一些“探针”:

/**
 * Convert from one currency to another.
 * @param fromCurrency currency that customer has (e.g. DOLLAR)
 * @param fromValue value of fromCurrency that customer has (e.g. $145.23)
 * @param toCurrency currency that customer wants (e.g. EURO).  
 *                   Must be different from fromCurrency.
 * @return value of toCurrency that customer will get,
 *         after applying the conversion rate and bank fee
 */
public static double convertCurrency(Currency fromCurrency, double fromValue, Currency toCurrency) {
  assert(fromCurrency != null && toCurrency != null);
  assert(! fromCurrency.equals(toCurrency));

  double rate = getConversionRate(fromCurrency, toCurrency);
  System.out.println("conversion rate is " + rate);

  double fee = getFee();
  assert(fee == 0.01); // right now the bank charges 1%

  return fromValue * rate * (1-fee);
}

在提交(commit+push)代码之前,哪一些语句应该被移除?

  • [ ] assert(fromCurrency != null && toCurrency != null);

  • [ ] assert(! fromCurrency.equals(toCurrency));

  • [ ] double rate = getConversionRate(fromCurrency, toCurrency);

  • [x] System.out.println("conversion rate is " + rate);

  • [ ] double fee = getFee();

  • [x] assert(fee == 0.01); // right now the bank charges 1%

  • [ ] return fromValue * rate * (1-fee);

Using a debugger

在这个练习中,你需要使用到Eclipse或其他IDE。

创建一个新的Java类Hailstone.java:

import java.util.ArrayList;
import java.util.List;

public class Hailstone {
    public static List<Integer> hailstoneSequence(int n) {
        List<Integer> list = new ArrayList<Integer>();
        while (n != 1) {
            list.add(n);
            if (n % 2 == 0) {
                n = n / 2;
            } else {
                n = 3 * n + 1;
            }
        }
        list.add(n);
        return list;
    }

    public static void main(String[] args) {
        System.out.println("hailstoneSequence(5)=" + hailstoneSequence(5));
    }

}

在第8行 (list.add(n)) 设置断点,然后使用Run → Debug来运行调试器,程序应该在断点位置停下来,通过调试器检查相应的变量和程序状态回答以下问题:

现在列表中有几个元素?

0

现在使用单步执行 Step Over (Run → Step Over, 在工具栏上也有对应的按钮) 来执行第8行语句,现在列表中有几个元素?

1

现在继续单步执行直到(或者Run → Resume)再次遇到第8行 list.add(n) ,然后使用Run → Step Into,现在你所在的方法叫什么名字?

Integer.valueOf()

最后使用Step Return返回刚刚的调用位置,然后再次执行Step Into,现在你所在的方法叫什么名字?

ArrayList.add()

交换内容

如果你假设bug存在的模块是可以更换的,例如有不同的实现类,那么你可以试着将其更换为另一种接口相同的模块,观察bug是否依然存在,例如:

  • 如果你怀疑 binarySearch() 的实现,那么将其更换为一个更简单的 linearSearch()
  • 如果你怀疑是tjava.util.ArrayList的锅,将其换为 java.util.LinkedList
  • 如果你怀疑JVM(Java运行时),试着使用一个不同版本的Java
  • 如果你怀疑是操作系统的锅,换一个操作系统试试。
  • 如果你怀疑是硬件的锅,那么在另一台机器上试试

然而,你可能会在这种更换上浪费很多精力,正如前面所说,除非你有好的理由,不要首先怀疑这些经过大量测试或使用的模块和平台。

别急着修复

很多时候,程序员会试着在试验的过程中同时修复bug,而不仅仅是设置并观察探针。这中方法基本上都是错误的。首先,这会导致ad-hoc(译者注:指临时决定的)和猜想-测试编程。其次,你的修改通常仅仅“掩盖”了bug而不是修复了它——就好比你是在治疗症状而不是病理本身。

例如,如果你得到了 ArrayOutOfBoundsException异常,不要仅仅加上处理异常的语句(甚至忽略它),或者加上一个测试索引的语句。你应该弄清除异常发生的本质原因,已经它能否被完全避免。

阅读小练习

Premature Fixes

下面这段代码已经调试了好一会儿了:

/**
 * @return true if and only if word1 is an anagram of word2
 *         (i.e. a permutation of its characters)
 */
boolean isAnagram(String word1, String word2) {
  try {
    if (word1.equals("")) return word2.equals("");

    for (int i = 0; i < word1.length; ++i) {
      if (! word2.contains(word1.charAt(i))) return false;
    }

    if (! isAnagram(word2, word1)) return false;
    else if (word2.length() == word1.length()) return true;
    else return false;

  } catch (StackOverflowError e) { return true; }
}

以下六个选项中哪一些可能仅仅“掩盖”了bug而不是完全修复了它?

  • [x] if (word1.equals("")) return word2.equals("")
  • [ ] if (! word2.contains(word1.charAt(i))) return false;
  • [ ] if (! isAnagram(word2, word1)) return false;
  • [ ] else if (word2.length() == word1.length()) return true;
  • [ ] else return false;
  • [x] catch (StackOverflowError e) { return true; }

4. 重复之前步骤

在试验之后,思考并修改你的假设。如果你发现试验的结果和假设的前置条件相悖,那么就重新进行假设。如果符合前置条件,就重新设计假设,让它更有针对性,即能够将bug产生的位置范围进一步缩小。然后重复进行上述步骤。

要注意的是,确保你的源代码和目标文件是最新的。如果你的所有观察都显得不正常,一个可能的原因就是你正在运行的程序不是你现在的代码。这个时候需要删除所有编译好的文件然后重新编译(在Eclipse中是Project → Clean)。


修复bug

当你找到bug的位置并分析出它的本质原因后,接下来的步骤就是修复它。还是那句话,不要仅仅“掩盖”住bug,而是要问问自己这个bug到底是怎么产生的,它是一个代码拼写错误?还是参数设计错误,还是接口不一致导致的错误?

在修改bug时,也要考虑到bug本身是否和其他位置的代码或者位置的模块有关联,即修改代码会不会带来副作用。另外,也要想一想这种bug在别处是否存在(只是还没有出现)。

在修复完成后,记得在你的测试套件中添加上这个bug的测试用例(回归测试),然后重新进行测试,确保没有新的bug出现。


一些别的建议

寻求别人的帮助. 向别人解释你的设计通常都会帮助你理清思路,即使对方根本不知道你在说什么。这种方法被称为 小黄鸭调试法 或者泰迪熊调试法。即在计算机实验室里放一只巨大的泰迪熊,定下一条规则:当你试图告诉别人你的设计前,先“告诉”这只泰迪熊——令人惊讶的是,这只泰迪熊解决了很多问题。向别人称述你的代码设计将有助于你认识到问题所在。

The Stack Exchange rubber duck avatar featured on April 1, 2018

睡一觉. 如果你太累的话,调试会变得没有效率,毕竟磨刀不误砍柴工(Trade latency for efficiency)。


总结

在这篇阅读中,我们学习了如何系统的进行调试:

  • 构建测试用例复现bug,并将其添加到测试套件中
  • 使用科学的方法发现bug:
    • 调试提出假设
    • 利用探针(print、assert、debugger)来观察程序的行为并测试假设的前置条件是否满足
  • 彻底而非草率的修复bug

对于我们课程的三个目标,这篇阅读主要针对的是远离bug:我们试着剔除bug,并利用回归测试防止bug重新出现。

以上是关于麻省理工18年春软件构造课程阅读13“调试”的主要内容,如果未能解决你的问题,请参考以下文章

麻省理工18年春软件构造课程阅读15“相等”

麻省理工18年春软件构造课程阅读02“Java基础”

太原理工大学2021软件学院数据结构课程设计第二题(构造可以使n个城市连接的最小生成树)核心代码(2021.6.6)

2019年春第三次课程设计实验报告

WUT/武汉理工PTA-2021年春-MOOC-《C编程方法学》编程练习题解集

WUT/武汉理工PTA-2021年春-MOOC-《C编程方法学》编程练习题解集