为什么过滤器在spark数据帧上默认删除空值？

Question

包含filter值的基本scala集合上的null具有以下（并且非常直观）行为：

scala> List("a", "b", null).filter(_ != "a")
res0: List[String] = List(b, null)

但是，我很惊讶地发现以下过滤器删除了spark数据帧中的空值：

scala> val df = List(("a", null), ( "c", "d")).toDF("A", "B")
scala> df.show
+---+----+
|  A|   B|
+---+----+
|  a|null|
|  c|   d|
+---+----+
scala> df.filter('B =!= "d").show
+---+---+
|  A|  B|
+---+---+
+---+---+

如果我想保持null值，我应该补充

df.filter('B =!= "d" || 'B.isNull).show
+---+----+
|  A|   B|
+---+----+
|  a|null|
+---+----+

就个人而言，我认为默认情况下删除空值非常容易出错。为什么选择这个？为什么在api文档中没有明确说明？我错过了什么吗？