spark数据帧分组不计算空值

Question

我有一个spark DataFrame，它按聚合计数的列分组：

df.groupBy('a').agg(count("a")).show

+---------+----------------+
|a        |count(a)        |
+---------+----------------+
|     null|               0|
|      -90|           45684|
+---------+----------------+


df.select('a').filter('aisNull').count

回报

warning: there was one feature warning; re-run with -feature for details
res9: Long = 26834

这清楚地表明最初没有计算空值。

这种行为的原因是什么？我希望（如果nullat全部包含在分组结果中）以正确查看计数。

Answer 1

另一答案