在 spark scala 中对数据框的每一列进行排序

Posted

技术标签:

【中文标题】在 spark scala 中对数据框的每一列进行排序【英文标题】:Sort every column of a dataframe in spark scala 【发布时间】:2022-01-04 15:05:47 【问题描述】:

我在 Spark 和 Scala 工作,并且有一个包含数百列的数据框。我想按每一列对数据框进行排序。无论如何在 Scala/Spark 中可以做到这一点?

我试过了:

val sortedDf = actualDF.sort(actualDF.columns)

但是.sort 不支持Array[String] 输入。

之前有人问过这个问题:Sort all columns of a dataframe 但没有 Scala 答案

【问题讨论】:

试试actualDF.sort(actualDF.columns.map(col): _*) 【参考方案1】:

感谢@blackbishop 对此的回答:

val dfSortedByAllItsColumns = actualDF.sort(actualDF.columns.map(col): _*)

【讨论】:

以上是关于在 spark scala 中对数据框的每一列进行排序的主要内容,如果未能解决你的问题,请参考以下文章

如何在 Python 中对我的 Dataframe 的每一列进行 ADF 测试?

在没有数据重复的情况下爆炸数据框的每一列

如何在循环中将不同大小的列表附加到空熊猫数据框的每一列?

如何将一个熊猫数据框的一列与另一个数据框的每一列相加?

将函数应用于熊猫中数据框的每一列

如何为熊猫数据框的每一列应用具有不同时间常数的一阶过滤器?