以编程方式选择scala spark中的多个列[重复]

Posted

技术标签:

【中文标题】以编程方式选择scala spark中的多个列[重复]【英文标题】:Programatically selecting multiple columns in scala spark [duplicate] 【发布时间】:2016-03-17 01:39:08 【问题描述】:

我正在以编程方式尝试从字符串数组形成数据框

var columnNames = df.columns
var df2 = df.select(columnNames) // columnNames is a String[Array]

虽然这给了我错误。 有没有其他办法?

【问题讨论】:

我花了一些时间寻找这个问题的答案,我已经展示了我从哪里得到答案。这将简化与我类似的问题的搜索,因为原始问题很难找到。 【参考方案1】:

我从here得到了答案

var columnNames = df.columns
var df2 =df.select(columnNames.head, columnNames.tail: _*)

【讨论】:

以上是关于以编程方式选择scala spark中的多个列[重复]的主要内容,如果未能解决你的问题,请参考以下文章

Scala Spark-> 从 DataFrame 中选择前 15 列

QTableView 如何以编程方式选择多个列

使用 Scala 将列分配给 Spark Dataframe 中的另一列

Scala/Spark 选择列非常慢

Spark/Scala:对带有数组类型列的 DataFrame 中的某些组件的操作

使用 udf 以编程方式从数据框中选择列