具有两个不同名称的数据框列

Posted

技术标签:

【中文标题】具有两个不同名称的数据框列【英文标题】:Dataframe column with two different names 【发布时间】:2017-01-01 00:09:31 【问题描述】:

我想知道一个 spark 数据框是否可以对一个列有两个不同的名称。

我知道通过使用“withColumn”可以添加新列,但我不想向数据框中添加新列,但我只想为数据框中的现有列设置别名。

例如如果有一个包含 3 列“Col1, Col2, Col3”的数据框。

那么任何人都可以告诉我是否可以给 Col3 起一个别名,以便我也可以检索名为“Col4”的“Col3”的数据。

【问题讨论】:

为什么?这个感觉可能是X/Y场景mywiki.wooledge.org/XyProblem 【参考方案1】:

编辑:可能重复:Usage of spark DataFrame "as" method

根据您使用的 spark 库和客户端库,看起来有几种方法。

【讨论】:

以上是关于具有两个不同名称的数据框列的主要内容,如果未能解决你的问题,请参考以下文章

查找两个不同数据框列之间的部分匹配,并在找到匹配时分配值

将字典列表的 Python 数据框列转换为具有单个元素的列

mysql workbench 迁移具有两个不同名称的数据库

从 Spark 数据框列中 ArrayType 类型的行中获取不同的元素

如何比较具有不同名称引用但具有相同实际数据的两个列表

处理具有混合日期格式的 Pandas 数据框列