从 PySpark 中的选定列和行中提取值

Posted

技术标签:

【中文标题】从 PySpark 中的选定列和行中提取值【英文标题】:Extract values from selected columns and rows in PySpark 【发布时间】:2020-08-18 20:26:52 【问题描述】:

火花 3.0

我想将选定列中的特定值提取到从 spark DF 到我的 juypter 子窗口的打印函数中。 我将做一个 for 循环,这样我就可以自动化每月的文件。

举个例子,print('A 公司一名男性作为 IT 的平均工资是 26000')。

例如,我尝试了 x['company'][0][0],但没有得到所需的值。

【问题讨论】:

【参考方案1】:

这可能就是你要找的。​​p>

df.select('company').collect()[0][0]

【讨论】:

以上是关于从 PySpark 中的选定列和行中提取值的主要内容,如果未能解决你的问题,请参考以下文章

SQL查询以查找列和行中的最大值

熊猫数据框列和行中的拆分列表

pyspark:删除所有行中具有相同值的列

如何根据列和行中提供的条件查找表格单元格值?

如何在 Flutter 中将列和行项居中?

Pandas:DataFrame数据的更改插入新增的列和行