从 PySpark 中的选定列和行中提取值
Posted
技术标签:
【中文标题】从 PySpark 中的选定列和行中提取值【英文标题】:Extract values from selected columns and rows in PySpark 【发布时间】:2020-08-18 20:26:52 【问题描述】:火花 3.0
我想将选定列中的特定值提取到从 spark DF 到我的 juypter 子窗口的打印函数中。 我将做一个 for 循环,这样我就可以自动化每月的文件。
举个例子,print('A 公司一名男性作为 IT 的平均工资是 26000')。
例如,我尝试了 x['company'][0][0],但没有得到所需的值。
【问题讨论】:
【参考方案1】:这可能就是你要找的。p>
df.select('company').collect()[0][0]
【讨论】:
以上是关于从 PySpark 中的选定列和行中提取值的主要内容,如果未能解决你的问题,请参考以下文章