在jupyter中访问数据框元素pyspark
Posted
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了在jupyter中访问数据框元素pyspark相关的知识,希望对你有一定的参考价值。
我是spark和pyspark的新手。我的DataFrame由几列组成,而在一些列中,则是数组或子数据帧。
df的printSchema在image below中
我的问题是如何访问"role" the "member"等元素谢谢你的帮助
答案
您想要访问成员或其他cols吗?就这样做:
df.select("group_profile.group.id",
"group_profile.group.members",
"group_profile.intro",
"group_profile.link",
"group_profile.role",
)
以上是关于在jupyter中访问数据框元素pyspark的主要内容,如果未能解决你的问题,请参考以下文章
在 Jupyter 中将 PySpark 数据帧打印为格式化表