在jupyter中访问数据框元素pyspark

Posted

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了在jupyter中访问数据框元素pyspark相关的知识,希望对你有一定的参考价值。

我是spark和pyspark的新手。我的DataFrame由几列组成,而在一些列中,则是数组或子数据帧。

df的printSchema在image below

我的问题是如何访问"role" the "member"等元素谢谢你的帮助

答案

您想要访问成员或其他cols吗?就这样做:

df.select("group_profile.group.id", 
          "group_profile.group.members",
          "group_profile.intro",
          "group_profile.link",
          "group_profile.role",
         )

以上是关于在jupyter中访问数据框元素pyspark的主要内容,如果未能解决你的问题,请参考以下文章

在 Jupyter 中将 PySpark 数据帧打印为格式化表

数据库的 Pyspark/jupyter 笔记本显示问题

PySpark:在 sql 中访问向量元素

如何在 jupyter 中像 pandas Dataframe 一样打印 Pyspark Dataframe

PySpark Jupyter 笔记本显示器

Pyspark 数据框:访问列(TypeError:列不可迭代)