如何阻止 pyspark 数据框更改为列表?

Posted

技术标签:

【中文标题】如何阻止 pyspark 数据框更改为列表?【英文标题】:How do I stop a pyspark dataframe from changing to a list? 【发布时间】:2020-09-17 03:35:09 【问题描述】:

我从一个 pyspark 数据帧开始,并在我使用 .take() 后转换为一个列表。如何将其保留为 pyspark 数据框?

    df1 = Ce_clean
    print(type(df1))
    df1 = df1.take(1000)
    print(type(df1))

【问题讨论】:

【参考方案1】:

您可以将RDD/list 转换为df 使用limit(n)

 df2 = spark.createDataFrame(df1.take(100))
 type(df2)
 <class 'pyspark.sql.dataframe.DataFrame'>

 df3 = df1.limit(100)
 type(df3)
 <class 'pyspark.sql.dataframe.DataFrame'>

【讨论】:

以上是关于如何阻止 pyspark 数据框更改为列表?的主要内容,如果未能解决你的问题,请参考以下文章

如何将 Code128 字体文本框更改为可读条形码? [关闭]

Django admin:将选定的相关字段框更改为自动完成

将列表框转换为 DataGridView

如何在pyspark中将月份名称更改为不同的语言 - 数据框

如何在 Pyspark 中将字符串更改为时间戳?

如何从 PySpark Dataframe 中删除重复项并将剩余列值更改为 null