数据框不会打印

Posted

技术标签:

【中文标题】数据框不会打印【英文标题】:Dataframe Won't Print 【发布时间】:2021-09-23 02:59:48 【问题描述】:
import pyspark.sql.functions as f

df_ssaGenderWithinTenPercent = df_ssaGender.select("name", "women", "men", "total", "gender", "gender_ratio", \
f.when((df_ssaGender.gender_ratio >.45) & (df_ssaGender.gender_ratio < .55) & (df_ssaGender.gender_ratio >= 10000)).orderBy("gender", "gender_ratio", ascending = False)
df_ssaGenderWithinTenPercent.show()

所以我之前创建了一个名为 df_ssaGender 的数据框,并正在选择这些列。我需要获取 gender_ratio 介于 45% 和 55% 之间的数据。但是,每当我运行它时,我都会不断收到此语法错误,并且我很确定代码是正确的。有什么想法吗?


【问题讨论】:

【参考方案1】:

通过分解你的代码,我发现了 2 个你遗漏的地方

df_ssaGenderWithinTenPercent = (df_ssaGender
  .select(
    "name",
    "women",
    "men",
    "total",
    "gender",
    "gender_ratio",
    f.when(
      (df_ssaGender.gender_ratio >.45) &
      (df_ssaGender.gender_ratio < .55) &
      (df_ssaGender.gender_ratio >= 10000) # you're also missing a retrun value here
    )
  ) # you were missing this
  .orderBy("gender", "gender_ratio", ascending = False)
)
df_ssaGenderWithinTenPercent.show()

【讨论】:

以上是关于数据框不会打印的主要内容,如果未能解决你的问题,请参考以下文章

打印数据框时不打印NA

漂亮地打印熊猫数据框

有没有办法像 Pyspark 显示数据框一样打印 Pandas 数据框?

打印数据框中不同的列名

jupyter 按顺序打印绘图和数据框,for循环

蟒蛇 3 |动态创建数据框后如何按名称打印数据框?