数据框不会打印
Posted
技术标签:
【中文标题】数据框不会打印【英文标题】:Dataframe Won't Print 【发布时间】:2021-09-23 02:59:48 【问题描述】:import pyspark.sql.functions as f
df_ssaGenderWithinTenPercent = df_ssaGender.select("name", "women", "men", "total", "gender", "gender_ratio", \
f.when((df_ssaGender.gender_ratio >.45) & (df_ssaGender.gender_ratio < .55) & (df_ssaGender.gender_ratio >= 10000)).orderBy("gender", "gender_ratio", ascending = False)
df_ssaGenderWithinTenPercent.show()
所以我之前创建了一个名为 df_ssaGender 的数据框,并正在选择这些列。我需要获取 gender_ratio 介于 45% 和 55% 之间的数据。但是,每当我运行它时,我都会不断收到此语法错误,并且我很确定代码是正确的。有什么想法吗?
【问题讨论】:
【参考方案1】:通过分解你的代码,我发现了 2 个你遗漏的地方
df_ssaGenderWithinTenPercent = (df_ssaGender
.select(
"name",
"women",
"men",
"total",
"gender",
"gender_ratio",
f.when(
(df_ssaGender.gender_ratio >.45) &
(df_ssaGender.gender_ratio < .55) &
(df_ssaGender.gender_ratio >= 10000) # you're also missing a retrun value here
)
) # you were missing this
.orderBy("gender", "gender_ratio", ascending = False)
)
df_ssaGenderWithinTenPercent.show()
【讨论】:
以上是关于数据框不会打印的主要内容,如果未能解决你的问题,请参考以下文章