通过DataFrame查询计数查询时如何获取整数值?

Posted

技术标签:

【中文标题】通过DataFrame查询计数查询时如何获取整数值?【英文标题】:how to get an integer value while querying a count query through DataFrame? 【发布时间】:2017-05-04 07:31:31 【问题描述】:

我正在编写这段代码来获取指定表中count的整数值:

sc = SparkContext("local", "spar")
hive_context = HiveContext(sc)
hive_context.sql("use zs_trainings_trainings_db")
df = hive_context.sql("select count(*) from ldg_sales")

【问题讨论】:

【参考方案1】:

要么:

hive_context.table("sales").count

hive_context.sql("select count(*) from ldg_sales").first()[0]

【讨论】:

【参考方案2】:

将数据框转换为 rdd,以便您可以在其上运行 map 任务以提取行值,例如 -

df = hive_context.sql("select count(*) as cnt from ldg_sales")
count = df.rdd.map(lambda _ : _.cnt).collect()[0]

【讨论】:

以上是关于通过DataFrame查询计数查询时如何获取整数值?的主要内容,如果未能解决你的问题,请参考以下文章

如何使用 Q 对象在 django 模型中查询浮点/整数值或字符串?

通过带有加法和减法计数器的视图控制器传递整数值[重复]

SQL查询按整数值分组

如何在 HighChart 的 yAxis 上仅显示整数值?

无法通过 Linq 查询获取多个表字段的计数

运行查询以从大查询中获取事件计数