通过DataFrame查询计数查询时如何获取整数值?
Posted
技术标签:
【中文标题】通过DataFrame查询计数查询时如何获取整数值?【英文标题】:how to get an integer value while querying a count query through DataFrame? 【发布时间】:2017-05-04 07:31:31 【问题描述】:我正在编写这段代码来获取指定表中count的整数值:
sc = SparkContext("local", "spar")
hive_context = HiveContext(sc)
hive_context.sql("use zs_trainings_trainings_db")
df = hive_context.sql("select count(*) from ldg_sales")
【问题讨论】:
【参考方案1】:要么:
hive_context.table("sales").count
或
hive_context.sql("select count(*) from ldg_sales").first()[0]
【讨论】:
【参考方案2】:将数据框转换为 rdd,以便您可以在其上运行 map 任务以提取行值,例如 -
df = hive_context.sql("select count(*) as cnt from ldg_sales")
count = df.rdd.map(lambda _ : _.cnt).collect()[0]
【讨论】:
以上是关于通过DataFrame查询计数查询时如何获取整数值?的主要内容,如果未能解决你的问题,请参考以下文章
如何使用 Q 对象在 django 模型中查询浮点/整数值或字符串?