在 Zeppelin 中保存 AWS Athena 查询的结果

Posted

技术标签:

【中文标题】在 Zeppelin 中保存 AWS Athena 查询的结果【英文标题】:Save results from AWS Athena query in Zeppelin 【发布时间】:2018-12-17 13:15:45 【问题描述】:

我可以通过我的 Zeppelin 笔记本在 Athena 上成功执行查询,但是我不明白如何保存结果集。

以下代码显示一个表格

%athena
select * from table_name limit 5; 

我的目标是将结果保存到 pandas 数据框中,以便将来进行转换。

我可以将其保存为 CSV 并手动导入,但这似乎效率不高。

我正在使用 Zeppelin 0.8.0 和 AthenaJDBC42-2.0.2.jar

【问题讨论】:

【参考方案1】:

我发现使用 athena 进行实验和使用 spark 执行的最佳方式。 所以基本上:

%spark.pyspark
df = pd.read_sql("select * from table_name limit 5", conn)

【讨论】:

以上是关于在 Zeppelin 中保存 AWS Athena 查询的结果的主要内容,如果未能解决你的问题,请参考以下文章

Apache Zeppelin 与 Athena 使用 jdbc 解释器处理会话令牌

AWS Athena 分析日志

aws glue / pyspark - 如何使用 Glue 以编程方式创建 Athena 表

如何:Zeppelin + boto3 + AWS 凭证

在 athena aws 中具有不同分区的表

如何在 AWS Athena 中转换时区