使用 AWS Glue Scala 查询 Athena(添加分区)

Posted

技术标签:

【中文标题】使用 AWS Glue Scala 查询 Athena(添加分区)【英文标题】:Query Athena (Add Partition) using using AWS Glue Scala 【发布时间】:2019-04-08 08:22:21 【问题描述】:

是否有可能使用 Scala 从 Glue 脚本查询数据以 ALTER TABLE ADD PARTITION 在 Athena 的现有表中?

以及从 aws.athena.connections (OR) 扩展的可能库

使用 spark 查询要从(Glue 数据目录)添加的 Athena 表?

【问题讨论】:

【参考方案1】:

您可以通过make a call to Athena 查询ALTER TABLE ADD PARTITION 或add partition via Glue API。但是,Glue 应该已经为您提供了 AWS 开发工具包,因此您可以使用适当的 Athena 或 Glue 客户端类。

如果您的作业在自定义 VPC 中运行,请确保可以访问 AWS 服务。

【讨论】:

以上是关于使用 AWS Glue Scala 查询 Athena(添加分区)的主要内容,如果未能解决你的问题,请参考以下文章

使用 Glue 连接和 spark scala 覆盖 Mysql 表

AWS Glue 开发终端节点无法正常工作

如何查询数组字段(AWS Glue)?

如何使用带有 PySpark 的 WHERE 子句在 AWS Glue 中查询 JDBC 数据库?

何时通过 AWS Glue ETL 使用 Amazon Redshift 频谱来查询 Amazon S3 数据

无法对 AWS Glue 作业脚本中的两个表进行连接和查询