使用胶水数据目录中定义的外部表红移光谱

Posted

技术标签:

【中文标题】使用胶水数据目录中定义的外部表红移光谱【英文标题】:Use external table redshift spectrum defined in glue data catalog 【发布时间】:2018-06-19 06:28:00 【问题描述】:

我在 Glue 数据目录中定义了一个表,我可以使用 Athena 进行查询。由于表中有一些数据我想与其他 Redshift 表一起使用,我可以访问 Glue 数据目录中定义的表吗?

什么是创建外部表查询来引用 Glue 目录中的表定义?

【问题讨论】:

【参考方案1】:

来自 AWS (Creating External Schemas),

create external schema athena_schema from data catalog 
database 'sampledb' 
iam_role 'arn:aws:iam::123456789012:role/MySpectrumRole' 
region 'us-east-2';

这会创建一个架构 athena_schema,它指向 Athena / Glue 中的 sampledb 数据库。

您需要为您指定的 IAM 角色授予适当的访问权限:Redshift 集群需要能够代入该角色,并且该角色需要访问 Glue。

【讨论】:

以上是关于使用胶水数据目录中定义的外部表红移光谱的主要内容,如果未能解决你的问题,请参考以下文章

如何在红移光谱中创建一个外部表,其中文件位置每天都会改变?

无法在红移光谱外部模式中创建视图

我使用红移光谱查询 S3 数据,但遇到保留字冲突问题

如何为频谱表定义排序键

显示所有表的所有红移外部模式。如何限制外部模式中外部表的可见性?

在 athena 上工作时,数据在 redshift 外部表上显示为空