无法使用 Redshift 目录查询的输出
Posted
技术标签:
【中文标题】无法使用 Redshift 目录查询的输出【英文标题】:Can't use the output of Redshift catalog queries 【发布时间】:2016-02-26 05:53:44 【问题描述】:我在处理针对 Redshift 目录表的查询时遇到各种问题。
为了说明,以下工作:
select "table_name"::text as "table"
from "information_schema"."tables"
where table_schema not like 'pg_%' and table_schema != 'information_schema'
以下作品:
create view works as
select "table_name"::text as "table"
from "information_schema"."tables"
where table_schema not like 'pg_%' and table_schema != 'information_schema'
但以下失败:
create table fails as
select "table_name"::text as "table"
from "information_schema"."tables"
where table_schema not like 'pg_%' and table_schema != 'information_schema'
与:
[SQL]create table fails as
select "table_name"::text as "table"
from "information_schema"."tables"
INFO: Function "has_table_privilege(oid,text)" not supported.
INFO: Function "has_table_privilege(oid,text)" not supported.
INFO: Function "has_table_privilege(oid,text)" not supported.
INFO: Function "has_table_privilege(oid,text)" not supported.
INFO: Function "has_table_privilege(oid,text)" not supported.
INFO: Function "has_table_privilege(oid,text)" not supported.
INFO: Function "has_table_privilege(oid,text)" not supported.
[Err] ERROR: Specified types or functions (one per INFO message) not supported on Redshift tables.
来自http://docs.aws.amazon.com/redshift/latest/dg/c_join_PG.html我读到
If you write a join query that explicitly or implicitly references a column that has an unsupported data type, the query returns an error.
这是否意味着在基于对目录表的选择(即使我将奇怪的字段类型转换为文本)的创建表中,Redshift 正在做连接和奇怪的事情,这意味着我不能这样做?
创建表是问题的一种表现。另一个是我无法卸载基于目录查询的视图或任何内容。例如。以下也将失败,并显示与上述类似的错误消息。
unload ('select * from "works"') to 's3://etc'
目前看来,我可以处理这些数据的唯一方法是从外部程序发出查询,然后让该外部程序将结果集手动写回到表中。即它不能从数据库中完成。
有人有其他解决方案吗?
【问题讨论】:
【参考方案1】:我遇到了类似的问题,不确定原因的详细信息,但找到了解决方法。
不要在 information_schema 中查找值,而是尝试在 pg_catalog 表中查找关系和属性名称。
例如,以下查询提供特定表的列名:
SELECT attname::text FROM pg_attribute WHERE attrelid = (SELECT oid FROM pg_class WHERE relname = '<your_table_name>') AND attname NOT IN ('insertxid', 'deletexid', 'oid', 'tableoid', 'xmin', 'cmin', 'xmax', 'cmax', 'ctid');
此查询可用于 CREATE TABLE 语句:
CREATE TABLE consumer_person_dated_attr_types AS
SELECT attname::text FROM pg_attribute
WHERE attrelid = (SELECT oid FROM pg_class
WHERE relname = '<your_table>') AND attname NOT IN ('oid', 'tableoid', 'xmin', 'cmin', 'xmax', 'cmax', 'ctid'
);
类似地,以下查询会创建一个表,其中一列用于表名,另一列用于模式名:
CREATE TABLE tmp_table_names AS
SELECT relname::text, nspname::text
FROM pg_class c
JOIN pg_namespace n
ON n.oid = c.relnamespace
WHERE nspname NOT IN ('pg_catalog', 'pg_toast', 'information_schema');
请注意,目录表提供的系统级详细信息比 information_schema 多得多。例如,每个表都有由上述查询返回的内部系统列,因此如果您只需要 DDL 中定义的列的列名,则需要排除内部system columns。除了那里列出的列之外,RedShift 从上述查询返回 deletexid 和 insertxid,因此也应该排除这些列。对表列表的查询也是如此(即返回许多系统模式)。
我怀疑这与列的数据类型有关。 information_schema 中许多列的数据类型是“sql_identifier”,JDBC 类型为“OTHER”(在 SQLWorkbenchJ 中查看时),而类似列的 pg_catalog 表的数据类型为“name”,JDBC 类型为“VARCHAR”。
【讨论】:
以上是关于无法使用 Redshift 目录查询的输出的主要内容,如果未能解决你的问题,请参考以下文章
Redshift 中的 CREATE SCHEMA 无法创建架构
无法将“json_extract_path_text”(Redshift)与 sqlalchemy 一起使用? [关闭]