在 Redshift 中查找常用连接查询

Posted

技术标签:

【中文标题】在 Redshift 中查找常用连接查询【英文标题】:Find commonly joined queries in Redshift 【发布时间】:2016-03-01 04:42:55 【问题描述】:

我想获取 Redshift 中最常连接的表的列表。理想情况下具有连接条件。原因:我们正在添加 sortkeys 和 distkeys,并尝试相对彻底(旁注:如果您有任何关于优化查询运行时的好技巧,我很想听听)。

我知道我可以查询 STL_QUERY 以获取查询文本、运行时等。但是除了进行一些手动文本分析之外,还有什么方法可以查看哪些表是按查询 ID 合并的?

【问题讨论】:

【参考方案1】:

据我所知,redshift 中没有“STL”表,可以很容易地给出这些信息。正如您所提到的,您需要查看STL_QUERYTXT 表中的所有查询并搜索连接。

关于一般性能调优建议,如果你还没有的话,我建议你看看 persicope 的blog。还有this。

【讨论】:

以上是关于在 Redshift 中查找常用连接查询的主要内容,如果未能解决你的问题,请参考以下文章

在 Redshift 中检查用户的“连接限制”

多连接查询上的 Redshift 磁盘已满

我可以在 Redshift 上的存储过程中将两个查询连接在一起吗?

如何在没有连接的情况下为 postgres (Redshift) 生成 SQL 查询?

Redshift:连接到由表中的 SELECT * 组成的子查询/CTE 相当于连接表本身,还是性能下降?

使用 Django 在 Heroku 上的 Redshift 连接