Amazon Redshift:查找和修复倾斜的 DISTKEY

Posted

技术标签:

【中文标题】Amazon Redshift:查找和修复倾斜的 DISTKEY【英文标题】:Amazon Redshift: Finding and fixing a skewed DISTKEY 【发布时间】:2015-03-27 11:01:17 【问题描述】:

从我的 Redshift 集群性能面板中,我可以看到其中一个节点的数据量大约是其他节点的两倍,这也导致 CPU 利用率显着提高。数据库中有几十个使用基于键的分布的大表,我无法找到哪些没有正确平衡。

在文档中搜索,我看到SVV_TABLE_INFO 视图有一个名为skew_rows 的列。是我要找的号码吗?

【问题讨论】:

【参考方案1】:

我认为本文中的“pct_skew_across_slices”正是您想要的。

http://docs.aws.amazon.com/redshift/latest/dg/c_analyzing-table-design.html

【讨论】:

以上是关于Amazon Redshift:查找和修复倾斜的 DISTKEY的主要内容,如果未能解决你的问题,请参考以下文章

删除由 Amazon Redshift 创建的临时表

如何使用 Pentaho 处理 Amazon Redshift 中缓慢变化的维度?

等效于 Amazon Redshift 中的 T-SQL 表值构造函数?

同时对 Amazon Redshift 和本地源运行查询

Java 连接到 Amazon Redshift

Amazon EMR 与 Amazon Redshift