为啥我不应该在 Impala 中的“COMPUTE STATS”和“COMPUTE INCREMENTAL STATS”之间切换?

Posted

技术标签:

【中文标题】为啥我不应该在 Impala 中的“COMPUTE STATS”和“COMPUTE INCREMENTAL STATS”之间切换?【英文标题】:Why shouldn't I switch between "COMPUTE STATS" and "COMPUTE INCREMENTAL STATS" in Impala?为什么我不应该在 Impala 中的“COMPUTE STATS”和“COMPUTE INCREMENTAL STATS”之间切换? 【发布时间】:2020-05-26 06:13:54 【问题描述】:

根据 Cloudera 文档,我不应该在表的生命周期内切换这些类型的计算统计信息。有人可以解释为什么吗?我相信统计数据在切换后计算得很好。

我发现此建议的文档链接:https://docs.cloudera.com/documentation/enterprise/5-16-x/topics/impala_perf_stats.html#perf_stats_examples

【问题讨论】:

【参考方案1】:

它们表现为两种不同的模式——如果你从一种模式切换到另一种模式,它将丢弃另一种模式的所有状态。例如。如果您在 COMPUTE INCREMENTAL STATS 之后运行 COMPUTE STATS,则所有增量统计信息都将被丢弃。

所以没有什么不好的事情发生,只是它没有做任何聪明的事情。

【讨论】:

以上是关于为啥我不应该在 Impala 中的“COMPUTE STATS”和“COMPUTE INCREMENTAL STATS”之间切换?的主要内容,如果未能解决你的问题,请参考以下文章

Impala--查询优化COMPUTE STATS指令

IMPALA常用命令COMPUTE STATS简述

为啥 Impala 表定义不复制?

为啥我不应该使用 catch() 来处理 React useEffect API 调用中的错误?

如果在 impala statestore 关闭时执行 DDL,为啥 Impala 查询会失败?

为啥 Cloudera 的 Impala 还在“孵化”?