Vertica 中解释查询的成本

Posted

技术标签:

【中文标题】Vertica 中解释查询的成本【英文标题】:Costs in explain queries in Vertica 【发布时间】:2016-10-11 07:55:51 【问题描述】:

我可以问一下解释输出中的确切成本是多少?它们是从多个指标(如 IO、RAM 等)组合、求和(或其他),还是它们是一个特定指标?

例如+-SELECT LIMIT 10 [成本:282K,行:10]

谢谢 马丁

【问题讨论】:

【参考方案1】:

实际上是documented here,虽然可能不如你想的那么准确。

查询优化器根据成本估算选择查询计划。这 查询优化器使用来自多个来源的信息来开发 潜在计划并确定其相对成本。其中包括:

表格行数 列统计信息,包括:不同值的数量(基数)、最小值/最大值、值的分布以及 磁盘空间使用情况 可能需要最少 I/O 操作以及最低 CPU、内存和网络使用率的访问路径 可用的符合条件的预测 联接选项:联接类型(合并与散列联接)、联接顺序 查询谓词跨集群节点的数据分段

【讨论】:

感谢您的回复 :) 我已经阅读了此内容,是的,我想了解有关费用的更准确信息。

以上是关于Vertica 中解释查询的成本的主要内容,如果未能解决你的问题,请参考以下文章

.Net 核心支持查询 Vertica

从 PySpark 查询日期之间的 Vertica

Vertica的这些事(十六)——Vertica如何建表

从 vertica 导入 sqoop 失败

无法从 Spark 显示 Vertica 表

Vertica - 按降序排列的投影