DataProc Presto 会自动拾取新节点吗?
Posted
技术标签:
【中文标题】DataProc Presto 会自动拾取新节点吗?【英文标题】:Will DataProc Presto pick up new nodes automatically? 【发布时间】:2019-09-27 18:31:11 【问题描述】:我有一个装有 10 个节点和 Presto 的 DataProc 集群。集群的Autoscaling功能开启。我想知道当 Presto 运行并且集群扩展时,Presto 是否能够自动拾取和使用额外的节点?我没有从 Google 的文档中找到答案。
我担心的是我需要手动重启 Presto,这违背了自动缩放的目的。我希望集群和自动缩放在 presto 时获得更大的工作。
【问题讨论】:
Presto 可以在运行时添加节点(在某些情况下添加到现有查询中),所以我希望它能够工作。我只是尝试一下,看看会发生什么。 【参考方案1】:随着集群的扩展,Presto 会自动选择新节点。
但是,请注意,Dataproc 自动扩缩当前仅支持基于 YARN 指标的扩缩(请参阅docs)。您的集群不会根据 Presto 查询负载自动扩展,而是根据 YARN 上的负载。
【讨论】:
以上是关于DataProc Presto 会自动拾取新节点吗?的主要内容,如果未能解决你的问题,请参考以下文章
带有presto的GCP dataproc - 有没有办法使用pyhive通过python远程运行查询?
GCP Dataproc 节点中没有资源来启动新的 SparkSession
如何在 Dataproc 集群启动时自动安装 Python 库?